1️⃣QueryEngine

https://docs.llamaindex.ai/en/stable/module_guides/deploying/query_engine/

QueryEngine은 데이터에 대해 질문할 수 있는 일반적인 인터페이스입니다.쿼리 엔진은 자연어 쿼리를 받아 풍부한 응답을 반환합니다. 쿼리 엔진은 대부분 검색기를 통해 하나 또는 여러 개의 인덱스를 기반으로 구축됩니다여러 개의 쿼리 엔진을 구성하여 고급 기능을 구현할 수 있습니다.

기본 사용 예시는 아래와 같습니다.

query_engine = index.as_query_engine()
response = query_engine.query("Who is Paul Graham.")

Response 응답의 steaming 설정:

query_engine = index.as_query_engine(streaming=True) streaming_response = query_engine.query("Who is Paul Graham.") streaming_response.print_response_stream()

LlmaIndex의 QueryEngine에서 Advanced 방법론인 RouterQueryEngineSub-Qenstion Query Engine의 사례를 알아보겠습니다.


SubQuestionQueryEngine

SubQuestionQueryEngine은 주로 둘 이상의 데이터 원본이 제공되는 복잡한 쿼리를 처리하도록 설계되었으며, 특정 카테고리를 비교하고 대조하는 쿼리가 트리거되는 경우가 많습니다.

SubQuestionQueryEngine은 데이터 원본에 대한 설명이 주어진 하위 질문을 생성합니다. 그런 다음 선택한 데이터 원본에 대해 하위 질문을 실행하고 하위 응답을 수집한 후 최종 답변을 합성합니다.

Step 1: Setup Environments

Step 2: Download Data

2021년 및 2022년 재무 보고서 요약본을 fiscal.treasury.gov 웹사이트에서 다운로드하여 'report' 디렉터리에 저장합니다.

Step 3: Load data & define `SubQuestionQueryEngin``

Step 4: Execute Queries

2021년의 국방 예산은 명시적으로 언급되지 않았습니다. 그러나 2022년의 국방 예산은 근본적으로 가정의 변화와 기타 요인들로 인해 국방부의 순 비용이 5684억 달러 증가했습니다. 이 증가는 가정의 변화로 인한 4442억 달러의 손실 증가와 함께 군사 작전, 전투 준비, 지원, 조달, 인력, 연구 및 개발과 관련된 추가 비용에 기인합니다.

2021년의 총 부채는 100%이며, 2022년의 총 부채는 $39.0 트리리언입니다.

2021년에는 총 정부 세금 및 기타 수입이 약 4.3조 달러로 증가했고, 주로 소득세 수입의 증가와 환급액의 증가로 이루어졌습니다. 개인 소득세, 세금 공제, 법인세가 총 세금 및 기타 수입의 약 87.7%를 차지했습니다. 반면, 2022년에는 총 정부 세금 및 기타 수입이 약 4.9조 달러로 증가했고, 주로 개인 소득세 수입과 세금 공제의 증가로 이루어졌습니다.

For the year 2021, individual income tax collections were about $4.3 trillion, while withholding tax amounted to $4.3 trillion as well. Corporate income tax for 2021 was $1.2 trillion, and other revenues totaled $4.3 trillion. Moving to 2022, individual income tax collections increased to contribute to total government tax and other revenues reaching about $4.9 trillion. However, specific details on withholding tax amounts for 2022 were not provided. Corporate income tax for 2022 was not explicitly mentioned. Other revenues for 2022 amounted to $670.0 billion.


RouterQueryEngine

Private 데이터에 대한 LLM 기반 쿼리에는 여러 가지 기술이 있습니다. 몇 가지 예를 들어보겠습니다:

  • 요약(Summarization)

  • 상위 k 시맨틱 검색(Top-k semantic search)

  • 비교 및 대조와 같은 복잡한 쿼리(Complex queries such as compare and contrast)

라우터 쿼리 엔진은 쿼리를 여러 쿼리 엔진으로 라우팅하는 하나의 단일 인터페이스입니다. 여러 후보 쿼리 엔진 중 하나를 선택하여 쿼리를 실행합니다.

Step 1: Install and Setup

Step 2: Load data & define RouterQueryEngine

Step 3: Execute Queries

DevOps 셀프 서비스 중심 파이프라인 보안 및 가드레일은 파이프라인 보안을 강화하고 안전을 보장하기 위한 중요한 구현 요소로, Harden-Runner와 Infracost와 같은 도구들을 활용하여 악의적인 패턴을 감지하고 예방하며 클라우드 비용을 사전에 파악하여 비정상적인 비용을 방지합니다. 이러한 조치는 루트 사용자의 활동을 모니터링하고 보안을 강화하며, 인프라스트럭처 코드를 분석하여 구성 오류를 식별하는 도구들을 포함하여 파이프라인의 안전성과 비용 관리를 강화합니다.

Infracost를 사용하여 클라우드 비용을 관리할 수 있습니다. Infracost는 DevOps, SRE 및 엔지니어들이 비용을 분석하고 변경하기 전에 비용을 이해할 수 있도록 도와주는 도구로, 비정상적인 클라우드 비용 추정치를 감지하여 팀에 안전장치를 제공합니다.

하든 러너는 Terraform 코드의 보안을 강화하고 취약점을 식별하는 데 사용되며, 인프라코스트는 클라우드 리소스의 비용을 추정하고 비교하는 데 사용됩니다. 따라서 보안 감사 및 취약점 식별이 필요한 경우 하든 러너를 사용하고, 비용 추정 및 비교가 필요한 경우 인프라코스트를 사용해야 합니다.

Last updated