retrieval (2) 썸네일형 리스트형 RAG의 핵심, Retrieval 기술로 검색 성능 극대화하기! Retrieval: RAG의 성능을 좌우하는 핵심 단계RAG(Retrieval-Augmented Generation)는 LLM(Large Language Model)의 능력을 확장하고 보완하는 기술로, LLM이 보다 정확하고 풍부한 정보를 제공할 수 있도록 도와줍니다. 그중에서도 Retrieval 단계는 사용자의 쿼리에 맞는 적절한 정보를 찾아내는 중요한 역할을 담당합니다. 이 글에서는 Retrieval 단계의 핵심 기술인 Hybrid Search, Hypothetical Question, **HyDE(Hypothetical Document Embeddings)**에 대해 살펴보겠습니다. 각각의 기술이 어떤 원리로 동작하며, 언제 효과적인지 알아볼까요?1. Hybrid Search: 시맨틱과 키워드 검색.. Advanced RAG의 등장과 Naive RAG의 한계: 왜 우리는 더 나은 솔루션을 필요로 하는가? Retrieval-Augmented Generation (RAG)은 언어 모델의 성능을 크게 향상시킬 수 있는 기술로, 최근 AI 연구와 응용에서 중요한 위치를 차지하고 있습니다. RAG의 출현은 단순히 데이터를 학습하는 언어 모델을 넘어, 방대한 외부 지식 데이터베이스와 결합하여 필요한 정보를 실시간으로 검색하고, 이를 바탕으로 보다 정확한 답변을 생성하는 능력을 제공하려는 시도에서 비롯되었습니다. 특히 의료, 법률 등 높은 정확성과 신뢰성이 요구되는 분야에서 RAG는 필수적인 기술로 자리 잡고 있습니다.그러나 Naive RAG에는 여러 한계가 존재합니다. 기본적인 RAG 시스템에서는 단순한 검색과 생성의 반복으로 인해 불필요한 데이터 중복과 노이즈가 발생할 수 있습니다. 특히, 의미론적 유사성을 고려.. 이전 1 다음