오픈 소스 임베딩 모델, 무엇이 최적인가? RAG를 위한 평가 워크플로우 완전 정복
성능과 프라이버시, 둘 다 잡고 싶다면RAG 기반 애플리케이션을 구축하고 있다면, 임베딩 모델 선택이 얼마나 중요한지 이미 알고 있을 것이다. 대부분은 OpenAI의 text-embedding-3-small이나 text-embedding-3-large 같은 고성능 모델을 떠올리겠지만, 여기에 따르는 비용과 API 종속성, 데이터 프라이버시 이슈가 걸림돌이 된다.그렇다고 오픈 소스 임베딩 모델을 쓰자니, 어떤 모델이 좋은지, 어떻게 비교해야 하는지, 로컬에서 실행은 가능한지 혼란스럽기만 하다. 이 글에서는 로컬에서 오픈 소스 임베딩 모델을 비교 평가하는 워크플로우를 소개한다. 단순히 모델 리스트를 나열하는 것이 아니라, 실제 데이터셋을 기반으로 평가하고, 성능을 수치로 비교한다. 비용 없이, 코드 한 줄로..