본문 바로가기

인공지능

성능까지 잡은 빠르고 저렴한 임베딩 모델 voyage-3 시리즈 완전 정복

728x90
반응형

성능도, 비용도 만족스럽지 않다면 주목해야 할 모델

AI 기반 검색 시스템을 구축하거나 벡터 데이터베이스를 사용하고 있다면, 아마 이런 고민을 해본 적이 있을 겁니다.
“임베딩 성능은 괜찮은데 비용이 너무 크다”,
“빠른 응답 속도를 원하지만, 모델이 너무 무겁다.”

이런 문제를 해결하기 위해 수많은 개발자들이 대안을 찾고 있지만, 대부분은 성능을 포기하거나 비용을 감수해야 했습니다. 그런데 이제 그럴 필요가 없습니다. Voyage AI가 새롭게 출시한 voyage-3와 voyage-3-lite는 뛰어난 검색 품질과 낮은 비용을 동시에 제공합니다. 특히 OpenAI v3 모델 대비 높은 정확도와 획기적인 비용 절감 효과를 입증하면서 주목받고 있습니다.

이 글에서는 voyage-3 시리즈가 어떤 모델인지, 기존 임베딩 모델과 어떤 차별점이 있는지, 그리고 실무에서 어떻게 적용할 수 있는지를 자세히 설명합니다.

반응형

1. voyage-3와 voyage-3-lite란?

voyage-3 시리즈는 Voyage AI가 새롭게 공개한 범용 임베딩 모델입니다.
이전 voyage-2 시리즈가 도메인 특화 모델 중심이었다면, voyage-3는 다양한 분야에서 높은 성능을 제공하는 범용 모델로 설계되었습니다.

두 가지 모델이 있습니다.

  • voyage-3: 고성능 검색을 위한 모델
  • voyage-3-lite: 저지연, 저비용에 최적화된 경량 모델

두 모델 모두 최대 32K 토큰 컨텍스트 길이를 지원하며, 낮은 임베딩 차원을 통해 저장 비용까지 절감할 수 있습니다.


2. OpenAI v3 모델과의 비교: 왜 주목해야 할까?

Voyage는 voyage-3 시리즈를 출시하며 기존 모델과의 성능 및 비용 비교 데이터를 공개했습니다. 그 결과는 다음과 같습니다.

검색 정확도 (NDCG@10 기준)

모델 정확도(%)
voyage-3 76.72
voyage-3-lite 72.98
OpenAI v3 large 69.17
OpenAI v3 small 67.08
  • voyage-3는 OpenAI v3 large보다 평균 7.55% 더 높은 검색 정확도를 보였습니다.
  • voyage-3-lite는 같은 가격의 OpenAI v3 small보다도 성능이 더 우수합니다.

비용 절감 효과

모델 1M 토큰당 비용 (USD) 임베딩 차원
voyage-3 0.06 1024
voyage-3-lite 0.02 512
OpenAI v3 large 0.13 3072
OpenAI v3 small 0.02 1536
  • voyage-3는 OpenAI v3 large 대비 2.2배 저렴, 임베딩 차원도 3배 작아 벡터DB 저장비용까지 절감할 수 있습니다.
  • voyage-3-lite는 6배 이상 저렴한 비용으로, 저비용 고효율을 원하는 사용자에게 적합합니다.


3. 두 모델의 주요 특징 및 선택 기준

voyage-3: 고성능 검색을 위한 선택

  • 모든 평가 도메인에서 OpenAI v3 large 대비 더 높은 검색 정확도
  • 낮은 임베딩 차원으로 벡터DB 비용 절감
  • 32K 토큰 지원으로 대용량 문서 처리 가능
  • 다양한 도메인에서 균형 잡힌 성능

→ 고정밀 검색 시스템을 운영하거나, 정확도가 가장 중요한 사용 환경에 적합합니다.

voyage-3-lite: 실용성과 효율성의 균형

  • 높은 검색 정확도 (OpenAI v3 small 대비 +7.58%)
  • 빠른 응답 시간과 적은 자원 소모
  • 벡터DB 저장 비용이 기존 대비 6~8배 절감 가능

→ 검색 성능도 중요하지만, 응답 속도와 비용 최적화를 동시에 추구하는 서비스에 적합합니다.


4. 어디에 어떻게 활용할 수 있나?

Voyage는 voyage-3 시리즈를 8개 주요 도메인에서 테스트했고, 아래와 같은 데이터셋을 활용했습니다.

  • 기술 문서: PyTorch, LangChain, 5G 등
  • 코드: LeetCode, HumanEval 등
  • 법률: LegalQuAD, AILA 법률 문서 등
  • 금융: SEC 보고서, 금융 QA
  • 웹/리뷰: Huffpost, Doordash
  • 멀티링구얼: 프랑스어, 독일어, 일본어, 한국어 등 총 26개 언어
  • 장문 요약: 위키 문서, 정부 보고서
  • 대화형 텍스트: 대화 요약, 회의 기록

특히 멀티링구얼 테스트에서는 voyage-3-lite가 OpenAI v3 large보다 4.55% 더 우수한 성능을 보였습니다.

→ 하나의 모델로 다양한 언어와 도메인에서 검색 정확도를 높이고 싶다면 voyage-3 시리즈는 훌륭한 선택입니다.


지금 어떤 모델을 선택할 것인가?

Voyage-3 시리즈는 다음과 같은 상황에 최적화되어 있습니다.

  • 성능을 최우선으로 하는 기업: voyage-3
  • 빠른 응답 시간과 낮은 비용을 원하는 스타트업 및 서비스 기업: voyage-3-lite

OpenAI 임베딩 모델을 사용 중이었다면, 같은 혹은 더 나은 성능을 절반 이하의 비용으로 사용할 수 있다는 점에서 매력적인 대안이 될 수 있습니다. 특히 한국어를 포함한 다국어 처리 성능이 우수해 국내 서비스에도 충분히 활용 가능합니다.

향후 voyage-3-large 모델이 출시되면, 성능과 기능 면에서 또 한 번의 도약이 기대됩니다.

지금 바로 첫 2억 토큰 무료 체험 기회를 통해 voyage-3의 성능을 직접 경험해 보세요.

https://blog.voyageai.com/2024/09/18/voyage-3/?utm_source=pytorchkr&ref=pytorchkr

 

voyage-3 & voyage-3-lite: A new generation of small yet mighty general-purpose embedding models

TL;DR – We are excited to announce voyage-3 and voyage-3-lite embedding models, advancing the frontier of retrieval quality, latency, and cost. voyage-3 outperforms OpenAI v3 large by 7.55% on aver…

blog.voyageai.com

728x90
반응형