LLM 기반 추천 시스템의 혁신과 최신 트렌드
🔍 추천 시스템, 어디까지 발전했을까?
온라인 쇼핑, 음악 스트리밍, 동영상 플랫폼을 사용할 때마다 개인화된 추천을 받는 것이 당연해졌습니다. 하지만 이런 추천 시스템이 어떻게 발전해왔는지 알고 계신가요?
처음에는 단순한 협업 필터링(Collaborative Filtering) 이나 Word2Vec 기반 임베딩 방식이 사용되었습니다. 이후 GRU, Transformer, BERT 등의 딥러닝 모델이 도입되면서 추천 정확도가 비약적으로 향상되었습니다. 그리고 이제, 대형 언어 모델(LLM, Large Language Model) 기반 추천 시스템이 등장하며 또 한 번의 혁신이 일어나고 있습니다.
이 글에서는 LLM을 활용한 추천 및 검색 시스템의 최신 기술과 실제 기업들의 적용 사례를 살펴보겠습니다. 🚀
📌 추천 시스템의 진화
1️⃣ 초기 추천 시스템: ID 기반 협업 필터링
초기 추천 시스템은 유저와 아이템 간의 상호작용(예: 클릭, 좋아요, 구매)을 분석하여 비슷한 유저에게 비슷한 아이템을 추천하는 방식이었습니다.
❌ 하지만 한계가 있었습니다:
- 새로운 유저에게 적절한 추천을 제공하기 어려운 콜드 스타트 문제
- 데이터가 부족할 경우 추천 품질 저하
- 단순한 패턴 분석에 의존
2️⃣ 딥러닝 기반 추천 시스템
딥러닝이 도입되면서 추천 시스템은 한 단계 진화했습니다.
- Word2Vec 기반 아이템 임베딩 → 아이템 간의 유사도를 벡터로 표현
- GRU, Transformer, BERT → 사용자 행동을 학습하여 추천 품질 향상
하지만 여전히 ID 기반 접근 방식의 한계가 존재했습니다.
3️⃣ LLM 기반 추천 시스템: 새로운 패러다임
대형 언어 모델(LLM)과 멀티모달 AI가 등장하면서 추천 시스템은 단순한 ID 기반에서 콘텐츠 이해와 행동 모델링을 결합한 방식으로 진화하고 있습니다.
💡 주요 특징
✅ ID가 아닌 의미(Semantic) 기반 추천
✅ 텍스트, 이미지, 오디오 등 멀티모달 데이터를 활용
✅ 콜드 스타트 및 롱테일 문제 해결
📌 LLM 기반 추천 시스템 아키텍처 & 연구 사례
1️⃣ YouTube - Semantic ID 기반 추천
✅ 기존 해시 기반 ID 대신, 콘텐츠 의미(Semantic ID)를 사용
✅ Transformer 기반 비디오 인코더 → 고밀도 콘텐츠 임베딩 생성
✅ RQ-VAE(Residual Quantization VAE) → 임베딩을 정수형 Semantic ID로 변환
🎯 결과:
- 랜덤 해시 ID보다 직접적인 고밀도 임베딩의 성능이 떨어짐
- 하지만 SPM(SentencePiece Model) 기반 접근법이 콜드 스타트에서 우수한 성능 제공
2️⃣ Kuaishou - M3CSR (멀티모달 추천)
✅ 비주얼(ResNet), 텍스트(Sentence-BERT), 오디오(VGGish) 임베딩을 병합
✅ K-means 클러스터링을 사용하여 학습 가능한 ID 생성
🎯 결과:
- A/B 테스트에서 클릭 +3.4%, 좋아요 +3.0%, 팔로우 +3.1% 증가
- 콜드 스타트 문제 해결 (속도 +1.2%, 커버리지 +3.6% 개선)
3️⃣ Huawei - FLIP (ID + LLM 정렬)
✅ ID 기반 추천 모델과 LLM을 정렬하는 방식 도입
✅ 마스킹된 텍스트 및 테이블 데이터를 활용하여 다중 모달 정렬 수행
🎯 결과:
- 기존 ID 기반 및 LLM 기반 모델보다 성능 우수
- 마스킹 수준과 다중 모달 정렬이 성능 개선에 중요한 역할
📌 LLM 기반 데이터 분석 및 검색 개선 사례
1️⃣ Bing - 웹페이지 메타데이터 생성
✅ GPT-4를 사용해 웹페이지 타이틀 및 요약 생성
✅ Mistral-7B 모델을 미세 조정하여 클릭 예측 모델 개선
🎯 결과:
- 클릭베이트 콘텐츠 31% 감소, 중복 콘텐츠 76% 감소
- 권위 있는 콘텐츠 18% 증가, 검색 성능 48% 증가
2️⃣ Indeed - 구인 매칭 필터링
✅ GPT-3.5를 활용한 필터링 모델 eBadMatch 구축
✅ 저품질 구인 매칭 필터링을 통해 구직자 경험 개선
🎯 결과:
- 매칭 초대 이메일 수 17.68% 감소
- 구독 취소율 4.97% 감소, 신청률 4.13% 증가
3️⃣ Spotify - 탐색 검색 쿼리 추천
✅ LLM을 사용하여 사용자 검색 쿼리를 생성 및 최적화
✅ Doc2Query, InPars 기법 활용
🎯 결과:
- 탐색형 검색 쿼리 비율 +9% 증가
- 최대 쿼리 길이 +30% 증가, 평균 쿼리 길이 +10% 증가
📌 추천 & 검색 통합 아키텍처의 등장
1️⃣ Spotify - 검색 & 추천 통합 모델
✅ Flan-T5 기반으로 아이템 ID를 토큰화하여 학습
✅ 검색 & 추천 데이터를 하나의 생성 모델에서 통합
🎯 결과:
- 단일 태스크 모델보다 평균 16% 성능 개선
- 팟캐스트 검색 성능 +855%, 추천 성능 +262% 증가
2️⃣ LinkedIn - 360Brew
✅ 150B 파라미터 모델로 30개 이상의 랭킹 태스크 수행
✅ 자연어 프롬프트를 활용하여 피처 엔지니어링 대신 프롬프트 엔지니어링 적용
🎯 결과:
- 기존 특화 모델과 동등하거나 더 나은 성능 달성
- 콜드 스타트 사용자 성능 개선
3️⃣ Netflix - UniCoRn (검색 & 추천 모델 통합)
✅ 사용자 ID, 검색 쿼리, 국가 등 다양한 컨텍스트 정보를 활용
✅ 추천 및 검색 성능을 동시에 향상시키는 접근법 적용
🎯 결과:
- 추천 성능 +10%, 검색 성능 +7% 개선
- 개인화 강화로 성능 개선
📌 추천 시스템의 미래
🔹 LLM이 추천 시스템을 어떻게 변화시키고 있는가?
✅ ID 기반 추천에서 의미(Semantic) 기반 추천으로 변화
✅ 멀티모달 데이터를 활용한 콘텐츠 이해 능력 향상
✅ 검색과 추천이 통합 아키텍처로 발전
🔹 앞으로의 기대
💡 AI 모델 최적화 (LoRA, 지식 증류) → 비용 절감 & 효율 향상
💡 추천 모델의 개인화 & 컨텍스트 활용 증가
💡 AI 기반 검색과 추천의 융합이 가속화될 것
추천 시스템은 더 이상 단순한 알고리즘이 아닙니다. LLM과 멀티모달 AI가 결합되면서 검색과 추천의 경계를 허물고 새로운 AI 혁신이 일어나고 있습니다. 🚀
https://eugeneyan.com//writing/recsys-llm/
Improving Recommendation Systems & Search in the Age of LLMs
Model architectures, data generation, training paradigms, and unified frameworks inspired by LLMs.
eugeneyan.com