본문 바로가기

grm

(1)

더 작아도 더 똑똑하다? 작은 모델로 ‘추론력’을 폭발시키는 DeepSeek-GRM의 비밀 요즘 LLM은 크기만 키우면 끝일까?대형 언어 모델(LLM)이 갈수록 커지고 있습니다. 크기가 곧 지능이라 여기는 분위기 속에서, ‘컴팩트하지만 강력한 모델’은 그저 이상에 불과해 보이기도 합니다. 그런데 여기, 작지만 더 똑똑한 모델을 만들어낸 연구가 나왔습니다. 바로 DeepSeek가 발표한 논문 "Inference-Time Scaling for Generalist Reward Modeling" 입니다.이 블로그에서는 다음 내용을 다룹니다:일반적인 리워드 모델(Reward Model)의 한계Self-Principled Critique Tuning (SPCT)의 개념과 역할DeepSeek-GRM이 보여준 추론 시간 확장의 잠재력실제 실험 결과와 기대되는 미래 활용모델 크기를 키우지 않고도 추론 능력을 ..

이전 1 다음

티스토리툴바