
최근 인공지능(AI) 분야에서 대형언어모델(LLM)의 발전은 눈부시게 빠르게 진행되고 있습니다. 오픈AI, 구글, xAI 같은 글로벌 기업들이 경쟁적으로 신모델을 내놓는 가운데, 중국 기반의 딥시크(DeepSeek)가 발표한 **V3.1-터미너스(Terminus)**는 많은 관심을 끌고 있습니다.
이번 업데이트는 단순히 성능 향상에 그치지 않고, 언어 출력의 일관성과 도구 활용 능력 강화라는 두 가지 핵심적인 개선에 집중했습니다. 특히 오픈 소스로 공개되었다는 점에서 기업과 개발자들이 보다 쉽게 접근할 수 있고, 실제 비즈니스와 연구 환경에서 활용성을 크게 높일 수 있다는 점이 특징입니다.
그렇다면 딥시크 V3.1-터미너스는 어떤 점에서 달라졌으며, 어떤 의의를 지니고 있을까요?
딥시크 V3.1-터미너스란 무엇인가
딥시크는 2024년 12월 첫 V3 모델을 공개하며 주목을 받았습니다. 이어서 2025년 8월에는 매개변수 6850억 개 규모의 V3.1을 선보여 미국의 폐쇄형 상용 모델과 견줄 만한 성능을 보여 화제가 되었습니다.
이번에 공개된 V3.1-터미너스는 V3.1을 기반으로 기능적 완성도를 끌어올린 버전으로, 이름 그대로 종착역(Terminus)에 가깝다는 의미를 담고 있습니다. 무엇보다 오픈 소스 모델로 공개되어 누구나 Hugging Face, 모바일 앱(iOS·안드로이드), 전용 API를 통해 즉시 활용할 수 있습니다.
주요 개선 사항
1. 언어 일관성 강화
이전 V3.1 버전에서는 영어 문장 내에 중국어 단어가 삽입되거나, 중·영 혼용 문장이 출력되는 문제가 보고되었습니다. V3.1-터미너스에서는 이러한 언어적 불안정성을 대폭 개선하여, 보다 자연스럽고 매끄러운 텍스트 생성이 가능해졌습니다.
특히 다국어 환경에서의 문서 작성, 고객 응대, 자동 요약 등 실사용 사례에서 일관성과 신뢰성이 크게 향상되었습니다.
2. 에이전틱 도구 활용 능력 강화
딥시크는 이번 업데이트에서 ‘에이전틱 도구(agentic tool)’의 성능을 강화하는 데 초점을 맞췄습니다.
- 코드 에이전트(Code Agent): 코드 생성, 디버깅, 자동화된 개발 보조 업무를 더 정확하게 수행할 수 있습니다.
- 서치 에이전트(Search Agent): 검색과 정보 종합 기능이 강화되어, 단순 질의응답을 넘어 복잡한 탐색이나 정보 요약 작업에서 더욱 강력한 성능을 발휘합니다.
이로써 V3.1-터미너스는 단순한 대화형 모델을 넘어 개발 및 연구 지원 도구로 활용할 수 있는 범위가 넓어졌습니다.

3. 벤치마크 성능
여러 벤치마크 평가에서도 성능 향상이 확인되었습니다.
- 향상된 영역: 단순 질의응답(SimpleQA), 복합 탐색(BrowseComp), 코딩(SWE Verified), 다국어 SWE-벤치, 터미널-벤치 등에서 모두 이전 버전 대비 눈에 띄는 개선이 있었습니다.
- 제한된 영역: 순수 추론(Reasoning) 능력은 소폭 상승에 그쳤고, 코딩 실력을 측정하는 Codeforces 점수는 오히려 소폭 하락했습니다.
즉, 실무 활용도는 높아졌지만 고난도의 추론 문제 해결에서는 상대적으로 한계가 있다는 점을 보여줍니다.
4. 모델 모드와 컨텍스트 창
V3.1-터미너스는 사용자 니즈에 따라 선택할 수 있는 두 가지 모드를 제공합니다.
- 딥시크-챗(deepseek-chat): 일반 대화형 모드
- 딥시크-리즈너(deepseek-reasoner): 심층 추론형 모드
두 모드 모두 최대 12만8000 토큰의 컨텍스트 창을 제공하지만, 경쟁 모델과 비교하면 다소 짧은 편입니다.
- 오픈AI GPT-5: 25만6000 토큰
- 구글 제미나이 2.5 프로: 100만 토큰
- 그록 4 패스트: 200만 토큰
출력 토큰 제한은
- 대화형 모드: 최대 8000 토큰
- 추론형 모드: 최대 6만4000 토큰입니다.
이는 일반 비즈니스 활용에는 충분하지만, 초장문 분석이나 복잡한 시뮬레이션에는 한계가 있을 수 있습니다.
5. 이용 요금 구조
딥시크는 명확한 요금 정책을 제시했습니다.
- 입력(100만 토큰 기준)
- 캐시 히트: 0.07달러
- 캐시 미스: 0.56달러
- 출력(100만 토큰 기준): 1.68달러
즉, 캐시 히트율을 높이면 상당히 저렴한 비용으로 대규모 데이터를 처리할 수 있습니다. 이는 속도와 비용 효율성을 동시에 추구하는 기업이나 개발자들에게 큰 장점이 됩니다.
시사점 및 기대 효과
딥시크 V3.1-터미너스의 가장 큰 의미는 오픈 소스 기반의 고성능 LLM이라는 점입니다.
- 개발자: 높은 비용 없이도 대규모 언어모델을 활용해 새로운 애플리케이션을 개발할 수 있습니다.
- 기업: 고객 응대, 문서 작업, 보고서 요약, 코드 작성 보조 등 다양한 비즈니스 현장에서 실질적으로 활용할 수 있습니다.
- 연구자: 데이터 분석, 복합 검색, 다국어 지원 등 연구 작업에 적용할 수 있습니다.
다만, 고난도 추론이나 초장문 컨텍스트 활용이 필요한 경우에는 여전히 GPT-5, 제미나이 같은 경쟁 모델에 비해 제약이 있을 수 있습니다. 그럼에도 불구하고 빠르고 저렴하며 안정적인 성능이라는 측면에서 충분히 매력적인 선택지로 자리잡을 수 있습니다.
딥시크 V3.1-터미너스는 언어 모델의 본질적인 성능을 개선하는 동시에, 도구 활용 능력 강화라는 실질적 가치를 추가했습니다. 영어와 중국어 혼용 문제를 해결하고, 코드와 검색 에이전트의 성능을 높여 업무 친화적인 AI 도구로 자리매김한 것입니다.
앞으로 이 모델은 오픈 소스 생태계에서 개발자와 기업 모두에게 새로운 기회를 제공할 것으로 보입니다. 고비용 모델 사용에 부담을 느끼는 사용자라면, 딥시크 V3.1-터미너스가 현실적인 대안이 될 수 있을 것입니다.
deepseek-ai/DeepSeek-V3.1-Terminus · Hugging Face
DeepSeek-V3.1-Terminus Introduction This update maintains the model's original capabilities while addressing issues reported by users, including: Language consistency: Reducing instances of mixed Chinese-English text and occasional abnormal characters; Age
huggingface.co

'인공지능' 카테고리의 다른 글
| 알리바바 Qwen3 6가지 시리즈 총정리: 플래그십부터 실시간 통역·여행 플래너까지 (0) | 2025.09.24 |
|---|---|
| 이제 누구나 앱 개발자? 생성형 AI가 열어가는 내부 소프트웨어 혁신의 시대 (0) | 2025.09.24 |
| Qwen3-TTS-Flash: 다국어·다방언을 넘나드는 초고속 AI 음성 합성 모델 (0) | 2025.09.24 |
| 에이전틱 AI, 왜 실패하는가? 기업 도입 실패 원인 4가지와 해결 방향 (0) | 2025.09.24 |
| MemoRAG: 차세대 RAG를 위한 메모리 기반 지식 검색 혁신 (0) | 2025.09.24 |