한국어에 최적화된 LLM, SK텔레콤 A.X 4.0의 오픈소스 출시는 왜 중요한가?

한국어 LLM, 이제는 선택이 아니라 전략입니다
많은 기업들이 대규모 언어 모델(LLM)의 잠재력을 이해하고 있지만, 막상 도입하려고 하면 현실적인 문제가 발목을 잡습니다. 영어 기반의 외산 모델은 한국어에 최적화돼 있지 않고, 클라우드 기반으로만 사용할 수 있어 보안이나 비용 측면에서도 부담이 크죠.
SK텔레콤은 이 문제를 정면으로 해결했습니다. 세계 최고 수준의 한국어 처리 성능을 자랑하는 A.X 4.0을 오픈소스로 공개하면서, 한국어 LLM을 필요로 하던 기업과 연구자에게 새로운 대안을 제시한 것입니다. 이 글에서는 A.X 4.0이 어떤 모델인지, 왜 주목해야 하는지, 그리고 어떻게 활용할 수 있는지를 정리합니다.
A.X 4.0이란?
A.X 4.0은 SK텔레콤이 개발한 한국어 특화 대규모 언어 모델(LLM)입니다. Qwen2.5 오픈소스 모델을 기반으로 방대한 한국어 데이터를 추가 학습시켜, 한국 시장에 최적화된 성능을 구현했습니다.
SK텔레콤은 이번에 두 가지 버전을 공개했습니다.
- 표준 모델: 720억 개(72B)의 매개변수
- 경량 모델: 70억 개(7B)의 매개변수
이 모델은 세계적인 오픈소스 플랫폼인 Hugging Face에 공개돼 있어, 누구나 다운로드하고 활용할 수 있습니다.
한국어에 특화된 이유
A.X 4.0의 가장 큰 강점은 한국어 처리 능력입니다. 이는 자체 설계한 토크나이저 덕분입니다. 일반적으로 영어 기반 토크나이저는 한국어의 구조를 완벽히 반영하지 못하지만, A.X 4.0은 한국어에 맞게 구조화돼 높은 효율을 보여줍니다.
실제 테스트 결과를 보면 그 차이가 분명합니다.
- 토큰 효율: 같은 한국어 문장을 입력했을 때 GPT-4o보다 약 33% 높은 토큰 효율 기록
- KMMLU 점수: 78.3점 (GPT-4o는 72.5점)
- CLIcK 점수: 83.5점 (GPT-4o는 80.2점)
이 수치는 단순한 모델 성능 이상의 의미를 가집니다. 한국어로 된 복잡한 문서나 대화를 보다 정확하게 이해하고 처리할 수 있다는 뜻입니다.

성능, 경제성, 보안성까지 갖춘 LLM
A.X 4.0은 단순히 한국어를 잘 처리하는 데 그치지 않습니다. 실제 기업 환경에서 중요한 성능과 비용, 그리고 보안성 측면에서도 강점을 보입니다.
- 고성능: 토큰 효율이 높다는 것은 같은 정보를 처리할 때 더 적은 자원이 든다는 뜻입니다. 이는 처리 속도와 비용 모두에 긍정적인 영향을 미칩니다.
- 경제성: 정보 처리량이 많은 환경일수록, A.X 4.0은 다른 LLM보다 운영 비용을 절감할 수 있습니다.
- 보안성: 온프레미스(자체 서버 설치) 방식으로 제공되기 때문에, 외부 클라우드 환경에 데이터를 맡기지 않고도 AI를 도입할 수 있습니다.
특히 대규모 학습 과정(CPT, Continual Pre-Training)도 외부와 연동 없이 자체 데이터로만 학습했기 때문에, 데이터 주권 확보 측면에서도 신뢰할 수 있는 모델입니다.
실제 활용 사례와 가능성
SK텔레콤은 이미 A.X 4.0을 실무에 적용 중입니다. 지난 5월부터 자사 서비스인 에이닷 통화 요약 기능에 도입해 실제 운영 중이며, 향후 SK 그룹 전반의 다양한 서비스에도 확장 적용할 계획입니다.
또한, A.X 4.0은 단순 사용을 넘어 파생형 모델 개발에도 적합합니다. 기업은 자사의 도메인 지식을 추가 학습시켜 맞춤형 LLM을 만들 수 있고, 연구 기관도 다양한 실험에 활용할 수 있습니다.
어떻게 사용할 수 있을까?
A.X 4.0은 Hugging Face 플랫폼에서 오픈소스로 공개돼 있어, 다음과 같은 방식으로 활용 가능합니다.
- Hugging Face에서 A.X 4.0 모델 다운로드
- 내부 환경(On-Premise) 또는 클라우드 상에서 모델 구성
- 기업의 업무 시스템에 통합하거나 별도 테스트 환경에서 활용
SK텔레콤은 A.X 4.0 외에도 수학 문제 해결, 코드 개발 능력이 강화된 추론형 모델과 이미지-텍스트 통합 처리 기능을 갖춘 멀티모달 모델도 순차적으로 공개할 계획입니다.
A.X 4.0, 한국형 LLM의 새로운 기준이 될 수 있을까?
A.X 4.0은 단지 기술 데모 수준의 모델이 아닙니다. 실사용을 전제로 설계되고, 성능·보안·비용 측면에서 실제 기업 환경을 고려한 모델입니다. 특히 한국어에 대한 깊은 이해와 로컬 처리 지원이라는 두 가지 강점을 갖추고 있다는 점에서, 기업과 연구자 모두에게 실질적인 대안이 될 수 있습니다.
이제 AI 도입을 고려할 때, 외산 모델만 바라보는 시대는 지났습니다. A.X 4.0은 한국 기업이 한국어 기반 LLM을 주도적으로 활용할 수 있는 새로운 전환점이 될 수 있습니다. 앞으로 이어질 추론형 모델과 멀티모달 모델까지 감안한다면, SK텔레콤의 AI 행보는 국내 LLM 생태계 전반에 큰 영향을 미칠 가능성이 높습니다.
https://huggingface.co/skt/A.X-4.0
skt/A.X-4.0 · Hugging Face
A.X 4.0 🤗 Models | 💬 Chat | 🖥️ Github A.X 4.0 Family Highlights SK Telecom released A.X 4.0 (pronounced "A dot X"), a large language model (LLM) optimized for Korean-language understanding and enterprise deployment, on July 03, 2025. Built on th
huggingface.co
