스마트폰에서 작동하는 AI? 샤오미가 해냈다
모바일에서도 작동 가능한 경량 AI 모델이 필요했던 당신이라면, 드디어 주목할 만한 모델이 나왔습니다.
샤오미가 자사 최초의 **오픈소스 추론 모델 ‘MiMo-7B’**를 깃허브를 통해 공개하며 AI 경쟁의 본격적인 출발을 알렸습니다.
이 모델은 단순한 ‘또 하나의 경량 모델’이 아닙니다.
OpenAI의 ‘o1-미니’와 맞먹는 성능을 내면서도,
4배 이상 더 큰 모델도 이긴 것으로 평가되고 있습니다.
그리고 무엇보다, 온디바이스 사용에 최적화된 설계라는 점에서 개발자들의 이목을 집중시키고 있습니다.
이번 블로그에서는 MiMo-7B의 핵심 개념부터 성능 비교, 특징, 실사용 방법까지 모두 정리해드립니다.
지금부터 샤오미의 전략과 기술이 어떻게 다른지 살펴보세요.
샤오미, AI 시장에 본격 발을 들이다
샤오미는 그동안 ‘하드웨어 중심’의 스마트폰 제조사로 알려졌지만, 사실 자체 AI 모델 개발을 꾸준히 진행해 왔습니다.
2023년에는 ‘MiLM’이라는 자체 AI를 자사 디바이스에 탑재했고,
이번엔 아예 오픈소스로 공개 가능한 추론 모델까지 발표한 겁니다.
이번에 공개된 모델은 총 4종입니다.
- 기본 모델 (MiMo-7B-Base)
- SFT(지도 미세조정) 모델
- 기본 모델에서 강화 학습(RL)을 적용한 모델
- SFT 모델에서 RL을 적용한 모델
샤오미는 이 모델이 총 25조 개의 토큰을 학습했고,
무려 13만 개의 수학 및 코드 문제를 바탕으로 RL 학습을 진행했다고 밝혔습니다.
이는 단순한 언어처리 모델이 아니라, 추론 능력에 초점을 맞춘 모델이라는 것을 의미합니다.
MiMo-7B 모델, 정확히 어떤 모델인가요?
- 모델 크기: 70억 개 파라미터 (7B)
- 모델 타입: 소형 언어모델 (sLM)
- 특화 기능: 추론 최적화 (특히 수학과 코드)
- 학습 방식: 지도 미세조정 + 강화 학습(RLHF)
- 오픈소스 여부: GitHub 통해 완전 공개
핵심은 모바일에서도 쓸 수 있을 정도로 작지만,
강화 학습을 통해 높은 추론 능력을 갖췄다는 점입니다.
단순한 채팅이 아니라 문제 해결 능력, 특히 수학적/논리적 사고를 요하는 작업에서 경쟁력을 갖추고 있다는 것이 샤오미의 설명입니다.
o1-미니, 딥시크, 큐원과 비교해보자
샤오미가 공개한 벤치마크 결과에 따르면:
모델명 | 파라미터 수 | RL 여부 | 수학/코드 성능 | 비고 |
MiMo-7B-RL | 7B | ✅ | o1-미니보다 약간 낮음 | 가장 작은 모델 |
o1-미니 | 약 7B | ✅ | 기준 모델 | OpenAI의 소형 모델 |
딥시크-증류-7B-RL | 7B | ✅ | 성능 열세 | 샤오미보다 낮음 |
큐원 2.5-32B-RL-제로 | 32B | ✅ | 성능 열세 | 파라미터는 4배 더 큼 |
결론은?
MiMo-7B는 o1-미니급 성능을 내면서도, 딥시크·큐원을 모두 뛰어넘는 경량 AI 모델이라는 겁니다.
특히 32B 모델보다 뛰어난 추론 결과를 보여준 점이 주목할 부분입니다.
MiMo-7B의 3가지 핵심 특장점
1. 초소형이지만 강력한 추론 능력
기존에는 소형 모델은 ‘가볍지만 멍청하다’는 인식이 있었습니다.
그러나 MiMo-7B는 이를 깨고, 강화 학습을 통해 추론 영역에서도 강력한 성능을 확보했습니다.
2. 온디바이스 / 엣지 환경 최적화
‘sLM’으로 분류되는 이 모델은 스마트폰, 태블릿, IoT 기기 등에서도 돌아갈 수 있도록 설계됐습니다.
이것이 바로 샤오미가 다른 AI 기업과 차별화되는 점입니다.
3. 완전한 오픈 소스 모델
깃허브에서 누구나 다운로드하고 테스트할 수 있습니다.
이 말은 곧, 개인 개발자부터 기업 연구자까지 직접 실험하고 응용할 수 있는 자유도를 갖는다는 뜻입니다.
샤오미의 AI는 과소평가되면 안 된다
샤오미의 MiMo-7B는 단순한 오픈 소스 모델이 아닙니다.
그동안 하드웨어 제조사로만 알려졌던 샤오미가 AI 경쟁 무대에서 확실한 존재감을 드러낸 신호탄입니다.
- 70억 파라미터라는 소형 사이즈
- 강화 학습 기반의 추론 성능
- 온디바이스 운영 최적화
- 오픈 소스로 누구나 실험 가능
이 4가지 요소는 MiMo-7B를 ‘실험용’을 넘어 현실에서 사용할 수 있는 AI 모델로 끌어올렸습니다.
앞으로 엣지 AI와 모바일 AI가 더욱 중요해질 시장에서,
샤오미의 AI 전략은 ‘비주류’가 아니라 ‘핵심’이 될 가능성이 충분합니다.
https://github.com/XiaomiMiMo/MiMo?tab=readme-ov-file
GitHub - XiaomiMiMo/MiMo: MiMo: Unlocking the Reasoning Potential of Language Model – From Pretraining to Posttraining
MiMo: Unlocking the Reasoning Potential of Language Model – From Pretraining to Posttraining - XiaomiMiMo/MiMo
github.com
'인공지능' 카테고리의 다른 글
“구글 없이도 검색이 될까?” – 메타가 만드는 AI 검색 엔진의 미래 (0) | 2025.05.01 |
---|---|
AI 보안의 새 판을 여는 도구, 메타의 ‘라마 가드 4’ 전격 공개 - 인공지능과 블록체인의 보안 접점을 새롭게 잇다 (0) | 2025.05.01 |
메타가 라마 API로 보여준 AI의 미래: 왜 이 발표가 중요한가? (0) | 2025.05.01 |
메타가 여는 차세대 AI의 문, ‘d1’: 트랜스포머를 넘어서는 새로운 추론 패러다임 (0) | 2025.05.01 |
"이젠 오디오로 듣는다!" 구글 NotebookLM의 다국어 오디오 개요 기능 전격 소개 (0) | 2025.05.01 |