
이 글에서는 Microsoft AI가 새롭게 공개한 추론 특화 모델 **MAI-Thinking-1**을 중심으로, 모델의 개발 배경과 철학, 기술적 구조, 핵심 성능, 그리고 엔터프라이즈 환경에서 어떤 의미를 가지는지 정리합니다. 단순한 성능 발표가 아니라, Microsoft가 어떤 방향으로 AI를 설계하고 발전시키고 있는지를 이해하는 데 초점을 둡니다.
MAI-Thinking-1은 무엇인가
MAI-Thinking-1은 Microsoft AI 조직이 공개한 중형급 추론 모델입니다. 이 모델은 단순한 언어 생성이 아니라,
- 소프트웨어 엔지니어링 문제 해결
- 고난도 수학·과학적 추론
- 다단계 사고와 의사결정
과 같은 영역에서 강점을 보이도록 설계되었습니다.
특히 주목할 점은 외부 서드파티 모델을 모방하는 증류(distillation) 방식이 아닌, 처음부터 독립적으로 학습되었다는 점입니다. 이는 모델의 제어 가능성과 신뢰성을 높이기 위한 선택입니다.
Humanist Superintelligence를 향한 방향성
MAI-Thinking-1은 Microsoft가 제시하는 Humanist Superintelligence 비전의 한 단계입니다.
이 개념의 핵심은 AI가 인간을 대체하는 존재가 아니라, 사람과 조직을 보조하고 확장하는 기술이어야 한다는 점입니다.
이를 위해 Microsoft는 두 가지를 동시에 중요하게 봅니다.
- 모델이 무엇을 할 수 있는가
- 그 능력이 어떤 방식으로 만들어졌는가
MAI-Thinking-1은 이 두 축 모두에서 의미 있는 설계를 보여주는 사례입니다.
Hill-Climbing Machine: 지속적으로 성장하는 학습 파이프라인
MAI-Thinking-1은 단일 모델이 아니라, Hill-Climbing Machine이라 불리는 개발 철학과 파이프라인의 결과물입니다.
이 접근법은 모델 개발의 모든 단계를 “계속 개선 가능한 구조”로 만드는 것을 목표로 합니다.
1. 상속이 아닌 학습된 능력
외부 모델의 지식을 그대로 물려받는 방식은 빠르지만, 새로운 환경에 적응하기 어렵습니다. MAI-Thinking-1은 증류 없이 학습되어, 문제 자체를 이해하고 해결하는 능력을 직접 획득했습니다.
2. 깨끗하고 검증된 데이터
AI 생성 데이터는 사전 학습에서 배제하고, 상업적으로 라이선스가 명확한 데이터만 사용했습니다. 이는 품질, 출처 추적, 모델 행동에 대한 통제력을 확보하기 위함입니다.
3. 전체 스택의 자체 구축
모델 구조, 학습 인프라, 강화학습 프레임워크까지 내부 기술로 설계했습니다. 이를 통해 모델의 성능과 안전성을 엔드투엔드로 최적화할 수 있습니다.
중형 모델이지만 강력한 소프트웨어 엔지니어링 성능
MAI-Thinking-1은
- 35B 활성 파라미터
- 약 1조 개의 전체 파라미터
- Sparse Mixture of Experts 구조
를 가진 중형급 모델입니다. 그럼에도 불구하고 SWE-Bench Pro 기준으로 **Claude Opus 4.6**과 유사한 성능을 보입니다.
이는 모델이 크지 않아도 실제 개발 환경에서 충분히 활용 가능한 수준의 코딩 추론을 제공할 수 있음을 의미합니다.
Microsoft는 실제 개발자가 겪는 작업 흐름을 그대로 반영한 학습 환경을 구축했습니다.
코드 읽기, 파일 수정, 테스트 실행, 실패 관찰, 복구까지 이어지는 전 과정을 모델이 경험하도록 설계한 것이 특징입니다.
수학·과학 추론 능력의 명확한 지표
MAI-Thinking-1은 다음과 같은 성과를 기록했습니다.
- AIME 2025: 97.0%
- AIME 2026: 94.5%
이는 동일한 크기 대비 매우 높은 수준의 결과로, 내부 데이터와 보상 설계만으로도 실제 추론 능력이 꾸준히 향상될 수 있음을 보여줍니다. 이 구조는 향후 다른 도메인으로의 일반화 가능성도 시사합니다.
사람 중심 평가에서의 우위
모델의 실제 가치는 사람이 느끼는 “도움이 되는가”에 달려 있습니다.
Microsoft는 파트너사인 **Surge**와 함께 블라인드 인간 평가를 진행했습니다.
1,276개의 단·다중 턴 과제를 대상으로 다음 요소를 평가했습니다.
- 문제 이해도
- 지시 사항 준수
- 적절한 상세 수준
- 명확한 글쓰기
그 결과, MAI-Thinking-1은 **Claude Sonnet 4.6**보다 더 선호되는 응답을 제공한 것으로 나타났습니다.
엔터프라이즈 환경을 고려한 설계
MAI-Thinking-1은 기업 환경을 전제로 설계된 모델입니다.
- 최대 256k 토큰의 긴 컨텍스트 지원
- 함수 호출(Function Calling) 지원
- 다중 지시 계층 처리 가능
- Chat Completions API 호환
또한 모든 MAI 모델은 **Microsoft Foundry**를 통해 엔터프라이즈급 보안과 컴플라이언스를 제공합니다.
안전성과 유용성의 균형
Microsoft는 안전과 유용성을 분리된 목표로 보지 않습니다.
MAI-Thinking-1에서는 불필요한 거절과 위험한 응답을 모두 “결함”으로 간주하고, 동일한 강화학습 루프 안에서 다룹니다.
이 접근 덕분에 모델은
- 민감한 요청에는 명확한 안전 기준을 유지하면서
- 일반적인 업무 요청에는 과도하게 제한하지 않는
균형 잡힌 응답을 제공하도록 설계되었습니다.
MAI-Thinking-1은 단순히 “성능이 좋은 모델”을 넘어,
- 어떻게 학습되어야 하는지
- 기업과 사람이 신뢰할 수 있는 AI란 무엇인지
에 대한 Microsoft의 방향성을 보여주는 사례입니다.
중형 모델임에도 불구하고 강력한 추론 능력과 엔터프라이즈 적합성을 동시에 확보했다는 점에서, 향후 실무 중심 AI 활용의 기준점이 될 가능성이 큽니다.
앞으로 이 Hill-Climbing 구조가 어떤 속도로, 어떤 영역까지 확장될지 주목할 필요가 있습니다.
Introducing MAI-Thinking-1 | Microsoft AI
We’re a lean, fast-moving lab made up of some of the world’s most talented minds. We have an exciting roadmap of compute at MAI, which is ramping quickly and extensively. And we have an ambitious mission we truly believe in. We’re also fortunate to p
microsoft.ai

'인공지능' 카테고리의 다른 글
| MAI-Image-2.5 이미지 생성·편집 모델 핵심 정리와 활용 가치 (0) | 2026.06.03 |
|---|---|
| MAI-Code-1-Flash 소개: 개발자 워크플로우를 위한 마이크로소프트의 새로운 코딩 모델 (0) | 2026.06.03 |
| 실환경 강화학습을 위한 롤아웃 프레임워크 Polar 구조와 활용 방법 정리 (0) | 2026.06.02 |
| Claude Code용 Academic Research Skills로 학술 연구 워크플로우 체계화하기 (0) | 2026.06.02 |
| 로컬 AI 에이전트를 조직처럼 운영하는 오픈소스 플랫폼 Alook (0) | 2026.06.02 |