
이 글은 **Cursor**가 새롭게 공개한 코딩 특화 AI 모델 Composer 2에 대해 정리한 글입니다. Composer 2는 전작 대비 큰 폭의 성능 향상을 기록하며, 실제 코딩 작업과 소프트웨어 엔지니어링 환경에서 강력한 결과를 보여주고 있습니다. 본문에서는 Composer 2의 성능 변화, 주요 벤치마크 결과, 가격 정책, 그리고 이번 출시가 갖는 의미를 중심으로 살펴봅니다.
Composer 2 개요: 코딩 특화 AI 모델의 진화
Composer 2는 Cursor가 공개한 최신 코딩 특화 AI 모델로, 프런티어급 성능을 목표로 설계되었습니다. 특히 이전 버전인 Composer 1과 1.5를 거치며 축적된 학습 결과를 바탕으로, 이번 세대에서 가장 큰 폭의 성능 도약을 이뤘다는 점이 특징입니다. 단순한 점진적 개선이 아니라, 실제 개발 업무에서 체감 가능한 수준의 변화가 강조됩니다.
벤치마크로 본 성능 향상
Composer 2의 성능은 세 가지 주요 벤치마크를 통해 평가되었습니다.
CursorBench
CursorBench는 Cursor가 자체 제작한 실제 코딩 작업 중심의 벤치마크입니다.
- Composer 1: 38.0
- Composer 1.5: 44.2
- Composer 2: 61.3
Composer 1에서 2로 넘어오며 약 61%의 성능 향상이 있었고, 특히 1.5에서 2로의 상승 폭이 약 17점으로 가장 큰 도약을 보였습니다.
Terminal-Bench 2.0
Terminal-Bench 2.0은 **Laude Institute**가 관리하는 터미널 기반 에이전트 평가 지표입니다. 실제 터미널 명령어 실행 능력을 기준으로 평가합니다.
- Composer 1: 40.0
- Composer 1.5: 47.9
- Composer 2: 61.7
CursorBench와 거의 동일한 상승 패턴을 보이며, 실사용 환경에서의 작업 수행 능력이 크게 개선되었음을 보여줍니다.
SWE-bench Multilingual
SWE-bench Multilingual은 실제 GitHub 이슈를 코드로 해결하는 능력을 평가하는 다국어 소프트웨어 엔지니어링 벤치마크입니다.
- Composer 1: 56.9
- Composer 1.5: 65.9
- Composer 2: 73.7
Composer 1 시점부터 상대적으로 높은 점수를 기록했는데, 이는 코드 패치 작성 능력이 초기부터 강점이었음을 의미합니다. 73.7이라는 수치는 현재 공개된 모델 중에서도 최상위권에 해당합니다.
핵심 포인트: 왜 Composer 2가 중요한가
이번 발표의 핵심은 세 벤치마크 모두에서 1 → 1.5 구간보다 1.5 → 2 구간의 성능 상승 폭이 훨씬 크다는 점입니다. 이는 지속적인 사전 학습과 강화학습 조합이 효과적으로 작동한 결과로 해석됩니다. 단순한 미세 조정이 아닌, 모델 학습 전략 자체가 성능 개선으로 이어진 구간이라는 점에서 의미가 큽니다.
가격 정책과 사용 전략
Composer 2는 성능뿐 아니라 가격 경쟁력도 강조됩니다.
- 표준 버전: 입력 $0.50 / 출력 $2.50 (백만 토큰당)
- 빠른 버전(fast): 입력 $1.50 / 출력 $7.50 (백만 토큰당)
빠른 버전이 기본 옵션으로 제공될 예정이며, 동급의 고속 모델 대비 낮은 가격이 강점입니다. 또한 개인 플랜 사용자에게는 별도의 사용량 풀이 제공되어 부담 없이 활용할 수 있도록 구성되어 있습니다.
Cursor의 전략적 변화와 의미
이번 Composer 2 출시는 Cursor가 Claude나 GPT와 같은 외부 모델을 활용하는 레이어에서 벗어나, 자체 모델을 직접 훈련하는 방향으로 본격 전환했다는 점에서 인상적입니다. 이는 코딩 에이전트 시장에서 모델 레이어까지 수직 통합을 시도하는 전략으로 볼 수 있으며, 가격 대비 성능 측면에서 공격적인 포지셔닝을 취하고 있습니다. 기존에 외부 모델을 사용하던 사용자라면 Composer 2로의 전환을 충분히 검토해볼 만한 시점입니다.
Composer 2는 단순한 버전 업데이트가 아니라, 성능·가격·전략 측면에서 Cursor의 방향성을 분명히 보여주는 모델입니다. 특히 실제 코딩 작업과 소프트웨어 엔지니어링 벤치마크에서의 큰 폭의 성능 향상은 개발자 경험에 직접적인 영향을 줄 수 있습니다. 앞으로 코딩 에이전트 시장에서 Cursor가 어떤 방식으로 생태계를 확장해 나갈지, 그리고 Composer 2가 개발 workflow에 어떤 변화를 가져올지 기대해볼 만합니다.

'인공지능' 카테고리의 다른 글
| Andrej Karpathy가 말하는 코드 에이전트 시대와 AutoResearch, 그리고 AI의 Loopy한 진화 (0) | 2026.03.23 |
|---|---|
| Cursor Composer 2 모델 논란 정리: Kimi K2.5 기반 의혹부터 공식 협력 확인까지 (0) | 2026.03.23 |
| KiloClaw 호스팅 AI 비서 완벽 가이드: OpenClaw를 60초 만에 쓰는 방법 (0) | 2026.03.23 |
| 리뷰 단계가 늘어날수록 개발 속도가 10배 느려지는 이유 ― AI 시대에도 바뀌지 않는 조직 병목의 본질 (0) | 2026.03.23 |
| 연속 자율 AI 에이전트를 구현하는 Ralph Loop Agent 기술 정리 (0) | 2026.03.23 |