본문 바로가기

인공지능

Composer: RL로 완성한 초고속 프런티어 모델

반응형

‘빠르지만 똑똑한’ AI 코딩 모델의 등장

AI 코딩 도구가 빠르게 발전하고 있지만, 여전히 많은 개발자들이 “느리다”는 문제에 부딪힌다. 코드 제안이 정확하더라도 몇 초씩 지연된다면, 개발 흐름이 끊기고 몰입감이 떨어진다. Cursor 팀은 이러한 현실적인 문제에서 출발했다.

그들은 질문했다. “정말 실무에서 쓸 수 있는, 반응이 빠르고 똑똑한 AI 모델은 없을까?”
이 질문에 대한 답이 바로 Composer다.

Composer는 소프트웨어 엔지니어링 환경에 특화된 새로운 AI 에이전트 모델이다. 기존 모델 대비 최대 4배 빠른 코드 생성 속도를 달성하면서도, 대형 코드베이스 내 실제 문제를 해결할 수 있도록 Reinforcement Learning(RL)로 학습되었다. 단순한 텍스트 생성 모델이 아니라, 개발자의 손과 머리를 동시에 지원하는 실시간 엔지니어링 파트너를 지향한다.

반응형

Composer란 무엇인가?

Composer는 Mixture-of-Experts(MoE) 아키텍처를 기반으로 한 대규모 언어 모델이다. 이 모델은 일반적인 자연어 처리나 문장 생성이 아닌, 소프트웨어 엔지니어링 환경에서의 지능적 작업 수행을 목표로 한다.

Composer의 학습은 단순한 데이터 기반 훈련이 아닌, 실제 개발 과정을 모사하는 강화학습(Reinforcement Learning) 방식으로 이루어졌다. 모델은 주어진 코드 문제를 해결하기 위해 다음과 같은 행동을 수행하도록 훈련된다.

  • 코드 편집 및 수정
  • 문제 해결 계획 수립
  • 코드베이스 내 의미 기반 검색 수행
  • 터미널 명령 실행

이처럼 Composer는 단순히 “답을 생성하는” 언어 모델이 아니라, 문제를 이해하고 해결하는 에이전트 모델로 설계되었다.


Composer의 핵심 기술 요소

1. Mixture-of-Experts (MoE) 구조

Composer는 MoE 구조를 채택하여, 여러 개의 전문가 모델(Expert)이 입력 데이터의 특성에 따라 선택적으로 활성화된다. 이 구조는 처리 효율성을 높이고, 특정 작업(예: 코드 검색, 테스트 생성 등)에 맞는 전문가를 활용할 수 있게 한다.
그 결과, 더 많은 연산 자원을 절약하면서도 고성능을 유지할 수 있다.

2. 강화학습을 통한 문제 해결 최적화

Composer는 다양한 실제 소프트웨어 엔지니어링 과제를 RL 방식으로 학습한다.
모델은 각 문제에서 “가장 효율적이고 정확한 해결 방법”을 찾아내기 위해 반복적으로 시도하고 보상을 받는다.

이 과정에서 Composer는 단순한 코딩 능력뿐 아니라, 맥락 이해·도구 선택·문제 분해 능력까지 함께 발전시켰다.
훈련 중에는 다음과 같은 행동 패턴을 스스로 학습하기도 했다.

  • 복잡한 코드 검색 및 구조적 이해
  • 린터(linter) 오류 자동 수정
  • 단위 테스트 생성 및 실행

결국 Composer는 스스로 개발자처럼 문제를 분석하고 해결하는 법을 익혔다.

3. 고속 병렬 학습 인프라

Composer의 빠른 성능은 모델 구조뿐 아니라, 그 아래의 훈련 인프라 혁신에서 비롯되었다.
Cursor 팀은 PyTorch와 Ray를 기반으로 비동기 강화학습 인프라를 구축했다.
여기에 MXFP8 MoE 커널을 결합하여 저정밀 연산 환경에서도 성능 저하 없이 학습이 가능하도록 했다.

또한 전문가 병렬화(expert parallelism)와 하이브리드 샤딩 데이터 병렬화(hybrid sharded data parallelism)를 적용해, 수천 개의 NVIDIA GPU 환경에서도 통신 비용을 최소화했다.
이를 통해 Composer는 대규모 훈련 속도와 실시간 추론 속도 모두에서 이점을 얻었다.


Composer의 성능과 평가: Cursor Bench

Composer의 성능은 Cursor가 자체 개발한 Cursor Bench를 통해 검증되었다.
이 벤치마크는 단순히 모델의 정확도뿐 아니라, 다음 요소들을 함께 평가한다.

  • 실제 엔지니어 요청에 대한 응답 품질
  • 코드베이스의 기존 구조 및 추상화 수준에 대한 이해도
  • 소프트웨어 엔지니어링 관행 준수 여부

결과적으로 Composer는 “Fast Frontier” 모델 군에서 최고 성능을 기록했으며, 토큰 생성 속도는 동급 모델 대비 약 4배 빠른 수준을 보였다.
이 수치는 단순히 숫자의 차이가 아니라, 개발자 경험 측면에서 체감 가능한 차이를 의미한다.
즉, 코드 제안이 거의 실시간으로 이루어져 개발 흐름이 끊기지 않는다.


Composer가 가져올 변화

Composer의 가장 큰 강점은 **“속도와 정확성의 균형”**이다.
빠른 반응 속도는 개발자의 몰입을 유지시켜주며, 강화학습 기반의 문제 해결 능력은 높은 정확도를 보장한다.

결국 Composer는 단순한 코드 자동 완성 도구가 아니라, 개발자가 실시간으로 상호작용할 수 있는 AI 동료로 진화했다.
이미 Cursor 팀 내부에서는 Composer가 실제 소프트웨어 개발 업무에 적극적으로 사용되고 있으며, 개발자들은 이를 통해 생산성 향상과 코드 품질 개선을 동시에 경험하고 있다.


728x90

빠름 그 이상의 가치: 개발자의 흐름을 지키는 AI

Composer는 단순히 빠른 모델을 만드는 데서 멈추지 않았다.
Cursor 팀은 개발자가 코드를 작성하는 흐름을 방해하지 않으면서도, 더 나은 결과를 얻을 수 있는 AI를 목표로 했다.
이 철학이 바로 Composer의 본질이다.

강화학습 기반의 자기 학습, MoE 구조의 효율성, 그리고 대규모 병렬 인프라의 결합을 통해 Composer는 “빠르면서도 똑똑한” 모델이라는 새로운 기준을 세웠다.

앞으로 Composer는 개발 환경 전반에 걸쳐 지능형 에이전트의 시대를 여는 시작점이 될 것이다.
AI가 개발자의 속도를 따라잡는 것이 아니라, 개발자의 생각을 앞서 준비하는 모델.
Composer는 바로 그 방향으로 나아가고 있다.

https://cursor.com/blog/composer

 

Composer: Building a fast frontier model with RL · Cursor

Built to make you extraordinarily productive, Cursor is the best way to code with AI.

cursor.com

728x90
반응형
그리드형