이번 글에서는 Anthropic이 최신 모델 Claude Mythos를 일반 공개하지 않고, Project Glasswing이라는 이름으로 극히 제한된 보안 연구자들에게만 제공한 배경과 그 의미를 정리합니다. 단순한 신기술 소개가 아니라, 왜 이 모델이 “너무 강력해서” 조심스럽게 다뤄지고 있는지, 그리고 이것이 보안 산업 전반에 어떤 변화를 예고하는지를 중심으로 살펴봅니다.
Anthropic이 Claude Mythos를 공개하지 않은 이유
Anthropic은 최근 새로운 대규모 언어 모델 Claude Mythos를 발표했지만, 일반 사용자에게는 공개하지 않았습니다. 대신 **Project Glasswing**이라는 프로그램을 통해 극소수의 사전 파트너에게만 접근 권한을 부여했습니다.
Anthropic의 설명에 따르면 Claude Mythos는 범용 모델이지만, 사이버 보안 연구 능력이 기존 모델을 크게 상회하는 수준에 도달했습니다. 이로 인해 악의적인 활용 가능성을 무시할 수 없다고 판단했고, 소프트웨어 산업 전체가 대비할 시간을 벌기 위해 제한 공개를 선택했다는 입장입니다.
Claude Mythos의 보안 연구 역량은 어느 정도인가
Claude Mythos는 Anthropic의 기존 고성능 모델인 **Claude Opus 4.6**와 비교해도 완전히 다른 수준의 성능을 보였습니다.
Anthropic 내부 평가에 따르면, Opus 4.6은 취약점을 찾더라도 이를 실제 익스플로잇으로 발전시키는 데 거의 성공하지 못했습니다. 반면 Claude Mythos는 동일한 조건에서 수백 번 중 수백 건에 가까운 실질적인 익스플로잇을 만들어냈고, 일부는 레지스터 제어까지 달성했습니다.
이미 Mythos Preview는 주요 운영체제와 웹 브라우저 전반에서 수천 건의 고위험 취약점을 발견한 상태이며, 이는 단순한 코드 분석을 넘어 실제 공격 시나리오를 자동으로 구성할 수 있는 수준임을 보여줍니다.
취약점 ‘연결’ 능력이 의미하는 변화
Anthropic 연구진이 특히 강조한 부분은 취약점 체이닝(chaining) 능력입니다. 단일 취약점으로는 큰 피해를 주기 어려운 경우에도, Claude Mythos는 여러 취약점을 순차적으로 연결해 고도화된 공격 결과를 만들어냅니다.
예를 들어, 다음과 같은 작업이 가능하다고 설명됩니다.
- 여러 개의 사소한 취약점을 조합해 브라우저 샌드박스 탈출
- 레이스 컨디션과 주소 랜덤화 우회를 활용한 권한 상승
- 복잡한 ROP 체인을 구성해 원격 코드 실행 달성
이러한 작업은 과거에는 숙련된 보안 연구자가 오랜 시간에 걸쳐 수행하던 영역이었습니다. 이제는 AI가 이를 지치지 않고, 반복적으로 수행할 수 있게 된 것입니다.
실제 오픈소스 생태계에서 나타난 변화
이 변화는 이미 현장에서 감지되고 있습니다.
Linux 커널 유지관리자와 curl 프로젝트 메인테이너들은 최근 AI 기반 보안 리포트의 질이 급격히 달라졌다고 언급합니다.
과거에는 명백히 틀린 ‘AI 슬롭(sloppy)’ 리포트가 대부분이었다면, 이제는 정확하고 재현 가능한 취약점 보고가 폭증하고 있다는 것입니다. 그만큼 유지관리자들의 부담도 크게 늘어나고 있습니다.
실제로 OpenBSD에서는 27년간 존재했던 커널 취약점이 최근 수정됐는데, 이 역시 AI 기반 분석 결과와 무관하지 않은 것으로 보입니다.
Project Glasswing의 목적과 참여 파트너
Project Glasswing의 목적은 단순한 연구가 아닙니다. Anthropic은 이 프로젝트를 통해 전 세계 사이버 공격 표면의 상당 부분을 차지하는 핵심 시스템을 선제적으로 보호하는 것을 목표로 하고 있습니다.
주요 활동 영역은 다음과 같습니다.
- 로컬 취약점 탐지
- 바이너리 블랙박스 테스트
- 엔드포인트 보안 강화
- 침투 테스트 및 방어 전략 수립
이를 위해 Anthropic은 대규모 사용 크레딧과 오픈소스 보안 단체에 대한 직접 후원을 제공하고 있으며, 파트너로는 AWS, Apple, Microsoft, Google, 그리고 Linux Foundation 등이 참여하고 있습니다.
왜 “너무 위험해서 공개하지 않는다”는 판단이 설득력을 가지는가
AI 모델이 강력하다는 이유로 공개를 미루는 결정은 마케팅 전략으로 보일 수도 있습니다. 하지만 이번 사례는 단순한 과장이 아니라, 실제 산업 현장에서 체감되는 위협 증가와 맞물려 있습니다.
수십 년간 유지된 코드베이스에서 AI가 체계적으로 취약점을 발굴하고, 이를 실제 공격으로 자동 전환할 수 있다면, 방어 측의 준비 없이는 심각한 불균형이 발생할 수 있습니다. Anthropic이 말하는 “시간을 벌어야 한다”는 판단은 이런 맥락에서 이해할 수 있습니다.
Claude Mythos와 Project Glasswing은 단순한 신모델 발표가 아니라, AI와 사이버 보안의 관계가 질적으로 변하고 있음을 보여주는 신호입니다.
AI는 이제 취약점을 ‘도와서 찾는 도구’를 넘어, 인간 연구자를 압도하는 속도와 집요함을 가진 존재가 됐습니다.
당분간 Claude Mythos는 제한된 환경에서만 사용되겠지만, Anthropic이 밝힌 것처럼 결국 이 수준의 모델은 더 넓은 영역으로 확산될 가능성이 큽니다. 지금의 제한 공개는 그 미래를 대비하기 위한 준비 단계라고 볼 수 있습니다.
보안 관점에서 보면, 이는 위기이자 동시에 기회입니다. 얼마나 빨리, 그리고 얼마나 책임감 있게 이 변화를 받아들이느냐가 앞으로의 핵심 과제가 될 것입니다.
https://simonwillison.net/2026/Apr/7/project-glasswing/
Anthropic’s Project Glasswing—restricting Claude Mythos to security researchers—sounds necessary to me
Anthropic didn’t release their latest model, Claude Mythos (system card PDF), today. They have instead made it available to a very restricted set of preview partners under their newly announced …
simonwillison.net

'인공지능' 카테고리의 다른 글
| AutoBE와 Claude Code 비교 분석: 3세대 코딩 에이전트 아키텍처의 방향성 (0) | 2026.04.08 |
|---|---|
| 대규모 언어 모델은 감정을 느끼는가? 내부 메커니즘을 분석하고 제어하는 최신 연구 정리 (0) | 2026.04.08 |
| Claude Code 유출로 본 에이전틱 하네스 설계 패턴 12가지 정리 (0) | 2026.04.08 |
| GLM-5.1 장기 에이전트 코딩을 위한 차세대 대형 언어 모델 정리 (0) | 2026.04.08 |
| LM Studio Headless CLI와 Claude Code로 로컬에서 Google Gemma 4 실행하는 방법과 의미 (0) | 2026.04.08 |