본문 바로가기

인공지능

Claude Code 컨텍스트 소비 98% 절감, Context Mode MCP 서버로 세션 6배 확장하는 방법

728x90
반응형
728x170

AI 에이전트를 활용해 개발을 하다 보면 어느 순간 갑자기 세션이 느려지거나, 컨텍스트 한도가 빠르게 소모되는 경험을 하게 됩니다. 특히 Claude Code와 MCP 도구를 함께 사용할 때 외부 도구의 원시 데이터가 그대로 컨텍스트에 쌓이면서 200K 토큰 한도가 빠르게 소진되는 문제가 발생합니다.

이번 글에서는 이러한 구조적 한계를 해결하기 위해 등장한 Context Mode MCP 서버(mksg.lu)의 개념과 동작 방식, 성능 개선 효과, 그리고 실제 사용 시 기대할 수 있는 변화까지 정리합니다. 단순한 압축 도구를 넘어, AI 에이전트의 세션 지속 시간을 6배까지 늘려주는 핵심 기술을 이해할 수 있습니다.

반응형

Claude Code와 MCP의 구조적 한계

외부 도구 호출 시 원시 데이터 덤프 문제

Claude Code의 MCP 도구 호출은 각 호출마다 외부 도구의 원시 데이터를 200K 컨텍스트 창에 그대로 덤프하는 구조입니다.

예를 들어 다음과 같은 데이터가 그대로 포함됩니다.

  • Playwright 스냅샷: 56KB
  • GitHub 이슈 20개: 59KB
  • 액세스 로그 500건: 45KB

이러한 호출이 반복되면 약 30분 사용 시 전체 컨텍스트의 40%가 소모됩니다.

더 큰 문제는 구조적 한계입니다.

  • MCP는 외부 도구 사용의 표준이 되었지만
  • 입력 정의와 출력 데이터 모두 컨텍스트를 채우는 구조
  • 81개 이상의 도구가 활성화된 상태에서는 첫 메시지 전 이미 72%(143K 토큰) 소비

결과적으로, 본격적인 작업을 시작하기도 전에 컨텍스트가 대부분 사용되는 상황이 발생합니다.


Context Mode의 구조와 동작 원리

Context Mode는 Claude Code와 도구 출력 사이에 위치하는 MCP 서버입니다. 핵심 목표는 원시 데이터를 그대로 전달하지 않고, 최소화된 형태로 전달하는 것입니다.

1. 출력 데이터 압축 및 필터링

  • 315KB 출력 → 5.4KB로 축소
  • 98% 컨텍스트 절감

원본 로그, 스냅샷, API 응답 등은 샌드박스 내부에 유지하고, 실제로 필요한 stdout 결과만 컨텍스트에 포함합니다.

2. 샌드박스 기반 격리 실행

각 execute 호출은 격리된 서브프로세스에서 실행됩니다.

  • 메모리 및 상태 공유 없음
  • 실행 간 완전 독립
  • 로그·스냅샷 등은 외부 유출 없이 내부 유지

이를 통해 보안성과 효율성을 동시에 확보합니다.

3. 다중 언어 런타임 지원

총 10개 언어 런타임을 지원합니다.

  • JavaScript
  • TypeScript
  • Python
  • Shell
  • Ruby
  • Go
  • Rust
  • PHP
  • Perl
  • R

특히 Bun 자동 감지를 통해 JS/TS 실행 속도가 3~5배 향상됩니다.

4. 인증 CLI 안전 전달

gh, aws, gcloud, kubectl, docker 등 인증이 필요한 CLI는 환경 변수 상속 방식으로 자격 증명을 전달합니다. 별도 노출 없이 안전하게 사용할 수 있습니다.


SQLite FTS5 기반 지식베이스 구조

Context Mode는 단순한 출력 압축 도구가 아니라, 지식 검색 최적화 기능까지 포함합니다.

인덱싱 방식

  • index 도구가 마크다운을 헤딩 단위로 분할
  • 코드 블록은 그대로 유지
  • SQLite FTS5 가상 테이블에 저장

검색 알고리즘

  • BM25 랭킹 알고리듬 적용
    • 단어 빈도
    • 역문서 빈도
    • 문서 길이 정규화
  • Porter stemming 적용
    • running, runs, ran → 동일 어근으로 매칭

search 및 fetch_and_index 특징

  • search 호출 시 요약이 아닌 정확한 코드 블록과 헤딩 계층 반환
  • fetch_and_index는 URL을 가져와 HTML을 마크다운으로 변환 후 인덱싱
  • 원본 페이지는 컨텍스트에 포함되지 않음

즉, 검색 정확도는 유지하면서 컨텍스트 소비는 최소화합니다.


실제 성능 수치 비교

11개 실제 시나리오 테스트 결과, 모든 출력이 1KB 이하로 유지되었습니다.

항목 기존 Context Mode 적용
Playwright 스냅샷 56KB 299B
GitHub 이슈 20개 59KB 1.1KB
액세스 로그 500건 45KB 155B
CSV 분석 500행 85KB 222B
Git 로그 153커밋 11.6KB 107B
리포지토리 조사 986KB 62KB

세션 전체 기준:

  • 315KB → 5.4KB
  • 세션 지속 시간 30분 → 3시간
  • 45분 후 남은 컨텍스트: 기존 60% → 99%

동일한 200K 토큰 한도에서 체감 성능이 완전히 달라집니다.


설치 및 사용 방법

설치 방식

  • Plugin Marketplace 통한 자동 라우팅 훅 지원
  • MCP 전용 설치 가능

설치 후 Claude Code를 재시작하면 바로 사용 가능합니다.

동작 방식의 변화

  • PreToolUse 훅이 자동으로 출력 라우팅
  • 서브에이전트는 batch_execute를 기본 도구로 사용
  • Bash 서브에이전트는 general-purpose로 업그레이드되어 MCP 도구 접근 가능

사용자는 기존과 동일한 방식으로 작업하지만, 내부적으로는 출력이 자동 압축 및 필터링됩니다.


개발 배경과 오픈소스 공개

MCP Directory & Hub를 운영하면서 모든 MCP 서버가 원시 데이터를 컨텍스트에 덤프하는 공통 패턴을 발견한 것이 출발점이었습니다.

Cloudflare의 Code Mode가 도구 정의를 압축한 것에서 착안해, 이를 출력 데이터 압축 방향으로 확장했습니다.

실제 Claude Code 세션에서 6배 더 오래 작업 가능함을 확인한 후 MIT 라이선스로 오픈소스 공개되었습니다.

GitHub: mksglu/claude-context-mode


728x90

Context Mode는 단순한 압축 도구가 아닙니다.

AI 에이전트의 가장 큰 병목인 “컨텍스트 창” 문제를 구조적으로 해결하는 아키텍처 개선입니다.

핵심 변화는 다음과 같습니다.

  • 외부 도구 출력 98% 절감
  • 세션 지속 시간 최대 6배 증가
  • 보안 격리 구조 적용
  • 정확한 코드 검색 기능 유지

AI 에이전트를 실무에 깊이 통합할수록 컨텍스트 관리는 필수가 됩니다. Context Mode는 동일한 토큰 한도 내에서 더 많은 작업을 가능하게 하며, 장시간 세션 기반의 자동화 및 분석 워크플로우에 큰 변화를 가져올 수 있습니다.

앞으로 AI 에이전트 환경에서 성능 최적화의 핵심은 모델 자체가 아니라, 컨텍스트를 어떻게 관리하느냐에 달려 있습니다. Context Mode는 그 해답 중 하나가 될 수 있습니다.

300x250

https://mksg.lu/blog/context-mode

 

Stop Burning Your Context Window — We Built Context Mode

MCP server that reduces Claude Code context consumption by 98%. 315 KB becomes 5.4 KB.

mksg.lu

728x90
반응형
그리드형