
이 글은 Claude Code Observability Stack이 무엇인지, 어떤 배경에서 등장했으며, 이를 통해 무엇을 모니터링할 수 있는지 정리한 기술 블로그입니다. Claude Code 사용 환경에서 발생하는 비용, API 성능, 개발 생산성을 한눈에 파악하기 위해 OpenTelemetry, Prometheus, Loki, Grafana를 결합한 관측성(Observability) 스택의 구조와 특징, 그리고 실제 사용 방법까지 입력된 정보를 기반으로 설명합니다. AI 기반 개발 도구를 팀 단위로 운영하거나 비용과 성과를 함께 관리해야 하는 분들에게 특히 참고가 될 수 있습니다.
Claude Code Observability Stack이란 무엇인가
Claude Code Observability Stack은 Claude Code의 사용량, 성능, 비용을 종합적으로 모니터링하기 위한 관측성 솔루션입니다.
Claude Code Observability Documentation에서 권장하는 방식을 그대로 구현해, AI 보조 개발 워크플로우에 대한 깊이 있는 인사이트를 제공합니다.
이 스택의 핵심 목적은 다음과 같습니다.
- Claude 모델별 비용과 토큰 사용량을 정확히 추적
- 개발자 세션, 도구 사용, 코드 변경량 등 생산성 지표 분석
- API 지연, 오류, 병목 구간을 실시간으로 파악
왜 Claude Code에 Observability가 필요한가
Claude Code를 팀 단위로 사용하다 보면 이런 질문이 생깁니다.
- 어떤 모델에서 비용이 가장 많이 발생하고 있는가
- 실제 API 요청 수와 토큰 사용 효율은 어떤가
- AI 도구가 개발 생산성에 얼마나 기여하고 있는가
- 성능 저하나 오류는 언제, 어떤 조건에서 발생하는가
Claude Code Observability Stack은 이러한 질문에 데이터 기반으로 답할 수 있게 해주는 구조를 제공합니다. 단순 로그 확인을 넘어, 비용·성능·활동 데이터를 연결해 분석할 수 있다는 점이 핵심입니다.
주요 기능 정리
비용 및 사용량 분석
- Claude 모델별 비용 비교
- API 요청 수 추적
- 토큰 사용량 상세 분석 (입력, 출력, 캐시, 생성 토큰)
이를 통해 모델 선택에 따른 비용 차이와 토큰 효율성을 명확히 파악할 수 있습니다.
사용자 활동 및 생산성 분석
- 세션 단위 활동 추적
- 사용된 Claude Code 도구 분석
- 코드 변경 라인 수, 커밋 수, PR 생성 수 측정
AI 도구가 실제 개발 흐름에 어떤 영향을 주고 있는지 수치로 확인할 수 있습니다.
성능 및 오류 모니터링
- API 지연 시간(Latency) 측정
- 요청 성공률과 오류율 추적
- 병목 구간 식별
운영 환경에서의 안정성과 성능 이슈를 빠르게 파악할 수 있습니다.
아키텍처 구성
Claude Code Observability Stack은 다음과 같은 구조로 동작합니다.
Claude Code
↓
OpenTelemetry Collector
↓
Prometheus (메트릭)
Loki (이벤트/로그)
↓
Grafana (시각화 및 분석)
구성 요소별 역할
| 서비스 | 역할 | 포트 | UI |
| OpenTelemetry Collector | 메트릭 및 로그 수집 | 4317, 4318 | 없음 |
| Prometheus | 메트릭 저장 및 조회 | 9090 | localhost:9090 |
| Loki | 로그 및 이벤트 저장 | 3100 | 없음 |
| Grafana | 대시보드 시각화 | 3000 | localhost:3000 |
Grafana 대시보드 구성
Grafana 대시보드는 Claude Code Observability 문서 권장 사항에 따라 다음 섹션으로 구성됩니다.
Overview
- 활성 세션 수
- 총 비용
- 토큰 사용량
- 변경된 코드 라인 수
Cost & Usage Analysis
- 모델별 비용 추이
- 토큰 유형별 사용량
- 모델 버전별 API 요청 수
Tool Usage & Performance
- 도구 사용 빈도
- 성공률
- 실행 시간 분석
Performance & Errors
- 모델별 API 지연 시간
- 오류 발생률
User Activity & Productivity
- 커밋, PR, 코드 변경량
- 사용자 활동 패턴
Event Logs
- 실시간 도구 실행 이벤트
- API 오류 로그 분석
수집되는 주요 메트릭과 이벤트
핵심 메트릭
- claude_code.session.count : CLI 세션 수
- claude_code.lines_of_code.count : 변경된 코드 라인 수
- claude_code.pull_request.count : 생성된 PR 수
- claude_code.commit.count : 커밋 수
- claude_code.cost.usage : 모델별 비용
- claude_code.token.usage : 토큰 사용량
- claude_code.code_edit_tool.decision : 도구 권한 결정
이벤트 데이터
- 사용자 프롬프트
- 도구 실행 결과 및 소요 시간
- API 요청 및 오류 정보
- 도구 권한 승인/거부 이벤트
고급 설정과 운영 고려사항
- 여러 Exporter 동시 사용 가능 (OTLP, Prometheus)
- 사용자 프롬프트 로그 수집 여부 제어
- 세션 ID, 계정 UUID 포함 여부 설정으로 카디널리티 관리
- 메트릭은 Prometheus, 이벤트는 Loki 사용 권장
- 분석 목적에 맞춘 데이터 보존 기간 설정 가능
활용 시나리오
엔지니어링 팀
- 팀·프로젝트별 AI 비용 관리
- 개발 속도 및 생산성 정량화
- Claude Code 기능 활용도 분석
플랫폼 팀
- 사용량 증가에 따른 인프라 용량 계획
- API 성능 및 SLA 모니터링
- 이상 사용 패턴 감지
관리 및 의사결정자
- AI 도입에 따른 ROI 분석
- 조직 내 활용도 파악
- 비용 통제 및 전략적 투자 판단
Claude Code Observability Stack은 AI 보조 개발 환경을 단순히 사용하는 수준을 넘어, 운영하고 최적화하기 위한 기반을 제공합니다.
비용, 성능, 생산성을 하나의 흐름으로 연결해 보여주기 때문에, AI 도구 활용에 대한 막연한 감각이 아닌 측정 가능한 데이터 기반 의사결정이 가능해집니다.
앞으로 Claude Code를 조직 단위로 활용하고자 한다면, 이 관측성 스택은 비용 관리와 성과 측정 모두에서 중요한 기준점이 될 수 있습니다.
https://github.com/ColeMurray/claude-code-otel/
GitHub - ColeMurray/claude-code-otel: A comprehensive observability solution for monitoring Claude Code usage, performance, and
A comprehensive observability solution for monitoring Claude Code usage, performance, and costs. - ColeMurray/claude-code-otel
github.com

'인공지능' 카테고리의 다른 글
| Anthropic Agent Skills 공개 표준화: AI 에이전트 워크플로우의 새로운 기준 (0) | 2025.12.21 |
|---|---|
| CrewAI와 Gemini를 활용한 자율 멀티 에이전트 리서치·글쓰기 파이프라인 구성 방법 (0) | 2025.12.19 |
| GPT-5.2-Codex 공개, 현실 세계 소프트웨어 엔지니어링과 사이버 보안을 겨냥한 에이전트형 코딩 모델 (0) | 2025.12.19 |
| FunctionGemma: 엣지 환경을 위한 함수 호출 특화 경량 AI 모델 정리 (0) | 2025.12.19 |
| 스마트폰에서 LLM을 직접 실행하는 방법: ExecuTorch 기반 iOS·Android 온디바이스 배포 가이드 (0) | 2025.12.18 |