
개발 중 자리를 비우면 AI 에이전트의 작업 상태를 바로 확인하기 어렵습니다. 빌드가 끝났는지, 의사결정이 필요한지, 추가 입력이 필요한지 확인하려면 결국 화면 앞에 있어야 합니다. 이번 글에서는 Claude Code의 작업 완료나 의사결정 요청을 전화로 실시간 알림받고, 통화로 직접 작업을 지시할 수 있는 초소형 플러그인 ‘Call-me’를 소개합니다. 전체 구조, 동작 방식, 비용 구조, 그리고 기술적 특징을 정리해 보겠습니다.
Call-me란 무엇인가
Call-me는 Claude Code와 전화망을 연결해 주는 초소형 플러그인입니다. Claude가 작업을 완료하거나 사용자의 판단이 필요할 때 전화를 걸어 알림을 주고, 사용자는 음성으로 응답해 다음 작업을 지시할 수 있습니다.
핵심 목적은 다음과 같습니다.
- 작업 완료 또는 의사결정 요청을 전화로 알림
- 통화 중 음성 명령으로 Claude에게 추가 작업 지시
- 개발 중 자리를 비워도 실시간 피드백 수신
- 조깅, 이동 중 등 화면을 보지 못하는 상황에서도 AI와 상호작용
즉, 텍스트 기반 AI 에이전트를 음성 기반 인터페이스로 확장한 구조라고 볼 수 있습니다.
전체 아키텍처와 동작 구조
Call-me는 단순히 전화 연결만 하는 것이 아니라, AI 음성 처리와 로컬 서버 중계 구조를 포함합니다.
1. 전화 서비스 제공자
전화 연결은 Telnyx 또는 Twilio를 사용합니다.
- Telnyx
- Twilio 대비 약 50% 저렴하다고 알려짐
- 국내 지원 여부는 확인 필요
- Twilio
- 국내 사용 가능
- 아웃바운드 통화 요금: 분당 약 $0.007
- 전화번호 비용: 월 약 $1 수준
이 서비스가 실제 PSTN(전화망)과의 연결을 담당합니다.
2. 음성 처리: OpenAI API 활용
Call-me는 OpenAI API를 활용해 음성 처리를 수행합니다.
- STT (Speech-to-Text)
- 사용자의 음성을 텍스트로 변환
- TTS (Text-to-Speech)
- Claude의 텍스트 응답을 음성으로 변환
즉, 통화 중 사용자의 음성은 텍스트로 변환되어 Claude Code로 전달되고, Claude의 응답은 다시 음성으로 합성되어 사용자에게 들려집니다.
OpenAI STT/TTS 비용까지 포함하면 총 통화 비용은 약 $0.03~0.04/분 수준입니다.
3. MCP 서버의 역할
MCP 서버는 로컬에서 실행되며, Claude Code와 전화망 사이를 중계합니다.
주요 역할은 다음과 같습니다.
- Claude의 메시지를 음성으로 변환해 사용자에게 전달
- 사용자의 음성을 텍스트로 변환해 Claude로 반환
- 전화 서비스의 웹훅과 로컬 서버를 연결
이때 ngrok 터널링을 사용해 로컬 MCP 서버와 전화 서비스 간 웹훅 연결을 자동화합니다.
즉, 외부 전화 서비스가 로컬 환경에 접근할 수 있도록 안전한 터널을 구성하는 방식입니다.
통화 중 다중 회차 대화 지원
Call-me는 단순 알림형이 아니라, 다중 회차 대화를 지원합니다.
- Claude가 작업 결과를 설명
- 사용자가 추가 질문
- Claude가 웹 검색 등 추가 작업 수행
- 결과를 다시 음성으로 안내
통화 중에도 Claude는 웹 검색 등 다른 작업을 병행할 수 있습니다.
즉, 단순 IVR 수준이 아니라, 실시간 AI 에이전트 통화 시스템이라고 볼 수 있습니다.
사용 시나리오 예시
입력 정보 기반으로 정리한 간단한 사용 흐름 예시는 다음과 같습니다.
- Claude Code가 빌드 작업을 수행
- 작업 완료 후, Call-me 플러그인을 통해 사용자에게 전화 발신
- Claude의 메시지가 음성으로 재생
- 예: “빌드가 완료되었습니다. 배포를 진행할까요?”
- 사용자가 음성으로 응답
- “테스트 환경에 먼저 배포해줘.”
- STT를 통해 텍스트로 변환
- Claude Code가 해당 명령 수행
- 결과를 다시 음성으로 안내
이 과정이 통화 내에서 반복적으로 진행됩니다.
지원 기기 및 활용 환경
Call-me는 다양한 기기에서 사용할 수 있습니다.
- 스마트폰
- 스마트워치
- 유선전화
즉, 별도의 앱 UI 없이도 전화만 받을 수 있다면 사용 가능합니다. 이는 개발자나 운영자가 자리를 비운 상황에서도 AI와 상호작용할 수 있도록 확장성을 제공합니다.
비용 구조 정리
입력 정보 기준으로 정리하면 다음과 같습니다.
- 아웃바운드 통화: 약 $0.007/분
- 전화번호: 월 약 $1
- OpenAI STT/TTS 포함 총 비용: 약 $0.03~0.04/분
AI 음성 처리 비용이 포함되어도 분당 수십 센트 이하 수준으로, 짧은 알림 및 의사결정 통화 중심으로 사용하면 부담이 크지 않은 구조입니다.
기술적 특징 및 특장점
Call-me의 기술적 강점은 다음과 같습니다.
- 실시간 음성 기반 AI 상호작용
- 텍스트 중심 Claude Code를 전화 인터페이스로 확장
- 로컬 MCP 서버 기반 중계 구조
- Claude와 전화망 간 데이터 흐름 제어
- 메시지 → 음성 → 텍스트 → 메시지의 순환 처리
- 웹훅 자동화
- ngrok 터널링을 통한 외부-로컬 연결
- 다중 회차 대화 지원
- 단순 알림이 아닌 지속적 상호작용 가능
- 비용 효율적 구조
- 저렴한 전화 요금 + API 기반 음성 처리
Call-me는 Claude Code를 텍스트 기반 개발 도구에서 음성 기반 실시간 에이전트로 확장하는 플러그인입니다. 전화망과 OpenAI STT/TTS, 그리고 로컬 MCP 서버를 결합해, 개발자가 화면 앞에 있지 않아도 AI와 상호작용할 수 있는 환경을 제공합니다.
특히 다음과 같은 가능성을 보여줍니다.
- 이동 중에도 AI 작업 제어
- DevOps 알림 시스템의 음성화
- AI 에이전트의 멀티모달 인터페이스 확장
앞으로 AI 에이전트는 단순히 채팅창 안에 머무르지 않고, 전화·음성·웨어러블 기기 등 다양한 인터페이스로 확장될 가능성이 높습니다. Call-me는 그 방향성을 보여주는 사례로, AI와의 상호작용 방식을 한 단계 넓히는 시도라고 볼 수 있습니다.
https://github.com/ZeframLou/call-me

'인공지능' 카테고리의 다른 글
| Microsoft Copilot Tasks: 대화형 AI를 넘어 실행하는 AI로의 진화 (0) | 2026.03.02 |
|---|---|
| EdgeQuake: Rust 기반 고성능 Graph-RAG 프레임워크로 구현하는 지능형 지식 그래프 검색 (0) | 2026.03.01 |
| Perplexity Computer: 멀티 모델 오케스트레이션으로 완성된 차세대 AI 워크플로우 시스템 (0) | 2026.02.27 |
| Auto-Claude: 자율형 멀티 세션 AI 코딩 프레임워크의 구조와 핵심 기능 분석 (0) | 2026.02.27 |
| 테스트 코드가 새로운 해자(Moat)가 되는 시대: AI가 바꾸는 오픈소스 경쟁 전략 (0) | 2026.02.27 |