AI 에이전트가 똑똑해지고 있는데, 정작 서로 말이 안 통한다면 무슨 소용일까요?
대규모 언어 모델(LLM) 기반 에이전트들이 산업 전반에서 활용되고 있지만, 이들이 외부 도구나 서로 간에 소통하는 표준 프로토콜은 여전히 미비한 상황입니다. 그 결과, 에이전트 간 협업은 복잡하고 비효율적이며, 개발자 입장에서도 시스템 통합에 애를 먹기 일쑤죠.
이번 블로그에서는 이 문제를 해결하고자 제안된 AI 에이전트 프로토콜의 개념, 종류, 주요 사례, 성능 비교 기준, 그리고 미래 방향까지 총망라해 소개합니다.
에이전트 간 협업의 시대를 여는 핵심 인프라를 제대로 이해하고 싶은 분이라면, 이 글이 좋은 출발점이 될 것입니다.
🧠 LLM 에이전트란 무엇인가?
LLM 에이전트는 대규모 언어 모델(예: GPT, Claude 등)을 기반으로 하여, 스스로 계획을 세우고 외부 도구를 활용해 작업을 수행하는 자율 시스템입니다.
이들의 구성 요소는 다음과 같습니다:
- Foundation Model: 언어 이해 및 생성의 핵심
- Memory Systems: 과거 상호작용 기억
- Planning Module: 문제 해결 전략 수립
- Tool-Using & Action Execution: 외부 API나 툴 호출
LangChain, Semantic Kernel 등 프레임워크가 이러한 시스템을 지원하고 있으며, 이제는 복잡한 작업 흐름을 스스로 처리할 수 있는 LLM 기반 에이전트 시대가 본격화되고 있습니다.
📡 에이전트 프로토콜이란 무엇인가?
에이전트 프로토콜은 에이전트와 외부 시스템, 또는 에이전트 간 통신을 위한 표준화된 방식을 말합니다. 단순한 API 호출을 넘어, 맥락 공유, 역할 분담, 보안 관리까지 포함하는 구조화된 통신 프레임워크입니다.
🔍 왜 필요한가?
- 파편화된 시스템 간 연결을 쉽게
- 민감 데이터 보호 및 보안성 강화
- 복잡한 협업 시나리오 처리
- 다양한 도구/에이전트를 통합하는 집단 지능 생태계 기반 마련
🧩 에이전트 프로토콜 분류 체계
본 연구에서는 에이전트 프로토콜을 다음과 같이 2개의 기준 축으로 분류합니다:
1. Object Orientation 기준
- Context-Oriented Protocols
→ 에이전트가 외부 도구/데이터에서 맥락(Context)을 얻는 방식을 표준화
→ 예: MCP, agents.json - Inter-Agent Protocols
→ 에이전트 간 협업을 위한 통신 방식 정의
→ 예: ANP, A2A, Agora
2. Application Scenario 기준
- General-Purpose Protocols
→ 다양한 용도에 쓸 수 있는 범용 프로토콜 - Domain-Specific Protocols
→ 특정 도메인(예: 로봇, 사람, 시스템) 맞춤 프로토콜
이 두 축을 조합하면, 다음과 같은 유형들이 나옵니다:
General-Purpose | Domain-Specific | |
Context-Oriented | MCP | agents.json |
Inter-Agent | ANP, A2A, Agora | LOKA, PXP, CrowdES 등 |
📌 주요 프로토콜 사례 분석
✅ MCP (Anthropic)
- 범용 컨텍스트 프로토콜
- LLM 응답과 도구 호출 분리 → 개인정보 보호
- Host, Client, Server, Resource 간 역할 분리로 구조적 호출 가능
예시: 여행 계획 시, Host 에이전트가 ‘항공권 정보 필요’ 판단 → Client가 해당 API 설명 제공 → 실행 → 결과 수신 및 요약 후 사용자 전달
✅ A2A (Google)
- 기업용 에이전트 간 프로토콜
- HTTP, JSON-RPC, SSE 등 활용
- 비동기/모듈화 아키텍처
- Agent Card, Task, Artifact 등 독자적 개념 도입
✅ ANP (Open Source Community)
- 분산 신원, 암호화, 메타 프로토콜을 통한 자율 협상
- Agent Internet 비전 실현 기반
- Agora, LMOS 등과 계층 아키텍처 공유
✅ agents.json (WildCardAI)
- 도메인 특화 Context-Oriented
- 웹사이트가 API/워크플로우 선언 → 에이전트가 쉽게 인터페이스 구성 가능
✅ PXP, LOKA, CrowdES 등
- 사람, 로봇, 시스템과의 상호작용을 위한 특화 프로토콜
- PXP: 해석 가능한 인간-에이전트 커뮤니케이션
- LOKA: 윤리, 책임 기반 구조
- CrowdES: 군중 시뮬레이션 로봇 상호작용
📊 에이전트 프로토콜 성능 비교 지표
프로토콜을 선택하거나 평가할 때 고려할 수 있는 성능 지표는 다음과 같습니다:
- Efficiency: TPS, 자원 소비 등
- Scalability: 노드/링크 확장성
- Security: 인증, 접근 제어, 민감 정보 보호
- Reliability: 재전송, 연결 유지 등
- Extensibility: 호환성, 유연성
- Operability: 코드 복잡성, 배포 난이도
- Interoperability: 다양한 시스템 간 호환성
🧪 MCP vs A2A vs ANP vs Agora: 여행 계획 시나리오 비교
프로토콜 | 구조 | 장점 | 단점 |
MCP | 중앙집중형 | 단순함, 보안 강화 | Host 의존도 높음 |
A2A | 분산형 | 유연성, 직접 협업 가능 | 복잡도 증가 |
ANP | 다중 도메인 | 표준화된 상호 작용, 자율 협상 | 복잡한 계층 구조 |
Agora | 자연어 기반 | 유연한 처리, 적응성 높음 | 구조화된 커뮤니케이션은 어려움 |
에이전트 인터넷의 지평
- 단기: 벤치마크 표준화, 프라이버시 보호 프로토콜, 메시 기반 그룹 통신
- 중기: 프로토콜 내재화, 계층적 아키텍처, 동적 구성
- 장기: 집단 지능 확장, Agent Data Network 출현
AI 에이전트의 성능은 이제 모델 그 자체보다, 어떻게 연결되고 소통하느냐에 달려 있습니다.
본 블로그에서 살펴본 다양한 프로토콜은 이러한 연결성의 중심에 있으며, 앞으로 등장할 진화형 프로토콜과 집단 지능 네트워크의 기반이 될 것입니다.
표준화된 에이전트 프로토콜은 AI 도구들이 진짜 협업하고, 책임 있게 판단하며, 자율적으로 문제를 해결하는 세상으로 향하는 첫걸음입니다.
A Survey of AI Agent Protocols
A Survey of AI Agent Protocols Yingxuan Yang Huacan Chai Yuanyi Song Siyuan Qi Muning Wen Ning Li Junwei Liao Haoyi Hu Jianghao Lin Corresponding author. Gaowei Chang† Weiwen Liu Ying Wen Yong Yu Weinan Zhang Shanghai Jiao Tong University †ANP Communit
arxiv.org
'인공지능' 카테고리의 다른 글
업무 효율을 바꾸는 도구, Fellou: 크로스 플랫폼 자동화와 딥서치의 미래 (0) | 2025.05.12 |
---|---|
2025년 생산성 향상을 위한 궁극적인 가이드: 최고의 MCP 서버 10선 (2) | 2025.05.12 |
로컬에서도 이미지 인식이 가능하다? Llama.cpp의 멀티모달 기능 지원 시작 (0) | 2025.05.11 |
자연어로 Kubernetes를 다룬다고? kubectl-ai로 명령어 스트레스를 줄이자 (0) | 2025.05.11 |
프롬프트 블로트를 극복하는 LLM 도구 선택의 정답, RAG-MCP란 무엇인가? (0) | 2025.05.11 |