
이 글은 AI 에이전트를 실제로 동작 가능한 시스템으로 만들기 위해 무엇이 필요한지를 중심으로,
OpenHarness와 그 위에서 동작하는 개인 AI 에이전트 ohmo를 설명합니다.
단순한 챗봇이 아닌, 장시간 세션을 유지하며 도구를 사용하고, 코드를 작성하고, 테스트와 PR까지 수행하는 에이전트가 어떤 구조로 구현되는지 기술적인 관점에서 정리합니다.
AI 에이전트의 한계와 Agent Harness의 필요성
대부분의 LLM 기반 도구는 여전히 “질문 → 답변” 구조에 머물러 있습니다.
모델은 똑똑하지만, 스스로 파일을 읽고, 명령을 실행하고, 이전 작업을 기억하며, 안전하게 행동할 수는 없습니다.
이 간극을 메우기 위해 등장한 개념이 Agent Harness입니다.
Agent Harness는 LLM을 감싸는 실행 인프라로, 다음 요소를 포함합니다.
- 도구 실행 능력 (hands)
- 파일·환경 관찰 능력 (eyes)
- 세션 간 기억 (memory)
- 권한과 안전 경계 (permissions)
즉, 모델은 ‘생각’을 담당하고, Harness는 ‘행동’을 담당합니다.
OpenHarness란 무엇인가
OpenHarness는 이 Agent Harness 개념을 경량화된 오픈소스 Python 구현체로 제공하는 프로젝트입니다.
연구 목적이 아닌, 실제 개발·운영 환경에서 AI 에이전트를 실행하는 것을 목표로 설계되었습니다.
OpenHarness의 핵심 목표는 다음과 같습니다.
- 실제 프로덕션 수준의 AI 에이전트 구조를 이해할 수 있게 할 것
- 도구, 메모리, 권한, 멀티 에이전트를 실험 가능한 형태로 제공할 것
- Claude 스타일의 기존 도구·플러그인 생태계를 그대로 활용할 수 있을 것
Agent Harness의 핵심 구조
1. Agent Loop 엔진
OpenHarness의 중심은 Agent Loop입니다.
이 루프는 다음 흐름을 반복합니다.
- 모델에 메시지와 도구 스펙을 전달
- 스트리밍 응답 수신
- 모델이 도구 호출을 결정
- 권한 검사 → 도구 실행 → 결과 반환
- 결과를 다시 모델 컨텍스트에 주입
이 구조 덕분에 에이전트는 스스로 다음 행동을 결정할 수 있으며,
Harness는 그 행동을 안전하고 관측 가능하게 실행합니다.
2. Tools와 Toolkit
OpenHarness는 43개 이상의 기본 도구를 제공합니다.
- 파일 I/O: 읽기, 쓰기, 편집, 검색
- 쉘 실행
- 웹 검색 및 fetch
- Notebook 셀 편집
- MCP(Model Context Protocol) 연동
- 에이전트 및 태스크 관리
모든 도구는 다음 특성을 가집니다.
- Pydantic 기반 입력 검증
- JSON Schema 자동 설명
- 실행 전 권한 검사
- 실행 전·후 Hook 지원
3. Skills 시스템
Skills는 필요할 때만 로드되는 지식 모듈입니다.
Markdown 파일 기반으로 정의되며, 모델이 상황에 맞게 불러옵니다.
예시 Skill:
- 코드 리뷰
- 디버깅
- 테스트 작성
- 커밋 메시지 생성
- PDF, Excel 처리
Claude의 anthropics/skills와 호환되기 때문에 기존 자산을 그대로 사용할 수 있습니다.
4. Context와 Memory 관리
OpenHarness는 장시간 세션을 전제로 설계되었습니다.
- CLAUDE.md 자동 탐색 및 컨텍스트 주입
- 컨텍스트 자동 압축(Auto-Compaction)
- MEMORY.md 기반의 영속 메모리
- 세션 이력 복원 및 재개
이를 통해 에이전트는 수 시간, 수 일 단위 작업도 중단 없이 이어갈 수 있습니다.
5. Permission과 Governance
AI 에이전트의 가장 중요한 요소 중 하나는 안전입니다.
OpenHarness는 다음을 제공합니다.
- 다단계 권한 모드(Default, Auto, Plan)
- 경로 단위 접근 제한
- 위험 명령 차단
- 도구 실행 전 사용자 승인 다이얼로그
- PreToolUse / PostToolUse Hook
이 구조로 인해 에이전트는 강력하지만 통제 가능한 상태로 유지됩니다.
6. 멀티 에이전트와 Swarm Coordination
OpenHarness는 단일 에이전트에 그치지 않습니다.
- 서브 에이전트 생성
- 작업 위임
- 팀 레지스트리
- 백그라운드 태스크 실행
이를 통해 하나의 문제를 여러 에이전트가 나누어 해결하는 Swarm 구조를 구성할 수 있습니다.
ohmo: 개인 AI 에이전트의 구현
ohmo는 OpenHarness 위에서 동작하는 개인 AI 에이전트 애플리케이션입니다.
핵심 특징은 다음과 같습니다.
- 단순 챗봇이 아닌, 장기 세션 기반 에이전트
- Slack, Telegram, Discord, Feishu 등 메신저 연동
- 코드 작성, 테스트 실행, PR 생성까지 자율 수행
- 기존 Claude Code 또는 Codex 구독 그대로 사용
- 별도의 API 키 불필요
ohmo는 로컬에 전용 워크스페이스를 생성하고,
에이전트의 성격, 사용자 정보, 장기 메모리를 파일 단위로 관리합니다.
OpenHarness와 ohmo 사용 흐름 예시
1. 설치 및 설정
- OpenHarness 설치 후 oh setup 실행
- 제공자 선택 및 인증만으로 초기 설정 완료
Claude, OpenAI, Codex, Copilot, Moonshot 등 다양한 백엔드 지원
2. CLI 기반 사용
- 단일 프롬프트 실행
- JSON 출력 및 스트리밍 이벤트 출력
- 스크립트 및 자동화 파이프라인에 활용 가능
3. ohmo 개인 에이전트 실행
- ohmo 초기화
- 채널 및 제공자 설정
- 게이트웨이 실행 후 메신저에서 바로 사용
에이전트는 대화를 넘어서 지속적인 작업 파트너로 동작합니다.
기술적 특장점 정리
- Agent Harness 개념을 구조적으로 구현한 오픈소스
- Claude 스타일 도구·플러그인 생태계와의 높은 호환성
- 장기 세션, 멀티 에이전트, 권한 모델을 기본 제공
- CLI, TUI, 메신저까지 연결되는 일관된 사용자 경험
- 연구용이 아닌 실제 개발 워크플로우 중심 설계
AI 에이전트의 다음 단계
AI 에이전트의 핵심은 모델이 아니라 인프라입니다.
OpenHarness는 “모델이 무엇을 할지 결정하고, 시스템이 그것을 안전하게 실행한다”는 구조를 명확히 보여줍니다.
ohmo는 그 구조가 개인 개발자의 일상 속에서 어떻게 작동할 수 있는지를 보여주는 사례입니다.
앞으로의 AI 에이전트는 더 똑똑해지는 것보다,
더 오래 기억하고, 더 안전하게 행동하며, 실제 일을 끝까지 해내는 방향으로 진화할 것입니다.
OpenHarness와 ohmo는 그 변화를 구체적인 코드와 구조로 제시하고 있습니다.
https://github.com/HKUDS/OpenHarness
GitHub - HKUDS/OpenHarness: "OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!"
"OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!" - HKUDS/OpenHarness
github.com

'인공지능' 카테고리의 다른 글
| AI 코딩 워크플로우를 표준화하는 Archon 기술 정리 (0) | 2026.04.15 |
|---|---|
| Claude Code와 Codex 실전 비교: 대규모 코드베이스에서 드러난 차이점과 선택 기준 (0) | 2026.04.15 |
| Neural Computer란 무엇인가: 실행 자체를 학습하는 새로운 컴퓨터 모델 (0) | 2026.04.14 |
| GitHub Stacked PRs로 대규모 코드 변경을 효율적으로 관리하는 방법 (0) | 2026.04.14 |
| Gemma 4를 Codex CLI 로컬 환경에서 실행해 본 실전 검증 정리 (0) | 2026.04.14 |