이 글은 **Andrej Karpathy**가 최근 유튜브를 통해 공유한 내용을 바탕으로, 코드 에이전트의 등장으로 변화하고 있는 소프트웨어 개발 방식, AutoResearch라는 새로운 연구 프레임워크, 그리고 현재 AI 지능의 구조적 한계와 미래 방향성을 정리한 글입니다.
단순히 “AI가 코드를 잘 짠다”는 이야기가 아니라, 개발자의 역할 자체가 어떻게 바뀌고 있는지, 연구와 자동화의 병목이 어디로 이동했는지, 그리고 앞으로 어떤 기회와 과제가 남아 있는지를 이해하는 데 목적이 있습니다.
코드 에이전트 시대의 도래와 개발 방식의 전환
2024년 12월을 기점으로 소프트웨어 개발의 기본 작업 방식은 급격히 변했습니다.
직접 코드를 타이핑하는 비중은 체감상 80%에서 20%, 그리고 거의 0%에 가까운 수준으로 줄어들고 있습니다.
과거에는 키보드 타이핑 속도가 생산성의 병목이었다면, 이제는 에이전트에게 무엇을, 어떻게 시킬 것인가를 설명하는 능력이 핵심 역량이 되었습니다.
문제는 대부분의 사람들이 이 변화가 이미 일어났다는 사실 자체를 아직 실감하지 못하고 있다는 점입니다.
병렬 에이전트 운영과 숙련도의 중요성
이제 개발의 단위는 코드 한 줄이나 함수 하나가 아닙니다.
“기능 하나”가 최소 작업 단위가 되었고, 이를 여러 에이전트에 병렬로 나눠 맡기는 방식이 일반화되고 있습니다.
예를 들어 한 에이전트는 리서치를 담당하고, 다른 에이전트는 구현을, 또 다른 에이전트는 전체 설계를 맡는 식입니다.
이 과정에서 중요한 점은, 에이전트가 기대만큼 잘 작동하지 않을 때 그 원인이 모델 성능이 아니라 사용자의 숙련도인 경우가 대부분이라는 사실입니다.
에이전트에게 제공하는 지시 문서(MD 파일), 메모리 구조, 작업 범위 정의가 부족하면 결과도 불안정해집니다.
이제 개발자는 코드를 짜는 사람이 아니라, 토큰 처리량을 지휘하는 사람에 가까워지고 있습니다.
에이전트의 성격과 지속성: OpenClaw 사례
에이전트의 “성격”은 생산성에 큰 영향을 줍니다.
지속적으로 자율 작업을 수행하는 구조를 가진 OpenClaw는, 사용자가 붙어 있지 않아도 샌드박스 안에서 일을 계속 진행합니다.
특히 메모리 시스템이 단순 압축 수준을 넘어서 정교하게 설계되어 있다는 점이 기존 에이전트들과 다릅니다.
또한 에이전트의 반응 톤과 태도 역시 중요합니다.
- 어떤 에이전트는 팀원처럼 함께 고민하는 느낌을 주고
- 어떤 에이전트는 매우 건조하게 결과만 전달하며
- 어떤 에이전트는 칭찬과 피드백을 절제해 사용자의 동기를 자극합니다
이 차이는 단순한 UX 문제가 아니라, 사용자가 에이전트를 얼마나 적극적으로 활용하느냐에 직접적인 영향을 줍니다.
집요정 Dobby: 에이전트 기반 홈 오토메이션의 가능성
OpenClaw를 활용한 대표적인 사례가 ‘도비, 집요정 Claw’입니다.
이 에이전트는 로컬 네트워크를 탐색해 스마트홈 서브시스템을 자동으로 파악하고, API를 역공학해 제어까지 수행합니다.
자연어로 “잘 시간이야”라고 말하면 조명이 모두 꺼지고,
외부 카메라의 변화는 비전 모델로 분석되어 메시지로 알림이 전송됩니다.
중요한 점은, 이 과정에서 여러 개의 전용 앱이 완전히 불필요해졌다는 것입니다.
앱의 종말과 Agent-First 세계관
이 사례가 시사하는 바는 분명합니다.
앞으로 고객은 사람이 아니라 사람을 대신하는 에이전트가 됩니다.
따라서 UI 중심의 앱보다는, 에이전트가 직접 호출할 수 있는 API가 핵심 자산이 됩니다.
맞춤형 앱을 계속 만드는 방식은 과잉 생산이 되고 있으며, 에이전트 우선(agent-first) 구조로의 전환이 요구되고 있습니다.
AutoResearch: 연구자를 루프에서 제거하다
**AutoResearch**의 핵심 아이디어는 명확합니다.
토큰 처리량을 극대화하려면, 인간이 병목에서 빠져야 한다는 것입니다.
AutoResearch는 연구자가 직접 개입하지 않아도 에이전트가 실험을 반복하며 최적화를 탐색하도록 설계되었습니다.
실제로 숙련된 연구자가 이미 충분히 조정했다고 판단한 모델에서도, 하룻밤 사이에 놓쳤던 하이퍼파라미터 조합을 찾아냈습니다.
다만 이 방식은 객관적 평가 지표가 명확한 영역에서 가장 잘 작동하며, 모델의 가장자리에서는 아직 거칠다는 한계도 존재합니다.
들쭉날쭉한 AI 지능과 종분화의 필요성
현재 AI 모델은 코드와 수학처럼 검증 가능한 영역에서는 뛰어나지만,
농담이나 창의적 표현처럼 검증이 어려운 영역에서는 몇 년 전 수준에 머물러 있습니다.
이는 지능이 일반화되고 있기 때문이 아니라, 전문화가 들쭉날쭉하게 진행되고 있기 때문입니다.
하나의 거대한 모델에 모든 지능을 담으려는 단일 문화(monoculture) 대신,
도메인별로 특화된 작은 모델들의 공존, 즉 지능의 종분화가 필요하다는 주장으로 이어집니다.
오픈 소스와 Frontier Labs의 균형
클로즈드 모델이 여전히 선두에 있지만, 오픈 소스 모델과의 격차는 빠르게 줄어들고 있습니다.
대부분의 소비자 사용 사례는 오픈 소스 모델로도 충분히 커버 가능하며, 로컬 실행도 현실적인 목표가 되고 있습니다.
반면 노벨상급 연구나 초대형 프로젝트는 여전히 Frontier Labs의 역할이 중요합니다.
문제는 지능이 소수의 연구소에 지나치게 집중될 때 발생하는 시스템적 위험입니다.
이 글에서 살펴본 변화의 핵심은 다음과 같습니다.
- 코드를 직접 작성하는 시대에서, 에이전트를 지휘하는 시대로 전환 중
- 생산성의 병목은 모델이 아니라 사람의 숙련도
- 연구와 개발 모두에서 인간을 루프에서 제거하려는 시도 가속
- AI 지능은 일반화가 아니라 전문화의 방향으로 진화
- 디지털 영역의 변화가 물리적 세계로 확장될 가능성
앞으로의 경쟁력은 “얼마나 코드를 잘 짜느냐”가 아니라,
얼마나 잘 설계된 의도를 에이전트에게 전달할 수 있느냐에 달려 있습니다.
이 변화는 이미 시작되었고, 인식하는 사람과 그렇지 못한 사람 사이의 격차는 점점 더 벌어질 가능성이 큽니다.
https://www.youtube.com/watch?v=kwSVtQ7dziU

'인공지능' 카테고리의 다른 글
| pymatgen으로 구현하는 계산 재료과학 실전 분석 가이드 - 결정 구조 생성부터 대칭성·상평형도 분석까지 단계별 정리 (0) | 2026.03.23 |
|---|---|
| Vercel, 코딩 에이전트를 위한 플러그인 출시 - AI 코딩 에이전트에 Vercel 플랫폼 지식을 실시간으로 연결하다 (0) | 2026.03.23 |
| Cursor Composer 2 모델 논란 정리: Kimi K2.5 기반 의혹부터 공식 협력 확인까지 (0) | 2026.03.23 |
| Cursor Composer 2 출시: 코딩 특화 AI 모델의 성능 도약과 가격 경쟁력 분석 (0) | 2026.03.23 |
| KiloClaw 호스팅 AI 비서 완벽 가이드: OpenClaw를 60초 만에 쓰는 방법 (0) | 2026.03.23 |