본문 바로가기

인공지능

Vibe Coding과 Agentic Engineering의 경계가 흐려지는 이유와 소프트웨어 개발의 변화

728x90
반응형
728x170

이 글은 최근 AI 코딩 도구의 발전으로 vibe codingagentic engineering의 경계가 어떻게 흐려지고 있는지, 그리고 그 변화가 소프트웨어 개발 방식과 평가 기준, 엔지니어의 역할에 어떤 영향을 미치고 있는지를 정리한 글입니다.
코드를 얼마나 직접 검토해야 하는지, AI가 만들어낸 결과물을 어디까지 신뢰할 수 있는지, 그리고 앞으로 소프트웨어 품질을 무엇으로 판단해야 하는지에 대한 문제를 현실적인 사례를 통해 살펴봅니다.

반응형

Vibe Coding과 Agentic Engineering이란 무엇인가

Vibe Coding의 개념과 특징

Vibe coding은 코드를 거의 보지 않고, 원하는 결과가 나오면 그대로 받아들이는 방식의 개발 접근입니다.
프로그래밍에 대한 깊은 이해가 없어도 “이런 기능을 만들어 달라”고 요청하고, 동작하면 채택하고 아니면 다시 요청하는 식으로 반복합니다.

이 방식은 개인 도구나 실험적인 프로젝트처럼, 문제가 생겨도 피해가 본인에게만 돌아오는 경우에는 충분히 유용할 수 있습니다. 빠르게 아이디어를 검증하고 결과물을 확인하는 데에는 효율적이기 때문입니다.
하지만 다른 사람의 데이터, 경험, 업무에 영향을 미치는 소프트웨어에서는 책임이 결여된 방식으로 보일 수 있습니다.

Agentic Engineering의 개념과 목표

Agentic engineering은 전문 소프트웨어 엔지니어가 AI 코딩 에이전트를 활용하되, 보안, 유지보수성, 운영, 성능 같은 제약 조건을 명확히 이해한 상태에서 사용하는 접근입니다.
목표는 단순히 더 많은 코드를 빠르게 만드는 것이 아니라, 더 높은 품질의 프로덕션 시스템을 더 빠르게 만드는 것입니다.

이 접근에서는 AI가 생산성을 크게 높여 주지만, 최종 책임과 판단은 여전히 엔지니어에게 있습니다.


신뢰도가 높아진 코딩 에이전트와 코드 검토의 변화

최근 코딩 에이전트는 JSON API 엔드포인트 생성, SQL 쿼리 작성, 자동화 테스트 추가, 문서화까지 반복적으로 안정적인 결과를 만들어냅니다.
이런 경험이 쌓이면 “이번에도 제대로 만들었을 것”이라는 확신이 생기고, 생성된 모든 코드 줄을 검토하지 않게 되는 순간이 찾아옵니다.

문제는 여기서 발생합니다.
코드를 직접 읽지 않았다면, 그 결과물을 프로덕션에 사용하는 것이 과연 책임 있는 판단인지에 대한 불안과 죄책감이 남습니다.

이 상황은 대규모 조직에서 다른 팀이 제공하는 내부 서비스를 사용하는 방식과도 닮아 있습니다.
보통은 문서를 보고 실제로 사용해 본 뒤 기능을 출시하고, 문제가 생길 때에야 내부 코드를 들여다봅니다. 대부분의 시간 동안 해당 서비스는 반쯤 블랙박스로 취급됩니다.

하지만 사람 팀과 달리, 코딩 에이전트에는 전문적 평판이나 책임(accountability)이 없습니다.
그럼에도 반복적으로 단순한 작업을 잘 처리하면서 신뢰를 쌓고 있고, 이 과정에는 ‘일탈의 정상화’라는 위험 요소가 숨어 있습니다. 잘 작동할 때마다 신뢰는 커지지만, 잘못된 순간에 과신하면 피해도 함께 커집니다.


소프트웨어 품질을 판단하기 어려워진 시대

과거에는 Git 저장소에 커밋이 많고, README가 잘 정리돼 있으며, 자동화 테스트가 갖춰져 있다면 상당한 시간과 주의가 투입된 프로젝트라고 판단하기 쉬웠습니다.
하지만 이제는 이런 조건을 모두 갖춘 저장소를 30분 만에 만드는 것도 가능합니다.

겉모습만으로는 오랜 시간 다듬어진 프로젝트와 빠르게 생성된 결과물을 구분하기가 매우 어려워졌습니다.
이 때문에 점점 더 중요해지는 기준은 누군가가 그 소프트웨어를 실제로 꾸준히 사용했는지입니다.

완벽하지 않은 vibe coding 결과물이라도, 만든 사람이 지난 몇 주 동안 매일 사용해 왔다면 거의 실행해 보지 않은 채 만들어진 결과물보다 훨씬 더 신뢰할 수 있습니다.
테스트와 문서의 양보다, 실제 사용 경험이 품질을 판단하는 핵심 지표가 되고 있습니다.


병목은 더 이상 코드 작성에 있지 않다

하루에 200줄을 작성하던 환경에서 2,000줄을 작성할 수 있게 되면, 소프트웨어 개발 생애주기의 다른 부분이 병목이 됩니다.
설계, 검증, 운영, 그리고 실제 사용 단계가 그 대상입니다.

기존의 디자인 프로세스는 “설계를 반드시 처음부터 맞춰야 한다”는 전제를 깔고 있었습니다.
잘못 설계된 상태로 몇 달을 개발하면 비용이 너무 크기 때문입니다. 하지만 빌드 속도가 극적으로 빨라진 환경에서는, 잘못됐을 때의 비용이 낮아지고 더 많은 실험과 위험 감수가 가능해집니다.

이는 개발 프로세스 전반의 사고방식 자체가 바뀌고 있음을 의미합니다.


그럼에도 소프트웨어 엔지니어의 역할은 사라지지 않는다

AI 도구와의 대화는 여전히 많은 사람에게 이해하기 어려운 ‘전문 언어’에 가깝습니다.
무엇을 만들고 있는지, 어떤 위험이 있는지, 어디를 검증해야 하는지를 아는 사람만이 이 도구들을 제대로 활용할 수 있습니다.

AI는 소프트웨어 엔지니어의 경험을 대체하기보다 증폭합니다.
경험 있는 엔지니어는 AI와 함께 훨씬 더 빠르게 움직일 수 있지만, 목표 자체가 쉬워지는 것은 아닙니다. 모든 도구가 주어져도 소프트웨어 제작은 여전히 어렵습니다.

이는 배관 영상을 많이 본다고 해서 모두가 배관공이 되지 않는 것과 비슷합니다. 직접 할 수는 있지만, 중요한 문제일수록 전문성을 가진 사람을 선호하게 됩니다.


SaaS와 사내 개발에서도 달라지지 않는 기준

AI 덕분에 기업이 SaaS를 쓰지 않고 자체 솔루션을 만드는 장벽은 낮아졌습니다.
하지만 여기서도 기준은 동일합니다. 실제 사용으로 검증된 소프트웨어인가 하는 점입니다.

개인 프로젝트라면 최소 몇 주 동안 만든 사람이 직접 사용한 도구를 선호하게 됩니다.
엔터프라이즈 환경이라면, 여러 대기업이 수개월 동안 성공적으로 사용한 이력이 없는 솔루션에는 쉽게 위험을 감수하지 않습니다.

결국 기술이 아무리 발전해도, “실제로 잘 작동해 왔는가”라는 질문은 사라지지 않습니다.


728x90

Vibe coding과 agentic engineering의 경계는 AI 코딩 에이전트의 신뢰도가 높아지면서 점점 흐려지고 있습니다.
이 변화는 코드 검토 방식, 소프트웨어 평가 기준, 개발 병목 지점을 모두 바꾸고 있습니다.

앞으로는 코드의 양이나 저장소의 외형보다, 실제 사용 경험과 운영을 통해 쌓인 신뢰가 소프트웨어 품질을 판단하는 핵심 기준이 될 가능성이 큽니다.
AI는 개발을 더 쉽게 만들지 않습니다. 대신, 잘하는 사람과 그렇지 않은 사람의 차이를 더 크게 만듭니다.

이 변화 속에서 중요한 것은 속도가 아니라 판단입니다.
무엇을 믿고, 어디까지 검증하며, 언제 사람의 책임으로 돌아와야 하는지를 스스로 정의할 수 있는 역량이 앞으로의 소프트웨어 개발에서 가장 큰 경쟁력이 될 것입니다.

300x250

https://simonwillison.net/2026/May/6/vibe-coding-and-agentic-engineering/

 

Vibe coding and agentic engineering are getting closer than I’d like

I recently talked with Joseph Ruscio about AI coding tools for Heavybit’s High Leverage podcast: Ep. #9, The AI Coding Paradigm Shift with Simon Willison. Here are some of my …

simonwillison.net

728x90
반응형
그리드형