본문 바로가기

반응형

전체 글

(2396)
DeepAgents CLI 성능 검증: Terminal Bench 2.0 기반 평가 분석 터미널 환경에서 실행되는 코드 에이전트가 실제 업무에서 얼마나 신뢰할 만한지 판단하려면, 반복 가능한 방식으로 성능을 검증해야 한다. 이번 글에서는 Deep Agents SDK 기반으로 만들어진 DeepAgents CLI가 Terminal Bench 2.0에서 어떤 성능을 보였는지, 그리고 이를 안정적으로 평가하기 위해 어떤 환경이 필요했는지를 정리한다. 또한 평가에 사용된 Harbor 샌드박스 환경과 실행 절차를 함께 소개한다.DeepAgents CLI란 무엇인가DeepAgents CLI는 Deep Agents SDK 위에서 동작하는 터미널 기반 코드 에이전트다. Python으로 작성된 오픈 소스이며, 특정 모델에 종속되지 않는 구조를 가지고 있어 다양한 모델과 함께 사용할 수 있다. 기본적으로 다음과..
프로덕션 생성형 AI 스택의 전체 구조와 핵심 구성요소 정리 엔터프라이즈 환경에서 생성형 AI가 실험 단계를 넘어 실제 프로덕션 서비스로 확장되면서, 기술 스택도 함께 복잡해지고 있다. 이제 AI 시스템은 단순히 모델 하나를 호출하는 방식으로는 부족하다. 그 뒤에는 가속 컴퓨팅, 모델 선택, 추론 최적화, RAG 기반 컨텍스트 관리, 에이전트 인프라, 워크플로우 오케스트레이션, 개발자 도구, 보안, 관찰성 등 다양한 레이어가 유기적으로 연결된다.이 글에서는 이러한 생성형 AI 기술 스택을 하나의 구조로 정리해, 각 구성요소가 어떤 역할을 하고 왜 필요한지 명확하게 설명한다. AI 아키텍처를 설계하거나 시스템을 확장하려는 독자에게 엔터프라이즈급 생성형 AI 스택의 전체 그림을 이해하는 데 도움이 될 것이다.가속 컴퓨트 레이어: GPU와 ASICGPUAI 스택의 기반..
Anthropic의 Skills System을 그대로 재현한 OpenSkills로 구현하는 AI 에이전트 통합 스킬 시스템 AI 코딩 에이전트를 사용할 때 가장 답답한 부분은 플랫폼마다 기능 지원 수준이 달라서 작업 흐름이 자주 끊긴다는 점입니다. 특히 Claude Code의 Skills System은 매우 유용하지만, Cursor나 Windsurf, Aider 같은 다른 에이전트에서는 동일한 방식으로 사용할 수 없어 아쉬움을 느낀 사용자가 많습니다. OpenSkills는 바로 이 문제를 해결하기 위해 만들어졌습니다. Anthropic의 Skills System을 그대로 재현해 모든 AI 코딩 에이전트에서 동일한 스킬 구조를 사용할 수 있도록 돕는 도구입니다. 이 글에서는 OpenSkills의 개념부터 설치 방법, 동작 방식, 멀티 에이전트 환경에서의 활용까지 핵심 내용을 상세하게 정리합니다.OpenSkills란 무엇인가Op..
CUDA 13.1과 CUDA Tile: GPU 프로그래밍 방식에 커다란 변화 CUDA 13.1의 등장은 GPU 프로그래밍 방식에 커다란 변화를 만들고 있다. 그 중심에는 새로운 타일 기반 모델인 CUDA Tile이 있다. 기존 CUDA가 스레드와 블록 단위의 복잡한 관리가 필수였다면, CUDA Tile은 더 큰 데이터 단위인 ‘타일’을 중심으로 GPU 연산을 정의하는 방식으로 전환한다. 개발자는 낮은 수준의 스레드 관리 대신 알고리즘 설계 자체에 집중할 수 있게 된다. 이번 글에서는 CUDA Tile이 무엇을 바꾸고, 왜 중요한지, 어떻게 활용되는지, 그리고 앞으로 어떤 의미를 갖는지까지 한 번에 정리해본다.CUDA Tile이 등장한 이유기존 CUDA는 SIMT(single-instruction, multiple-threads) 모델 위에서 동작한다. 개발자가 직접 스레드, 블록..
Claude와 Hugging Face Skills로 오픈소스 LLM을 직접 파인튜닝하는 방법 파인튜닝은 여전히 많은 개발자에게 높은 장벽입니다. GPU 선택부터 데이터셋 검증, 학습 스크립트 작성, 비용 계산까지 신경 써야 할 요소가 많습니다. 하지만 이제는 이 과정을 직접 하지 않아도 됩니다. Claude와 Hugging Face Skills를 활용하면, 모델 파인튜닝 전체 단계를 AI 에이전트가 대신 수행합니다. 이 글에서는 Hugging Face Skills가 어떻게 동작하는지, 파인튜닝 과정이 어떻게 자동화되는지, 그리고 실제로 어떤 방식으로 모델을 학습시키고 활용할 수 있는지 전체 흐름을 정리합니다.Hugging Face Skills란 무엇인가Hugging Face Skills는 파인튜닝에서 반복적으로 필요한 전문 지식을 하나의 패키지로 구성한 도구입니다. Claude Code 같은 A..
Qwen3-TTS 업데이트: 49가지 음색과 10개 언어, 9개 방언을 아우르는 차세대 음성 합성 기술 텍스트를 자연스러운 목소리로 전환하는 TTS 기술은 이미 다양한 서비스에서 핵심 기능으로 자리 잡았습니다. 하지만 실제 서비스에 적용하려고 보면 음색의 다양성 부족, 감정 표현의 어색함, 언어·방언 지원의 한계 등 여러 제약에 부딪히기 마련입니다. 이번에 공개된 Qwen3-TTS는 이러한 문제들을 해결하기 위해 설계된 모델로, 49가지 음색, 10개 언어, 9개 방언을 지원하며 이전보다 훨씬 자연스러운 발화와 억양을 제공합니다. 이 글에서는 Qwen3-TTS의 주요 특징과 개선점, 그리고 실제 사용 방법까지 정리해 쉽게 이해할 수 있도록 안내합니다.1. Qwen3-TTS 업데이트 개요Qwen3-TTS-Flash는 멀티 음색, 멀티 언어, 멀티 방언을 지원하는 플래그십 TTS 모델입니다. 이번 업데이트의 ..
구글이 공개한 Gemini 3 Deep Thinking 추론 모델, 차원이 다른 성능 입증 구글이 새로운 추론 특화 모델인 Gemini 3 Deep Thinking을 출시했습니다. 출시와 동시에 기존 Gemini 3 Pro를 넘어서는 벤치마크 기록을 세우며 기술 업계의 큰 주목을 받고 있습니다. 이 모델이 어떤 구조로 기존 AI 모델을 압도했는지, 왜 이만큼 비용이 높게 책정되었는지, 그리고 이 성능이 어떤 의미를 갖는지 궁금하다면 이 글에서 정리한 내용을 통해 빠르게 이해할 수 있을 것입니다.Gemini 3 Deep Thinking은 무엇인가?Gemini 3 Deep Thinking은 구글이 2025년 12월 초 공식 출시한 고급 추론 전문 모델입니다.기존 Gemini 3 Pro보다 훨씬 복잡한 문제 해결에 최적화되어 있으며, 특히 수학·과학·논리 문제 해결 능력에서 압도적인 성능 개선을 보..
논문 작성 방식이 붕괴한다 - PaperDebugger에 연구 생산성 대폭발 방법 소개 AI 시대에도 논문 쓰기는 여전히 힘들다LLM이 연구 현장 곳곳에 스며들고 있지만, 정작 논문을 쓸 때는 기대만큼의 생산성을 체감하기 어렵다. 대부분의 AI 도구는 에디터 밖에서 동작하며, 매번 텍스트를 복사해 붙여넣고, 제안을 확인한 뒤 다시 문서로 가져와야 한다. 이 과정에서 문맥은 끊기고 집중력은 떨어진다.싱가포르국립대학교(NUS) 연구진이 만든 PaperDebugger는 바로 이 근본적 병목을 해결하는 데서 출발한다. 단순히 글을 다듬는 보조 도구가 아니라, 논문 작성 환경 내부에서 실시간으로 작동하는 멀티에이전트 시스템으로 재설계된 새로운 형태의 연구 생산성 플랫폼이다.이 글에서는 PaperDebugger가 어떻게 기존 AI 도구의 한계를 무너뜨리고, 논문 작성 방식 자체를 재정의하고 있는지를 ..
Java Thread Pool 완벽 가이드: Executor부터 ForkJoinPool, Guava까지 한 번에 정리 애플리케이션에서 동시성을 다루는 일은 생각보다 쉽지 않습니다. 스레드를 직접 만들기 시작하면 금방 시스템 자원이 부족해지고, 성능 저하나 예측 불가능한 문제까지 발생할 수 있습니다. 이런 위험을 줄이기 위해 가장 효과적인 방법이 바로 스레드 풀(Thread Pool)입니다.이 글에서는 Java 표준 라이브러리에서 제공하는 다양한 스레드 풀 구현부터 Guava가 제공하는 고급 스레드 풀 기능까지 모두 정리합니다. 각 스레드 풀의 특징, 사용 목적, 구성 요소, 코드 예제까지 함께 설명하므로, 이 글을 읽고 나면 어떤 상황에서 어떤 스레드 풀을 선택해야 하는지 명확해질 것입니다.스레드 풀(Thread Pool)의 기본 개념Java에서 스레드는 운영체제의 리소스를 직접 사용합니다. 무작정 스레드를 생성하면 금..
AG-UI: 에이전트 기반 애플리케이션을 위한 인터랙션 프로토콜 에이전트 기술이 빠르게 확산되고 있지만, 실제로 서비스나 애플리케이션에 연결하려 하면 복잡함이 밀려옵니다. 단순 스트리밍이나 채팅 UI 정도라면 해결할 수 있지만, 에이전트가 실행되는 과정에서 발생하는 다양한 이벤트를 안정적으로 사용자 인터페이스에 연결하고 싶을 때 기존 방식은 한계가 드러납니다.AG-UI는 이 문제를 정면으로 해결하기 위해 등장한 오픈 이벤트 기반 에이전트-사용자 인터랙션 프로토콜입니다. 이 글에서는 AG-UI가 무엇이고, 왜 필요한지, 어떤 특징을 가지고 있으며 어떻게 시작할 수 있는지 명확하게 정리합니다.1. AG-UI란 무엇인가?**AG-UI(Agent-User Interaction Protocol)**는 에이전트가 실행되는 동안 발생하는 이벤트를 사용자 경험과 자연스럽게 연결하기..

반응형