인공지능 (2374) 썸네일형 리스트형 AI가 대화를 기억하게 만드는 메모리 엔진, Supermemory 기술 정리 이 글은 AI가 대화를 잊어버리는 근본적인 한계를 어떻게 해결할 수 있는지, 그리고 이를 위해 등장한 메모리·컨텍스트 전용 엔진 Supermemory가 어떤 기술적 배경과 구조를 가지고 있는지 정리한 글입니다.Supermemory가 무엇인지, 기존 RAG 방식과 어떤 차이가 있는지, 주요 기능과 특장점은 무엇인지, 실제로 어떻게 사용하고 구축할 수 있는지를 중심으로 기술 개념부터 활용 방식까지 차분하게 설명합니다.AI가 대화를 잊는 문제와 기술적 배경대부분의 AI 어시스턴트는 세션이 끝나면 이전 대화 내용을 잊습니다.이는 AI가 상태를 유지하지 않는(stateless) 구조이기 때문입니다.이 문제를 해결하기 위해 등장한 방식이 RAG(Retrieval Augmented Generation)이지만, RAG.. 테스트 중심 개발에서 루프 중심 개발로: AI 코딩 방식의 진화 정리 이 글은 소프트웨어 개발 방식이 어떻게 테스트 중심 개발(TDD)에서 출발해, AI 에이전트와 루프 기반 개발(Loop-Driven Development)로 확장되고 있는지를 정리한 글입니다.자동 완성, 프롬프트 기반 코딩을 지나 저장소 단위 작업, 실행 환경(harness), 그리고 검증 가능한 반복 루프까지 이어지는 흐름을 단계별로 설명하며, 왜 지금 개발자의 역할이 “코드를 직접 쓰는 사람”에서 “루프를 설계하는 사람”으로 이동하고 있는지를 살펴봅니다.소프트웨어 개발은 원래 ‘루프’였다소프트웨어 개발은 처음부터 반복 구조였습니다.코드를 수정하고실행하고결과를 확인하고다시 고칩니다테스트 주도 개발(TDD)은 이 흐름을 명확하게 만든 방법론입니다.실패하는 테스트를 먼저 만들고, 통과시키고, 리팩터링합니다.. Claude Fable 5 프롬프트 가이드 정리: 기존 모델과 무엇이 어떻게 달라졌을까 이 글은 Claude Fable 5와 Claude Mythos 5를 사용할 때 필요한 프롬프트 방식과 행동 차이를 정리한 기술 블로그입니다.특히 기존 Claude Opus 4.8을 사용해 오던 분들이라면, 어떤 점을 바꿔야 하고 어떤 지침은 이제 굳이 쓰지 않아도 되는지 이해하는 데 목적이 있습니다.복잡한 장기 작업, 높은 정확도가 요구되는 업무, 에이전트 기반 워크플로우에서 Claude Fable 5를 어떻게 활용해야 하는지 중심으로 설명합니다.Claude Fable 5란 무엇인가Claude Fable 5는 이전 모델에서 처리하기 어려웠던 장기 실행 작업, 복잡한 문제, 모호한 요구사항을 안정적으로 수행하도록 설계된 모델입니다.단순한 질문 답변보다, 수시간~수일에 걸친 엔드 투 엔드 작업에서 강점을 보.. LLM 에이전트가 스스로 진화하는 방법: Self-Harness 개념과 실험 결과 정리 이 글은 LLM 기반 에이전트의 성능을 스스로 개선하는 새로운 패러다임인 Self-Harness를 소개합니다. 기존에는 사람이 직접 설계하던 에이전트 하니스(harness)를, 에이전트 자기 자신이 실행 결과를 분석하고 수정·검증하는 방식으로 발전시킨다는 점이 핵심입니다.논문의 배경, Self-Harness의 구조와 동작 방식, 실험 설정과 성능 개선 결과, 그리고 이 접근법이 가지는 의미와 기대 효과를 순서대로 정리해 독자가 이해하기 쉽게 설명합니다.LLM 에이전트에서 하니스(Harness)란 무엇인가LLM 에이전트의 성능은 단순히 기본 모델(Base Model) 만으로 결정되지 않습니다. 모델이 환경과 상호작용하는 방식 전체, 즉 하니스(harness) 가 함께 작용합니다.하니스에는 다음과 같은 요소.. DiffusionGemma: 로컬 환경에서 최대 4배 빠른 텍스트 생성을 가능하게 하는 확산 기반 언어 모델 이 글에서는 기존 대규모 언어 모델(LLM)의 한계를 넘어, 속도 중심의 로컬 추론 환경을 위해 설계된 실험적 오픈 모델 DiffusionGemma를 소개합니다. Diffusion 기반 텍스트 생성이라는 새로운 접근 방식이 무엇인지, 왜 빠른지, 어떤 장점과 한계가 있는지, 그리고 어떤 개발자와 연구자에게 적합한지까지 정리합니다. 특히 기존 자동회귀(Autoregressive) 모델과의 구조적 차이와 실제 활용 시 기대할 수 있는 가치에 초점을 맞춥니다.DiffusionGemma란 무엇인가DiffusionGemma는 텍스트 확산(diffusion) 방식을 적용한 실험적 오픈 소스 언어 모델입니다. Apache 2.0 라이선스로 공개되었으며, 총 260억 파라미터를 가진 Mixture of Experts(.. 코드 LLM에 저장소 지식을 주입하는 새로운 방식, Code2LoRA 하이퍼네트워크 프레임워크 정리 이 글은 코드 언어 모델(Code LLM)이 대규모 코드 저장소(repository) 단위의 맥락을 어떻게 더 효율적으로 이해하고 활용할 수 있는지에 대한 최신 연구인 Code2LoRA 논문을 정리한 글입니다.기존의 RAG 기반 접근이나 저장소별 파인튜닝·LoRA 방식이 가진 한계를 짚고, 추론 시 토큰 오버헤드 없이 저장소 지식을 모델 파라미터에 주입하는 하이퍼네트워크 프레임워크가 어떤 배경에서 등장했고, 어떤 구조와 성능을 보였는지 단계적으로 설명합니다.코드 LLM을 실제 소프트웨어 개발 환경, 특히 지속적으로 진화하는 코드베이스에 적용하려는 분들에게 핵심적인 인사이트를 제공하는 것이 목표입니다.코드 LLM과 저장소 컨텍스트의 한계코드 LLM이 실제 개발에 쓰이려면 단일 파일이나 짧은 코드 조각이 아.. NVIDIA CUDA 13.3 업데이트 정리: 타일 프로그래밍, CUDA Python 1.0, 컴파일러 자동 튜닝까지 이번 글에서는 NVIDIA CUDA 13.3 릴리스를 중심으로, GPU 개발자가 실제로 체감할 수 있는 변화들을 정리합니다.CUDA 13.3은 단순한 기능 추가가 아니라, C++ 타일 프로그래밍 도입, CUDA Python 1.0 정식 출시, 컴파일러 자동 튜닝(CompileIQ), 그리고 라이브러리·도구 전반의 성능 개선까지 포함한 대규모 업데이트입니다.GPU 커널 개발, Python 기반 워크플로우, 대규모 연산 성능 최적화에 관심 있는 개발자라면 이번 릴리스가 어떤 의미를 가지는지 한 번에 이해할 수 있도록 정리해 보겠습니다.CUDA Tile C++: 고수준 타일 기반 GPU 커널 개발CUDA 13.3의 핵심 변화 중 하나는 CUDA Tile 프로그래밍이 C++까지 확장되었다는 점입니다.타일 프로그.. Apple Core AI 프레임워크: 온디바이스 AI를 앱 안에서 실행하는 새로운 개발 표준 이 글은 Apple Core AI 프레임워크를 중심으로, Apple 플랫폼에서 온디바이스 AI 모델을 어떻게 실행·최적화·배포할 수 있는지를 정리한 기술 블로그입니다. Core AI가 무엇인지, 기존 Core ML과 어떤 역할 분담을 가지는지, PyTorch 모델이 Swift 앱으로 연결되는 전체 개발 흐름, 그리고 성능 최적화·배포·디버깅까지 실제 개발자가 고려해야 할 지점을 중심으로 설명합니다.Core AI란 무엇인가Core AI는 Apple silicon 환경에서 AI 모델을 앱 내부에서 직접 실행하기 위한 새로운 프레임워크입니다. CPU, GPU, Neural Engine을 모두 활용하며, 모델 추론을 Swift API로 자연스럽게 통합할 수 있도록 설계되었습니다.가장 큰 특징은 사용자 데이터를 .. 이전 1 2 3 4 ··· 297 다음