본문 바로가기

728x90
반응형

분류 전체보기

(3055)
비용 효율적인 LLM 라우팅 시스템 구축 방법: NadirClaw 기반 프롬프트 분류와 Gemini 모델 전환 이 글은 NadirClaw를 활용해 프롬프트의 복잡도를 사전에 분류하고, 그 결과에 따라 서로 다른 LLM 모델(Gemini Flash / Pro)을 자동으로 선택하는 비용 인식형 LLM 라우팅 시스템을 구축하는 전체 과정을 정리한 기술 블로그입니다.로컬 프롬프트 분류부터 실제 프록시 서버 기반의 실시간 모델 라우팅, 그리고 비용 절감 효과 분석까지, NadirClaw의 내부 동작 원리와 실전 활용 방법을 단계별로 설명합니다.NadirClaw란 무엇인가NadirClaw는 프롬프트 복잡도 기반 LLM 라우팅 레이어입니다.요청이 들어오면 먼저 로컬에서 프롬프트를 분석해 “단순(Simple)” 혹은 “복잡(Complex)” 작업인지 판단한 뒤, 그 결과에 따라 적절한 모델로 요청을 전달합니다.이 접근 방식의 ..
Anthropic 금융 서비스 특화 AI 에이전트 오픈소스 공개, 무엇이 달라졌나 이번 글에서는 **Anthropic**이 공개한 금융 서비스 특화 AI 에이전트·스킬·커넥터 오픈소스 레퍼런스 레포지토리에 대해 정리합니다.투자은행, 자산관리, 사모펀드 등 금융 실무에서 반복적으로 발생하는 업무를 자동화하기 위해 설계된 구조와, 어떤 방식으로 활용할 수 있는지가 핵심입니다.금융 업무 자동화를 위한 레퍼런스 레포지토리 개요Anthropic은 금융 서비스 워크플로우 자동화를 목표로 한 오픈소스 레퍼런스 레포지토리를 공개했습니다. 이 레포지토리는 Claude Cowork 플러그인 또는 Managed Agents API 두 가지 방식으로 동일한 에이전트를 실행할 수 있도록 설계되어 있습니다.전체 구성은 Markdown과 JSON 파일 기반으로 이뤄져 있으며, 별도의 빌드 스텝 없이 바로 활용할..
Open Design: Claude Design을 대체하는 로컬 퍼스트 오픈소스 디자인 엔진 정리 이 글은 Open Design이라는 로컬 퍼스트(Local-first) 오픈소스 디자인 도구를 중심으로, 기존 Claude Design 워크플로를 어떻게 대체할 수 있는지 정리한 IT 기술 블로그입니다. 에이전트를 내장하지 않는 구조, 실제 브랜드급 디자인 시스템 탑재, 결정론적 디자인 적용 방식, 그리고 다양한 생성 미디어 및 실행 환경까지, Open Design의 핵심 개념과 특징을 입력된 정보를 기반으로 체계적으로 설명합니다.Open Design이란 무엇인가Open Design은 Claude Design의 로컬 퍼스트 오픈소스 대체제로, 사용자의 로컬 환경에서 실제 파일시스템과 CLI 에이전트를 활용해 디자인 결과물을 생성하는 디자인 엔진입니다.중앙 서버에 의존하지 않고, 이미 사용 중인 코딩 에이..
초고속 엔터프라이즈 AI 게이트웨이 Bifrost 핵심 정리와 활용 포인트 이 글은 초고속 성능과 엔터프라이즈 운영을 동시에 만족시키는 AI 게이트웨이 Bifrost에 대해 정리한 글입니다.여러 AI 모델과 프로바이더를 하나의 API로 통합해야 하거나, 대규모 트래픽 환경에서 지연 시간·안정성·보안을 모두 잡아야 하는 상황이라면 Bifrost가 어떤 문제를 해결해 주는지, 그리고 어떤 특징을 가지고 있는지 한 번에 이해할 수 있도록 구성했습니다.Bifrost란 무엇인가Bifrost는 엔터프라이즈 환경을 위한 초고속 AI 게이트웨이입니다.다양한 AI 프로바이더와 모델을 단일 OpenAI 호환 API로 통합하고, 고성능 로드 밸런싱과 자동 장애 대응, 멀티모달 처리까지 지원해 대규모 프로덕션 AI 시스템 운영을 단순화합니다.특히 LiteLLM 대비 최대 50배 빠른 성능과 5,00..
OpenKB: LLM 기반 지식 컴파일 시스템으로 만드는 지속형 지식 베이스 이 글은 OpenKB(Open LLM Knowledge Base)가 무엇인지, 기존 RAG 방식과 무엇이 다른지, 그리고 실제로 어떻게 지식 베이스를 구축하고 활용할 수 있는지를 정리한 IT 기술 소개 글입니다. 단순히 문서를 검색하는 도구가 아니라, 문서를 한 번 컴파일해 지속적으로 축적되는 지식 위키로 만든다는 점에서 OpenKB의 개념과 구조, 주요 기능, 사용 방법을 중심으로 설명합니다.OpenKB란 무엇인가OpenKB는 LLM을 활용해 원본 문서를 구조화된 위키 형태의 지식 베이스로 컴파일하는 오픈소스 CLI 시스템입니다. 문서를 질의할 때마다 다시 해석하는 방식이 아니라, 처음부터 지식을 정리·연결해 두고 그 결과를 지속적으로 유지·확장하는 접근을 취합니다.이 개념은 Andrej Karpath..
코딩 에이전트 시대, 진짜 병목은 코드가 아니라 조직이었다 이 글은 코딩 에이전트의 등장으로 소프트웨어 개발 속도가 빨라진 지금, 왜 여전히 제품과 조직의 속도가 기대만큼 나아지지 않는지에 대한 이야기입니다. 핵심은 더 이상 ‘코드를 얼마나 빨리 쓰느냐’가 아니라, 무엇을 만들지, 왜 만드는지에 대한 합의와 맥락을 조직이 얼마나 잘 정리하고 공유하느냐에 있습니다. 개인 생산성의 문제가 아닌 협업, 명세, 조직 일관성의 문제를 중심으로 코딩 에이전트가 바꾼 병목 구조를 정리합니다.코딩 에이전트가 드러낸 새로운 병목코딩 에이전트는 개인의 코드 작성 방식을 크게 바꿨습니다. 실제로 1년 넘게 미뤄졌던 구조화 생성 알고리듬 실험이, 접근 방식을 설명한 뒤 몇 시간 만에 작동하는 첫 버전으로 구현된 사례도 있습니다.하지만 여기서 중요한 변화는 개인의 속도 향상이 아니었습..
Toprank: Claude Code 기반 SEO·광고 자동화를 한 번에 관리하는 오픈소스 플러그인 이 글은 Claude Code 환경에서 SEO와 광고 운영을 자동화할 수 있도록 설계된 오픈소스 플러그인 Toprank를 소개합니다. Google Search Console, Google Ads, Meta Ads 데이터를 직접 활용해 트래픽 분석부터 광고 계정 감사, SEO 개선, 자동 실행 에이전트 구성까지 가능한 구조와 기능을 정리했습니다. 특히 마케팅 운영 과정에서 반복적으로 소모되는 분석·점검·수정 작업을 어떻게 줄일 수 있는지에 초점을 맞춰 설명합니다.Toprank란 무엇인가Toprank는 SEO 및 광고 관리용 Claude Code 플러그인으로, 마케팅 데이터를 기반으로 한 분석·진단·실행 자동화를 목표로 합니다.Google Search Console, Google Ads, Meta Ads 데..
금융 서비스를 위한 AI 에이전트 템플릿 정리: Claude 기반 자동화가 바꾸는 실무 환경 이 글은 금융 서비스 업계에서 가장 많은 시간을 소모하는 업무를 자동화하기 위해 공개된 AI 에이전트 템플릿과 그 활용 방식에 대해 정리한 글입니다. 피치북 작성, 재무 모델링, 월말 결산, KYC 검토 등 실제 금융 실무에 바로 적용할 수 있는 에이전트들이 어떻게 구성돼 있고, 어떤 환경에서 활용되는지, 그리고 기존 업무 방식과 무엇이 달라지는지를 중심으로 설명합니다.금융 실무를 겨냥한 AI 에이전트 등장 배경금융 서비스 조직은 프론트 오피스부터 미들·백오피스까지 방대한 반복 업무를 수행합니다.문제는 이 업무들이 정확성, 감사 가능성, 규정 준수를 요구하면서도 많은 인적 시간을 소모한다는 점입니다.이를 해결하기 위해 공개된 것이 즉시 실행 가능한 10개의 금융 특화 AI 에이전트 템플릿입니다.이 템플릿..

728x90
반응형