본문 바로가기

분류 전체보기

(1527)

한국어에 최적화된 LLM, SK텔레콤 A.X 4.0의 오픈소스 출시는 왜 중요한가? 한국어 LLM, 이제는 선택이 아니라 전략입니다많은 기업들이 대규모 언어 모델(LLM)의 잠재력을 이해하고 있지만, 막상 도입하려고 하면 현실적인 문제가 발목을 잡습니다. 영어 기반의 외산 모델은 한국어에 최적화돼 있지 않고, 클라우드 기반으로만 사용할 수 있어 보안이나 비용 측면에서도 부담이 크죠.SK텔레콤은 이 문제를 정면으로 해결했습니다. 세계 최고 수준의 한국어 처리 성능을 자랑하는 A.X 4.0을 오픈소스로 공개하면서, 한국어 LLM을 필요로 하던 기업과 연구자에게 새로운 대안을 제시한 것입니다. 이 글에서는 A.X 4.0이 어떤 모델인지, 왜 주목해야 하는지, 그리고 어떻게 활용할 수 있는지를 정리합니다.A.X 4.0이란?A.X 4.0은 SK텔레콤이 개발한 한국어 특화 대규모 언어 모델(LLM..

복잡한 웹, 터미널에서 간결하게! Spegel로 여는 LLM 기반 웹 브라우징의 새로운 가능성 웹페이지가 점점 더 복잡해지고 있습니다. 수많은 광고, 무거운 자바스크립트, 눈에 띄지 않는 중요한 정보들. 하지만 가볍고 필요한 정보만 보고 싶은 사용자도 분명 존재합니다. 그런 분들을 위한 대안이 등장했습니다. 바로, Spegel입니다.Spegel은 HTML 웹페이지를 LLM(대형 언어 모델) 프롬프트로 변환해, 터미널 환경에서 마크다운 형식으로 보여주는 새로운 개념의 브라우저입니다. 이 글에서는 Spegel의 핵심 개념부터 동작 방식, 기존 터미널 브라우저와의 차이점, 실제 사용 방법까지 자세히 소개합니다.Spegel이란 무엇인가?LLM을 활용한 웹 페이지 맞춤 요약 도구Spegel은 단순한 텍스트 브라우저가 아닙니다. Lynx나 Links2처럼 HTML 구조만 보여주는 것이 아니라, HTML 콘텐..

쿠버네티스 배포, 이렇게 안전할 수 있다고? - kubechecks로 보는 ArgoCD 기반 PR/MR 배포 변경 사항 확인과 자동화된 사전 테스트 쿠버네티스를 기반으로 애플리케이션을 운영하는 팀이라면, 새로운 PR이나 MR을 병합하기 전에 "이 변경이 실제 배포 환경에 어떤 영향을 줄까?"라는 고민을 해보셨을 겁니다. 특히 ArgoCD를 사용하고 있다면, 현재의 라이브 배포 상태와 변경된 코드 간의 차이를 명확히 파악하는 것이 쉽지 않습니다.kubechecks는 이 문제를 해결하기 위해 고안된 도구입니다. PR이나 MR이 생성될 때마다 변경 사항을 자동 분석하고, 현재 ArgoCD 배포 상태와 비교해 어떤 변화가 일어날지 직접 알려줍니다. 이와 함께 Kubernetes 매니페스트의 유효성 검사와 린트 체크도 동시에 수행해, 사전에 오류를 방지할 수 있도록 지원합니다.이 글에서는 kubechecks가 어떤 문제를 해결하는지, 어떻게 작동하는지, 그리..

더 적은 데이터로 더 높은 정확도? Coxwave가 말하는 임베딩 모델의 진화 대화형 AI를 위한 고정밀 검색 기술, 그 비밀은 '데이터 정제'에 있었다복잡한 고객 상담, 의료 기록, 법률 문서처럼 한두 줄로 요약하기 힘든 도메인 특화 데이터. 이런 데이터를 검색하고 이해하려면, 일반적인 임베딩 모델로는 부족합니다. Coxwave는 이런 문제를 해결하기 위해 임베딩 모델을 직접 맞춤화(Fine-tuning)하는 방식으로 접근했고, 그 결과는 놀라웠습니다. 단순히 정확도를 높이는 데 그치지 않고, 학습 시간과 비용까지 줄이는 데 성공했죠.이번 블로그에서는 Coxwave 팀이 NVIDIA NeMo Curator를 활용해 어떻게 고품질 데이터를 구축하고, 임베딩 모델을 최적화했는지 그 과정과 결과를 상세히 소개합니다. RAG 파이프라인의 성능을 한 단계 끌어올리고 싶은 분들께 실질적인 ..

GPU로 SQL을 가속한다: 차세대 SQL 엔진 'Sirius'의 모든 것 데이터 분석의 병목, 이제는 GPU로 푼다점점 더 많은 기업들이 실시간 데이터 분석과 대규모 ETL 처리에 집중하면서, 기존 CPU 기반 SQL 엔진이 감당하기 어려운 상황에 직면하고 있습니다. 속도는 느리고, 비용은 증가하고, 분석 지연은 곧 비즈니스 기회 손실로 이어집니다.이러한 문제를 해결하기 위해 등장한 것이 GPU-Native SQL 엔진인 Sirius입니다. 기존 SQL 쿼리 구조를 그대로 유지하면서 GPU의 병렬 연산 성능을 극대화해, 최대 10배 이상의 속도 향상을 실현한 것이 핵심입니다. CPU 환경에서 생성된 쿼리를 GPU 환경으로 자연스럽게 옮기고, 특별한 코드 수정 없이 고성능 분석을 가능하게 하는 이 솔루션은 데이터 분석의 판도를 바꿔 놓을 수 있습니다.이 글에서는 Sirius가 ..

문맥이 곧 성능이다: LLM 에이전트를 위한 Context Engineering 완전 정복 문맥을 다루는 방식이 에이전트의 성능을 결정한다LLM 기반의 에이전트가 발전하면서, 많은 개발자들이 놀라운 자연어 처리 성능을 실무에 도입하고 있습니다. 하지만 장기적인 대화나 복잡한 작업을 수행하다 보면, 성능 저하나 이상 반응, 응답 지연 등의 문제를 자주 겪게 됩니다. 대부분의 문제는 하나의 원인으로 귀결됩니다. 바로 ‘문맥(Context)’의 문제입니다.LLM은 마치 강력한 CPU처럼 작동하지만, 그 작동 공간은 제한된 RAM, 즉 context window입니다. 이 작은 창에 무엇을 담느냐에 따라 결과는 완전히 달라집니다. 그래서 요즘 AI 엔지니어 사이에서는 “에이전트 설계에서 가장 중요한 건 context engineering이다”라는 말이 나올 정도입니다.이 글에서는 context eng..

OpenFLOW: 설치 없이, 오프라인에서 3D 인프라 다이어그램을 만드는 가장 빠른 방법 복잡한 네트워크 구조나 클라우드 아키텍처를 문서화하려고 할 때, 많은 개발자와 IT 전문가들이 느끼는 공통적인 불편함이 있습니다. 설치가 번거로운 툴, 로그인해야만 사용하는 클라우드 서비스, 그리고 중요한 정보가 외부 서버에 저장되는 구조. 이런 점들은 시각화 작업을 더디게 만들고, 오히려 다이어그램 제작 자체를 미루게 만듭니다.OpenFLOW는 이런 불편함을 해소해 주는 경량 다이어그램 도구입니다. 웹브라우저 하나만으로 작동하며, 오프라인에서도 사용할 수 있는 점이 가장 큰 특징입니다. 특히 Isoflow 기반의 아이소메트릭 스타일 덕분에 다이어그램이 시각적으로 깔끔하고 전문적으로 보입니다.이 블로그에서는 OpenFLOW의 주요 기능, 기술적 장점, 사용 방법까지 자세히 다뤄봅니다.OpenFLOW란? ..

Claude Code의 사용자 정의 훅 기능 – 자동화의 정밀 제어를 실현하다 일관된 자동화가 필요한 이유코드 기반 업무 자동화는 반복 업무를 줄이고 생산성을 높이는 데 필수적인 수단이다. 하지만 LLM 기반 도구는 때때로 실행이 불확실하거나 예측 불가능한 방식으로 동작한다. 이를 해결하고자 Claude Code는 '사용자 정의 훅(Hook)' 기능을 도입했다. 이 기능은 사용자가 특정 조건과 시점에서 실행할 명령어를 정의함으로써, 보다 정교하고 신뢰성 있는 자동화를 구성할 수 있게 한다.이 글에서는 Claude Code의 훅 기능이 어떤 구조로 설계되어 있으며, 어떤 방식으로 작동하고, 실제 개발 환경에서 어떻게 활용할 수 있는지를 심층적으로 설명한다.훅(Hook)의 개념과 작동 방식Claude Code의 훅은 코드 실행 흐름의 특정 이벤트 지점에서 자동으로 작동하는 사용자 정의..

이전 1 2 3 4 ··· 191 다음

티스토리툴바