본문 바로가기

인공지능

(857)

“가격이 이렇게 내려도 돼?” OpenAI, 고성능 LLM ‘o3’ 가격 80% 전격 인하! AI 모델 도입을 망설이던 당신에게 찾아온 기회고성능 AI 모델을 써보고 싶지만 높은 비용 때문에 망설였던 적이 있으신가요? 특히 LLM처럼 대규모 데이터를 다루는 인공지능 모델은 성능이 좋을수록 비용 부담도 커지기 마련입니다.그런데 이번에 OpenAI가 발표한 o3 가격 인하는 시장의 판도를 완전히 바꿔놓을 만큼 파격적입니다.OpenAI는 자사의 플래그십 추론형 LLM 모델인 o3의 가격을 **무려 80%**나 인하했습니다. 이 소식은 단순한 가격 인하를 넘어, 이제 누구나 고성능 AI 모델을 더 저렴하게 활용할 수 있게 되었다는 신호입니다.이번 글에서는 OpenAI o3의 개념부터 주요 특징, 경쟁 모델들과의 비교, 그리고 이 가격 인하가 실제 사용자에게 어떤 의미를 가지는지 정리해드립니다.1. Op..

715GB 모델을 내 PC에서? DeepSeek-R1-0528 로컬 실행 가이드 오픈소스 AI 모델이 점점 더 강력해지고 있지만, 그만큼 자원을 많이 소모하는 것도 사실입니다. DeepSeek-R1-0528은 715GB에 달하는 대형 오픈소스 언어 모델로, 강력한 추론 성능을 자랑하지만 고사양 시스템이 필수입니다. 그러나 Unsloth의 양자화 기술을 활용하면 80% 이상 용량을 줄여, 일반 PC에서도 실행이 가능해집니다.이 블로그에서는 DeepSeek-R1-0528 모델을 Ollama와 Open WebUI를 사용해 로컬에서 실행하는 방법을 단계별로 안내합니다. 필요한 시스템 사양부터 설치 방법, 실행 절차, 그리고 성능 한계까지 상세히 살펴보겠습니다.DeepSeek-R1-0528 모델이란?DeepSeek-R1-0528은 DeepSeek가 공개한 최신 R1 추론(reasoning) ..

브라우저의 진화: Genspark AI 브라우저로 웹 탐색의 모든 것이 달라진다 브라우저, 단순한 웹 페이지 도구는 이제 그만.AI가 직접 움직이고, 비교하고, 정리해주는 진짜 ‘스마트 브라우저’가 등장했습니다.이번 블로그에서는 Genspark AI 브라우저가 어떻게 웹 환경을 바꾸는지, 그리고 어떤 사용자에게 적합한지 상세히 알아봅니다.Genspark AI 브라우저란?Genspark AI 브라우저는 전통적인 웹 브라우저와 달리, 사용자의 웹 탐색 과정을 ‘대행’하는 AI 기반의 지능형 브라우저입니다. 단순히 웹 페이지를 보여주는 수준을 넘어, 페이지 내 정보 수집, 비교, 요약, 자동화된 작업까지 수행합니다.기존 브라우저와의 가장 큰 차이는 다음과 같습니다:페이지를 보는 것이 아니라 이해하고 처리한다클릭만 하면 AI가 정보를 정리해준다반복 작업은 오토파일럿이 자동화한다주요 기능 소..

블랙박스였던 Cursor, 이제 내부를 들여다보다 - TensorZero로 리버스 프록시 구성 후 Cursor LLM 클라이언트 분석 실전기 AI 코딩 어시스턴트 Cursor, 진짜로 어떻게 작동할까?Cursor는 요즘 개발자 사이에서 많이 쓰이는 AI 기반 코드 어시스턴트입니다. GPT 등 대형 언어 모델을 바탕으로 코드 자동완성부터 명령 기반 질문 처리까지 폭넓은 기능을 제공하지만, 그 내부가 어떻게 동작하는지는 거의 알려진 바가 없습니다. 사용자 입장에서는 그저 질문을 입력하면 답이 나올 뿐, 실제로 어떤 프롬프트가 전달되고, 어떤 모델이 호출되며, 어떤 방식으로 코드가 수정되는지 확인하기 어려웠습니다.이번 블로그에서는 오픈소스 프레임워크인 TensorZero를 활용해 Cursor와 LLM(대형 언어 모델) 사이의 트래픽을 중간에서 가로채 분석하고, 실시간으로 최적화까지 시도한 경험을 공유합니다. 이를 통해 그동안 '블랙박스'처럼 느껴졌..

"모르면 모른다고 말하는 AI"를 만들다 – 환각 줄이는 새로운 학습법 ‘SUM’ 인공지능이 모든 질문에 답하는 것이 항상 좋은 일은 아닙니다. 때로는 모르는 질문에도 아는 척하며 그럴듯한 오답을 내놓는 일이 발생하죠. 이는 특히 정보가 불충분하거나 명확하지 않은 질문에 대해 자주 나타나는 문제입니다. 이를 AI 분야에서는 ‘환각(Hallucination)’이라고 부릅니다.이번 글에서는 이런 문제를 해결하기 위해 미국 서던캘리포니아대학교(USC) 연구진이 제안한 새로운 학습 방법인 ‘SUM(Synthetic Unanswerable Math)’ 기반 강화 미세조정 기법에 대해 다룹니다. 모델에게 ‘모를 땐 모른다고 말하라’는 태도를 가르치는 이 접근이 어떻게 환각을 줄이고 AI의 신뢰성을 높이는지 소개하겠습니다.왜 AI는 모를 때도 답하려고 할까?대형언어모델(LLM)은 강화 미세조정(R..

Claude Code를 대체할 혁신: Open Code, 터미널 AI 코딩의 새로운 기준 당신이 원하던 '진짜 빠르고 유용한' 터미널 기반 AI 코더매번 무겁고 느리게 실행되는 AI 코딩 툴 때문에 스트레스를 받으셨나요? 코드를 수정하려는데 UI 렌더링부터 로딩까지 한참 걸려서 집중력이 흐트러졌던 경험, 많으셨을 겁니다. 터미널에서 작업하는 걸 선호하지만, 기존 도구들은 기능 제약이나 속도 문제로 만족스럽지 않았던 분들이라면 이번 소개가 반가울 수 있습니다.오늘 소개할 Open Code는 터미널 기반 AI 코딩 도구로, 기존의 Ader나 Claude Code에서 아쉬웠던 부분을 속도, 기능, 확장성 면에서 대폭 개선한 솔루션입니다. 직접 사용해본 결과, 단순히 '또 하나의 AI 툴'이 아니라, 진짜 생산성을 높여주는 실용적인 도구라는 확신이 들었습니다. 이 글에서는 Open Code의 개념,..

애플이 공개한 차세대 AI 언어 모델, 무엇이 달라졌을까? 애플이 마침내 본격적인 생성형 AI 경쟁에 뛰어들었습니다. WWDC 2025에서 공개된 ‘Apple Intelligence’는 단순한 기능 업데이트가 아니라, 새로운 언어 모델 아키텍처와 프라이버시 중심 설계를 기반으로 완전히 새로운 사용자 경험을 제공합니다.이번 블로그에서는 Apple Intelligence의 개념부터 언어 모델 구조, 개발자를 위한 프레임워크, 프라이버시 설계까지 WWDC 2025에서 발표된 내용을 쉽게 풀어 설명합니다.Apple Intelligence란 무엇인가?Apple Intelligence는 애플이 자체 개발한 생성형 AI 시스템입니다. 텍스트 요약, 실시간 정보 추출, 이미지 이해, 콘텐츠 생성 등 다양한 기능을 macOS, iOS, iPadOS 전반에 걸쳐 통합합니다.가장 ..

Go 언어, 왜 AI 에이전트 개발에 강력한 선택일까? 에이전트 개발, Go가 주목받는 이유는 무엇일까?AI 에이전트의 활용이 점점 늘어나고 있습니다. 특히 최근에는 단순한 챗봇 수준을 넘어서, 브라우저를 제어하거나 외부 API를 연결해 복잡한 작업을 수행하는 등 고도화된 에이전트가 주목받고 있습니다. 이런 에이전트는 보통 실행 시간이 길고, 다양한 입출력(I/O) 대기를 포함하며, 높은 비용이 발생합니다.이러한 특성에 잘 맞는 언어로 Go가 부상하고 있습니다. 단순히 속도가 빠르기 때문만이 아닙니다. Go는 동시성 처리, 경량 스레드 모델, 메시지 기반 통신, 일관된 자원 취소 처리 등 에이전트에 필요한 구조적 강점을 두루 갖추고 있기 때문입니다.이 글에서는 에이전트의 개념부터 시작해, Go 언어가 에이전트 개발에 적합한 이유와 그 특장점을 살펴봅니다. 또..

이전 1 ··· 10 11 12 13 14 15 16 ··· 108 다음

티스토리툴바