본문 바로가기

인공지능

(881)
Ollama, 멀티모달 AI의 새로운 기준을 제시하다 - 텍스트와 이미지를 동시에 이해하는 AI 엔진의 진화 Ollama의 새로운 멀티모달 엔진, 무엇이 달라졌을까?AI 모델들이 점점 더 사람처럼 복합적인 정보를 처리하게 되면서, 멀티모달(Multimodal) 기술은 그 핵심으로 떠오르고 있습니다. Ollama는 이번에 새롭게 공개한 멀티모달 전용 엔진을 통해 이미지와 텍스트를 결합한 질문 응답 기능을 본격적으로 지원하기 시작했습니다.이 블로그에서는 Ollama가 어떤 기술적 변화와 진화를 거쳐 멀티모달 엔진을 완성했는지, 어떤 모델을 지원하는지, 그리고 실제 사용자가 체감할 수 있는 주요 기능과 향후 기대되는 점은 무엇인지 차근히 살펴보겠습니다.멀티모달 모델이란 무엇인가?멀티모달 모델은 하나의 입력 형태가 아닌 여러 형태의 정보를 동시에 처리할 수 있는 AI입니다. 예를 들어, 단순히 텍스트만을 읽는 것이 아..
99% 더 빠른 개발을 실현할 수 있을까? 윈드서프 SWE-1이 제안하는 새로운 개발 패러다임 단순한 코드 보조를 넘어선 AI 개발 파트너의 등장“개발 속도를 99%까지 줄일 수 있습니다.”이런 말을 들었을 때, 과연 현실적으로 가능할까라는 의문이 들 수밖에 없습니다. 하지만 윈드서프(Windsurf)는 그 가능성을 기술로 증명하고 있습니다.2025년 5월, 윈드서프는 소프트웨어 엔지니어링에 특화된 AI 모델군 'SWE-1'을 공개하며 개발자가 단순히 코드를 작성하는 수준을 넘어, 전체 개발 과정에서 AI가 함께 협업하는 미래를 제시했습니다. SWE-1은 기존 코딩 도우미를 넘어, 지식 검색, 터미널 작업, 사용자 피드백 처리 등 전반적인 개발 업무를 아우르며 속도를 비약적으로 높이는 것을 목표로 합니다.이번 블로그에서는 SWE-1 모델군이 갖고 있는 핵심 개념과 기능, 기존 개발 도구와의 차별점..
코딩은 맡기고 일에 집중하자: OpenAI ‘Codex’가 바꾸는 개발의 미래 왜 지금 ‘Codex’인가?요즘 개발자라면 한 번쯤은 AI 코딩 도구를 사용해봤을 것이다. 반복 작업을 줄이고, 개발 속도를 높여주는 도구들은 분명 편리하지만, 여전히 많은 한계가 있다. 부정확한 코드, 비효율적인 구현, 신뢰할 수 없는 테스트 결과 등 말이다.그런 가운데, OpenAI는 ‘Codex’라는 새로운 AI 코딩 에이전트를 공개하며 주목을 받고 있다. 기존 도구보다 더 강력하고, 더 똑똑하며, 마치 ‘가상 팀원’처럼 행동하는 이 에이전트는 단순한 코드 생성 도구 그 이상이다.이 블로그에서는 Codex의 핵심 기술, 작동 방식, 주요 기능, 실제 활용 예시까지 하나씩 짚어보며, 왜 이 도구가 주목받고 있는지 명확하게 정리한다.1. Codex란 무엇인가? 기술적 배경 이해하기Codex는 OpenA..
복잡한 연동은 이제 그만, AG-UI로 간단하게 해결하는 에이전트-프론트엔드 연결 에이전트 기반 애플리케이션을 만들다 보면, 가장 먼저 부딪히는 문제 중 하나가 백엔드 에이전트와 프론트엔드 애플리케이션 간의 연결입니다. 직접 소켓 연결을 만들거나, 다양한 이벤트를 처리하고, 커스텀 포맷을 맞추는 건 시간이 오래 걸릴 뿐 아니라 유지보수도 어렵습니다.이 문제를 해결하기 위해 등장한 것이 바로 AG-UI입니다. AG-UI는 오픈 소스이며, 가볍고 유연한 이벤트 기반 프로토콜로, 에이전트 백엔드와 프론트엔드를 간단하게 연결해줍니다. 이 블로그에서는 AG-UI가 무엇인지, 어떤 문제를 해결해주며, 실제 애플리케이션에 어떻게 적용할 수 있는지를 살펴봅니다.AG-UI란 무엇인가?AG-UI는 ‘Agent-User Interaction Protocol’의 약자로, 에이전트와 사용자(프론트엔드) 간의..
경쟁은 시작됐다: Google Gemini 1.0 Ultra, 진짜 쓸만한가? AI 챗봇 시장의 경쟁이 그 어느 때보다 치열해졌습니다. ChatGPT, Microsoft Copilot, 그리고 이제는 Google의 Gemini까지. 모두가 가장 빠르고 정확한 챗봇을 만들기 위해 기술력을 총동원하고 있습니다. 그 중에서도 이번에 리뷰할 Google Gemini 1.0 Ultra는 특히 주목할 만합니다.왜냐하면, 이 모델은 Google이 내부 코드 레드(Code Red) 상태에서 서둘러 출시할 만큼 절박하게 개발한 결과물이기 때문입니다. ChatGPT가 검색 시장을 위협하는 상황에서, Google이 내놓은 해답인 셈이죠.이 블로그에서는 Google Gemini 1.0 Ultra가 무엇인지, 어떤 특징을 가지고 있으며, 실제로 사용할 때 어떤 장단점이 있는지 구체적으로 다뤄봅니다. 지금..
AI 모델 대전: 누가 뜨고 누가 지는가? - 2025년 상반기 AI 모델 사용 트렌드 분석 지금 AI 시장에서 무슨 일이 벌어지고 있나AI 기술이 급속도로 발전하면서, 시장에는 수많은 인공지능 모델이 등장하고 있습니다. 하지만 기술이 아무리 좋아도 실제 사용자가 찾지 않으면 의미가 없습니다. 그래서 중요한 질문은 이것입니다. "지금 사람들이 실제로 많이 쓰는 AI 모델은 무엇이고, 왜 그 모델을 선택할까?"이번 글에서는 대표적인 AI 챗봇 플랫폼 'Poe(포)'가 공개한 2025년 1월부터 5월까지의 사용자 데이터를 바탕으로, AI 모델의 사용 트렌드를 분석합니다. 코딩, 추론, 이미지, 영상 등 분야별로 어떤 모델이 성장하고 있는지, 또 어떤 모델이 하락세를 보이고 있는지 상세히 살펴봅니다.Poe 플랫폼이 중요한 이유Poe는 사용자들이 다양한 AI 모델을 동일한 인터페이스 내에서 선택해 사용..
AI 코딩, 이제는 AI 모델 여러 개를 적절한 용도에 맞게 쓰세요 - GPT, Claude, Gemini, o 시리즈의 실전 비교와 조합 전략 AI 코딩 도구, 정말 실무에 쓸 수 있을까?이미 많은 개발자들이 챗GPT에 코드를 붙여넣고, 깃허브 코파일럿으로 자동완성되는 코드를 본 적이 있을 겁니다. 하지만 막상 써보면 실망도 큽니다. 코드 품질이 낮거나, 라이브러리를 엉뚱하게 추천하고, 디버깅에선 거의 도움이 안 될 때도 있습니다. 그래서 결론을 내립니다. "아직 멀었다."하지만 그 생각, 다시 점검해볼 때입니다. 불과 몇 달 사이, 생성형 AI는 눈에 띄게 발전했습니다. 특히 GPT, 클로드, 제미니, 그리고 o 시리즈 모델은 각기 강점이 뚜렷하게 다릅니다. 더 이상 하나의 모델만 고집할 필요는 없습니다. 오히려 현명한 개발자라면, 여러 모델을 혼합해 쓰는 전략으로 효율을 극대화하고 있습니다.이 글에서는 현업에서 직접 테스트한 다양한 AI 모..
코드 한 줄 없이 E2E 테스트? - 자연어로 테스트하고 AI로 실행하는 혁신적인 E2E 테스트 프레임워크 소프트웨어 테스트는 복잡하고 반복적인 작업입니다. 특히 엔드 투 엔드(E2E) 테스트는 실제 사용자처럼 다양한 시나리오를 테스트해야 하기에 시간과 리소스가 많이 소모됩니다.하지만 만약 테스트 케이스를 자연어로 작성하고, 이를 AI가 대신 실행해주는 도구가 있다면 어떨까요?이 블로그에서는 Anthropic Claude API 기반의 AI 테스트 실행 기능을 활용해, 자연어로 테스트를 작성하고 자동화할 수 있는 혁신적인 E2E 테스트 프레임워크를 소개합니다.Playwright와 결합된 이 솔루션은 GitHub, Stripe, Clerk 등 다양한 SaaS와도 연동되며, CI/CD 환경 속 자동화 테스트 품질을 극대화합니다.자연어로 테스트를 작성한다는 것의 의미이 프레임워크의 가장 큰 특징은 프로그래밍 언어가..