분류 전체보기 (1015) 썸네일형 리스트형 GPT-4보다 10배 똑똑해진 GPT-4.5, 그 탄생의 비밀 “GPT-4.5는 어떻게 GPT-4보다 10배 더 똑똑해졌을까?”AI 모델이 점점 더 똑똑해지고 있지만, 그 이면에서 어떤 기술적 도전과 노력이 있었는지는 많이 알려지지 않았습니다. 이번 블로그에서는 OpenAI 내부 연구자들의 생생한 이야기를 통해 GPT-4.5가 어떻게 개발되었고, 어떤 문제가 있었고, 또 어떻게 극복했는지를 정리합니다.GPT-4.5는 단순한 성능 향상이 아니라, 시스템 설계, 머신러닝, 효율성, 그리고 협업의 극치로 만들어진 모델입니다.읽다 보면 "이 정도 규모의 AI는 이렇게 만들어지는구나!" 하는 감탄이 나올 거예요.📌 GPT-4.5란 무엇인가?GPT-4.5는 OpenAI가 개발한 대규모 언어 모델로, 이전 버전인 GPT-4보다 **10배 더 높은 '효과적 연산 능력(effec.. 구글의 A2A, AI 에이전트 시대의 새로운 표준이 될까? - MCP와의 비교부터 실제 사용 예시까지 한눈에 정리 AI 에이전트가 서로 대화한다고? A2A가 뭐길래 이렇게 주목받는 걸까?AI 시스템의 진화는 더 이상 단일 모델만의 문제가 아닙니다. 이제는 **여러 에이전트(Agent)**들이 협업하며 하나의 목적을 달성하는 시대입니다. 이 흐름 속에서 구글이 새로운 오픈소스 프로토콜을 공개했습니다. 이름하여 A2A(Agent to Agent).A2A는 이름 그대로, 에이전트 간 통신을 위한 프로토콜입니다. 이미 업계에서 빠르게 확산되고 있는 Anthropic의 **MCP(Model Context Protocol)**와 비교되며 등장했지만, 구글은 A2A가 MCP를 "보완하는 존재"라고 주장합니다. 과연 그럴까요?이 글에서는 다음 내용을 다룹니다:A2A는 어떤 기술인가?기존 MCP와는 무엇이 다른가?실제로 어떻게 사용.. “에이전트가 개발을 대신해준다?” Google Cloud Next ‘25, 개발의 미래를 엿보다 최근 개발자들이 가장 주목해야 할 키워드가 있다면, 단연 ‘Gemini’와 ‘에이전트’입니다. 지난 4월 열린 Google Cloud Next ‘25 개발자 키노트는 단순한 제품 발표를 넘어, 개발의 패러다임이 어떻게 전환되고 있는지를 명확하게 보여주는 자리였습니다.이 블로그에서는 키노트에서 공개된 핵심 기술들 — Gemini 모델, ADK(Agent Development Kit), Vertex AI Agent Engine, Agentspace — 을 중심으로, Google Cloud가 어떤 방향으로 개발 환경을 바꾸고 있는지 정리합니다. 단순한 요약이 아니라, 실제 개발에 어떤 도움이 되는지 중심으로 풀어볼게요.✨ Gemini, 이제는 단순한 챗봇이 아니다Gemini는 단순히 질문에 답하는 AI가 아닙.. “AI의 판을 다시 짠다” – 구글 클라우드 Next 25에서 공개된 차세대 AI 기술 총정리 AI는 지금 이 순간에도 우리 일상을 빠르게 바꾸고 있습니다. 특히, 구글 클라우드는 이번 Next 25 행사에서 AI 기술 스택 전반에 걸쳐 그야말로 '판을 흔드는' 혁신을 대거 공개했는데요. 새로운 AI 최적화 인프라부터 초강력 모델, 멀티 에이전트를 구현하는 플랫폼, 그리고 엔터프라이즈 보안까지—기업들이 AI로 비즈니스 경쟁력을 끌어올릴 수 있도록 설계된 솔루션들이 주를 이뤘습니다.이번 블로그에서는 Next 25에서 발표된 구글 클라우드의 AI 기술을 핵심 주제별로 정리하고, 실제 국내 기업들이 이를 어떻게 활용하고 있는지도 함께 소개해 드리겠습니다.1. 구글 클라우드 AI 혁신의 방향: 세 가지 핵심 축이번 Next 25의 주제는 AI 중심의 ▲최적화된 인프라, ▲강력한 모델, ▲현실화된 멀티 에.. 딥시크-R1을 넘어선 새로운 강자? - 엔비디아 '라마-3.1 네모트론 울트라 253B'의 놀라운 성능과 특징 정리 🚀 AI 추론 모델, 지금 무슨 일이 벌어지고 있는가?딥시크-R1이 등장했을 때만 해도, “이보다 더 나은 오픈소스 모델은 없을 것”이라는 반응이 많았습니다. 그러나 3개월도 채 지나지 않아, 엔비디아가 그 한계를 깼습니다.**'라마-3.1 네모트론 울트라 253B(Llama-3.1-Nemotron-Ultra-253B)'**는딥시크-R1의 절반 수준의 크기,하지만 오히려 뛰어난 성능,그리고 오픈소스 자유 라이선스를 내세워 기술 시장에 강한 충격을 줬습니다.이 블로그에서는 이 모델이 왜 주목받고 있는지, 어떤 구조적 혁신을 이뤘는지, 그리고 실제 사용 환경에서 무엇이 가능한지를 차근차근 살펴보겠습니다.🧠 ‘라마-3.1 네모트론 울트라 253B’란 무엇인가?이 모델은 엔비디아가 오픈소스로 공개한 고성능 .. 70B가 109B를 이겼다고? 새로운 오픈소스 LLM ‘Cogito’가 주목받는 이유 🧩 오픈소스 LLM의 판도를 바꾼 새로운 접근법요즘처럼 수많은 대형 언어 모델이 쏟아지는 시대에, 새로운 모델 하나 발표됐다고 해서 다들 놀라진 않죠. 하지만 이번엔 다릅니다.‘Cogito’라는 이름의 새로운 오픈소스 LLM은 70B 모델로, Llama 4의 109B 모델을 성능에서 앞질렀습니다. 단순히 파라미터 수를 줄이면서도 더 뛰어난 결과를 냈다는 것은, 기존의 ‘크기가 곧 성능’이라는 인식을 뒤엎는 사건입니다.이 모델은 단순한 기술적 성능뿐 아니라, AGI(Artificial General Intelligence, 범용 인공지능)로 가는 방향성을 열어줄 가능성까지 제시하고 있습니다. 그 핵심에는 IDA(Iterated Distillation and Amplification)라는 새로운 학습 전략.. Vectara의 ‘Open RAG Eval’로 AI 응답 품질, 더 이상 감으로 판단하지 마세요 LLM 도입했는데, 뭐가 문제인지 모르겠다면?“우리 RAG 시스템이 잘 작동하고 있는 걸까?”대형언어모델(LLM)을 도입한 많은 기업들이 겪는 대표적인 의문입니다. 응답이 똑똑해 보이긴 하지만, 실제로 정확한 정보를 기반으로 한 건지, 환각은 줄었는지… 판단 기준은 여전히 애매합니다.기존에는 “이게 더 자연스러워 보인다”, “얘가 더 유용해 보여”처럼 주관적인 비교에 의존해 성능을 평가하곤 했습니다. 하지만 이제는 다릅니다.RAG 시스템의 성능을 정량적으로 평가할 수 있는 오픈 소스 프레임워크가 등장했습니다. 바로 Vectara가 워털루대학교와 공동 개발한 **‘Open RAG Eval’**입니다.이 블로그에서는 Open RAG Eval이 무엇이고, 왜 중요한지, 어떻게 평가하는지, 그리고 어떤 점에서 .. ❝처음 보는 도구도 쓴다고?❞ LLM을 위한 새로운 프레임워크 ‘도구 사슬(CoTools)’의 등장 LLM, 이제 도구까지 '생각해서' 쓴다?요즘 AI 개발자라면 누구나 한 번쯤 이런 고민을 했을 겁니다."LLM(대형언어모델)이 똑똑하긴 한데, 새로운 툴을 쓸 땐 또 훈련을 시켜야 하잖아?"맞습니다. 그동안 LLM이 외부 애플리케이션이나 도구를 쓰려면 그 도구에 맞춰 별도로 미세조정을 해야 했죠. 문제는 이 과정이 번거롭고, 모델의 본래 성능까지 해칠 수 있다는 점이었습니다.그런데 최근, 중국 쑤저우대학교 연구진이 전혀 다른 접근법을 제시했습니다. LLM을 다시 훈련하지 않고도, 처음 보는 도구까지도 유연하게 사용할 수 있는 프레임워크를 만들었다는 소식입니다. 그 이름이 바로 **‘도구 사슬(CoTools)’**입니다.이 글에서는 이 혁신적인 기술이 어떻게 작동하는지, 기존 방식과 무엇이 다른지, 그리.. 이전 1 2 3 4 ··· 127 다음