인공지능 (210) 썸네일형 리스트형 중국 AI 산업의 전략적 진화: 바이트댄스의 멀티모달 모델 혁신과 가격 경쟁 최근 중국 AI 산업은 극심한 경쟁과 급속한 기술 발전 속에서 대규모 재편을 겪고 있습니다. 이러한 맥락에서, 바이트댄스(Bytedance)는 새로운 멀티모달 모델 "두바오 영상 이해 모델(Doubao Vision Understanding Model)"을 발표하며 시장 판도를 흔들고 있습니다. 2023년 10월 18일 포스 컨퍼런스에서 발표된 이 모델은 1000토큰당 0.003위안이라는 초저가로 제공되며, 이는 기존 업계 평균 대비 85% 이상 저렴한 가격입니다. 이러한 가격 전략은 단순한 시장 점유를 넘어 AI 기술의 대중화를 목표로 하고 있음을 시사합니다.AI 기술 생태계에서의 무료화 경쟁: 알리바바와 바이트댄스의 사례AI 생태계에서의 "무료화" 경쟁은 단순한 가격 인하 이상의 전략적 함의를 지닙니다.. 허깅페이스의 테스트-타임 스케일링: 소형 언어 모델의 한계를 뛰어넘다 최근 허깅페이스(Hugging Face)가 소형 언어 모델(sLM, small Language Model)의 추론 성능을 획기적으로 향상시키는 새로운 기술, **테스트-타임 스케일링(test-time scaling)**을 공개했습니다. 이 기술은 대형 언어 모델(LLM, Large Language Model)을 구동하기 어려운 환경에서 유용하며, 특히 코딩이나 수학처럼 명확한 평가 기준이 있는 문제에서 빛을 발합니다. 이번 블로그에서는 테스트-타임 스케일링의 핵심 개념과 이를 통해 달성한 성과를 살펴보겠습니다.테스트-타임 스케일링이란?테스트-타임 스케일링은 **테스트-타임 컴퓨트(Test-Time Compute)**라는 접근법을 기반으로, 모델 추론 과정에서 추가적인 컴퓨팅 자원과 시간을 투입하여 응답 .. 작은 거인의 탄생: Microsoft의 복잡한 추론 전문가, Phi-4를 소개합니다! Microsoft는 최근 최신 소형 언어 모델(Small Language Model, SLM)인 Phi-4를 공개했습니다. Phi-4는 140억 개의 매개변수를 가진 소형 모델임에도 불구하고 복잡한 수학적 문제와 언어 처리 작업에서 탁월한 성능을 발휘합니다. 이번 블로그에서는 Phi-4가 왜 혁신적인 모델인지, 그리고 실제로 어떻게 활용될 수 있는지 자세히 알아보겠습니다.Phi-4의 놀라운 성능: 작지만 강하다Phi-4는 Microsoft의 Phi 모델 패밀리의 최신 모델로, 특히 수학적 추론에서 독보적인 성능을 자랑합니다. 이는 고품질 합성 데이터셋 사용, 정교한 유기적 데이터 수집, 그리고 후처리 기술 혁신 덕분입니다. Phi-4는 "크기가 작아도 품질은 우수하다"는 소형 언어 모델의 새로운 가능성을.. GPT-5, 혁신의 한계인가? 차세대 AI가 넘어야 할 산들 1. GPT-5 개발의 한계와 주요 도전 과제OpenAI의 GPT-5(코드명 "Orion")는 기존 GPT-4를 뛰어넘는 기술적 진보를 목표로 하지만, 여러 제약과 문제로 개발이 지연되고 있습니다. 현재까지 두 차례의 대규모 훈련이 진행되었으나, 예상 성능을 만족시키지 못하고 기존 모델과 큰 차별성을 보여주지 못하고 있습니다.제약 사항:고품질 데이터 부족GPT-5의 성능 향상을 위해 더 많은 고품질 데이터가 필요하지만, 인터넷에는 이미 사용 가능한 데이터의 한계에 도달.OpenAI는 데이터 생성 방식(예: 수학 문제 해결, 코드 작성)을 통해 이를 보완하려 하지만, 이 과정에서 발생하는 오류와 비합리적 결과가 문제로 지적.합성 데이터 활용도 진행 중이나, 신뢰성과 정확성이 떨어질 위험 존재.막대한 개발 .. 머신 러닝, 시스템을 혁신하다: ML for Systems 오늘날 머신 러닝(ML)은 단순히 데이터를 분석하고 예측하는 데 그치지 않고, 컴퓨터 시스템 자체를 근본적으로 혁신하고 있습니다. 이번 블로그에서는 컴파일러 최적화, 메모리 할당 정책, 추론 가속화, 그리고 칩 설계 자동화에 이르기까지, ML이 시스템 전반에서 어떻게 사용되고 있는지 살펴보겠습니다. Google을 비롯한 여러 연구자들의 최첨단 연구와 기술 사례를 통해 ML이 시스템 개선에 어떤 영향을 미치고 있는지 알아봅시다.컴파일러 최적화: 휴리스틱에서 학습 기반으로컴파일러는 소프트웨어를 하드웨어에서 실행 가능한 코드로 변환하는 중요한 역할을 합니다. 기존에는 휴리스틱 기반 방식이 주를 이루었지만, ML을 활용한 학습 기반 최적화가 점차 대두되고 있습니다. 예를 들어, Mengpo의 연구에서는 학습된 .. 구글의 새로운 혁신: 'Deep Research'로 인공지능이 당신의 리서치 전문가가 된다 인공지능 분야에서 끊임없는 혁신을 보여주고 있는 구글이 또 한 번 놀라운 기능을 선보였습니다. Gemini의 새로운 기능인 'Deep Research'는 기존 AI 비서의 한계를 뛰어넘어, 마치 숙련된 연구원처럼 체계적으로 정보를 수집하고 분석하는 능력을 보여줍니다.Gemini 2.0: AI의 새로운 지평순다르 피차이 구글 CEO가 설명한 바와 같이, Gemini 2.0은 이전 버전과는 차원이 다른 혁신적인 도약을 이루었습니다. 단순한 데이터 처리를 넘어, 추론, 계획 수립, 그리고 실행이라는 '에이전틱 AI' 단계로 진화한 것입니다.주요 특징독립적인 복잡한 작업 수행 능력체계적인 정보 수집 및 분석인간 수준의 리서치 능력Deep Research의 작동 방식1. 연구 계획 수립사용자가 주제나 질문을 입력.. 구글의 새로운 추론 모델, ‘Gemini 2.0 Flash Thinking’: 차세대 AI의 시작 구글이 인공지능(AI) 분야에서 또 한 번의 혁신을 선보였습니다. 12월 19일, 구글은 개발자 홈페이지를 통해 새로운 추론 전문 모델 ‘Gemini 2.0 Flash Thinking’을 발표하며, 이 분야의 선도적 위치를 강화했습니다. 이번 발표는 오픈AI, 알리바바, 문샷, 딥식 등 글로벌 주요 AI 기업들이 추론 모델 경쟁에 가세하는 가운데 이뤄졌습니다.‘Gemini 2.0 Flash Thinking’ 주요 특징멀티모달 기능‘Gemini 2.0 Flash Thinking’은 이미지와 텍스트를 입력으로 받아들이는 멀티모달 이해 능력을 자랑합니다. 출력은 텍스트로 제한되지만, 입력 방식의 유연성이 큰 강점으로 작용합니다.단계별 추론 과정 공개기존 모델들과 차별화된 특징으로, 사용자가 추론 과정을 단계별.. OpenAI의 혁신적 도약: 세계 최초 AGI 근접 모델 o3 공개 인공지능(AI) 연구의 궁극적인 목표였던 인공지능 일반(AGI)이 한 발짝 더 가까워졌습니다. OpenAI는 새로운 모델인 o3를 발표하며 이를 최초로 AGI에 근접한 모델로 소개했습니다. 이전의 혁신적인 모델인 o1의 후속작으로, o3는 AI 성능의 새로운 기준을 제시하며 큰 주목을 받고 있습니다. 이 발표는 OpenAI의 연례 이벤트인 Shipmas의 마지막 날에 이루어졌습니다.새로운 AI의 시대: o3의 특별함은 무엇인가?OpenAI의 o3는 단순한 업그레이드가 아니라 AI의 능력을 새로운 차원으로 끌어올린 모델입니다. OpenAI의 CEO 샘 알트먼은 "o3는 차세대 AI의 시작이며, 매우 복잡한 작업을 처리할 수 있는 능력을 갖췄다"고 설명했습니다.특히, o3는 AGI-like 능력을 평가하기 .. 이전 1 ··· 4 5 6 7 8 9 10 ··· 27 다음