본문 바로가기

인공지능

구글의 새로운 추론 모델, ‘Gemini 2.0 Flash Thinking’: 차세대 AI의 시작

728x90
반응형

구글이 인공지능(AI) 분야에서 또 한 번의 혁신을 선보였습니다. 12월 19일, 구글은 개발자 홈페이지를 통해 새로운 추론 전문 모델 ‘Gemini 2.0 Flash Thinking’을 발표하며, 이 분야의 선도적 위치를 강화했습니다. 이번 발표는 오픈AI, 알리바바, 문샷, 딥식 등 글로벌 주요 AI 기업들이 추론 모델 경쟁에 가세하는 가운데 이뤄졌습니다.

반응형

‘Gemini 2.0 Flash Thinking’ 주요 특징

  1. 멀티모달 기능
    • ‘Gemini 2.0 Flash Thinking’은 이미지와 텍스트를 입력으로 받아들이는 멀티모달 이해 능력을 자랑합니다. 출력은 텍스트로 제한되지만, 입력 방식의 유연성이 큰 강점으로 작용합니다.
  2. 단계별 추론 과정 공개
    • 기존 모델들과 차별화된 특징으로, 사용자가 추론 과정을 단계별로 확인할 수 있는 드롭다운 메뉴를 제공합니다. 이는 오픈AI의 o1과 같은 경쟁 모델이 추론 구조를 비밀로 유지하는 것과는 대조적입니다.
  3. 토큰 처리 성능
    • 입력 토큰: 최대 32,000개 (약 50~60페이지 분량의 텍스트)
    • 출력 토큰: 최대 8,000개
    • 이는 기존 ‘Gemini’ 모델의 최대 128,000개 토큰 대비 줄어든 컨텍스트 창 크기입니다. 그러나 이 모델은 실험적인 초기 단계로, 앞으로의 확장 가능성이 기대됩니다.
  4. 컴퓨팅 효율성
    • 생각의 사슬(Chain of Thought) 방식으로 까다로운 확률 문제를 해결하며, 테스트-타임 컴퓨트(Test-Time Compute) 방식을 채택해 높은 연산량을 요구합니다. 이로 인해 추론 시간은 수십 초에서 몇 분까지 소요될 수 있습니다.
  5. 제미나이 API와 AI 스튜디오 지원
    • 개발자들이 모델을 직접 체험해볼 수 있도록 AI 스튜디오 데모 페이지와 Gemini API를 함께 제공하고 있습니다.

IM 아레나 순위에서의 주목

사용자 선호도 순위를 매기는 플랫폼 ‘IM 아레나’에서 ‘Gemini 2.0 Flash Thinking’은 최근 출시된 ‘Gemini-EXP-1206’에 이어 2위를 차지했습니다. 이는 모델이 초기 단계임에도 불구하고 많은 사용자들의 관심을 끌고 있다는 점을 보여줍니다.

차별화된 접근 방식

순다르 피차이 구글 CEO는 “지금까지 우리가 만든 가장 사려 깊은 모델”이라며 ‘Gemini 2.0 Flash Thinking’의 혁신성을 강조했습니다. 특히, 구글은 모델의 훈련 방식, 아키텍처, 학습 데이터 등 세부적인 정보는 공개하지 않았지만, 추론 과정의 투명성을 강조하며 사용자 신뢰도를 높이는 전략을 택했습니다.

글로벌 AI 격전지의 부상

이번 구글의 발표로 AI 추론 모델 분야는 본격적인 경쟁 구도로 접어들었습니다. 오픈AI는 2주 전 o1 풀 버전과 o1-프로를 출시하며 멀티모달 입력 기능 추가를 예고했고, 알리바바, 문샷, 딥식, 앤트로픽 등 다양한 기업들도 추론 모델 개발에 박차를 가하고 있습니다.

728x90

앞으로의 전망

‘Gemini 2.0 Flash Thinking’은 구글의 추론 AI 여정에서 첫 번째 단계에 불과합니다. 로건 킬패트릭 AI 스튜디오 리더는 “이 모델은 실험적인 초기 단계로, 앞으로의 발전 가능성이 크다”고 밝혔습니다. 차세대 추론 모델의 발전이 사용자들에게 어떤 혁신적인 가치를 제공할지 기대됩니다.

728x90
반응형