잡학다식/IT 컬럼

구글 I/O 2025, AI 기술의 판을 다시 짜다: 제미나이 울트라와 비오 3, 이매진 4의 모든 것

파파누보 2025. 5. 11. 02:08
728x90
반응형

 

이번 구글 I/O는 왜 주목해야 하는가

매년 열리는 구글 I/O는 단순한 기술 행사 그 이상입니다. 새로운 시대를 여는 기술들이 무대에 올라오고, 앞으로의 일상과 산업을 뒤바꿀 수 있는 신기술이 소개되는 자리이기도 하죠.

올해 가장 많은 주목을 받고 있는 것은 ‘제미나이 울트라(Gemini Ultra)’입니다. 이는 구글이 지금까지 공개한 AI 모델 중 가장 크고 강력한 멀티모달 모델로, 기존의 한계를 뛰어넘는 기능을 담고 있습니다. 여기에 동영상 생성 모델 ‘비오 3(Veo 3)’와 이미지 생성 모델 ‘이매진 4(Imagen 4)’까지 함께 공개될 예정입니다.

이번 글에서는 구글이 선보일 최신 AI 모델들과 기능, 요금제 변화, 그리고 앞으로의 방향성까지 하나씩 짚어보겠습니다.

반응형

https://x.com/legit_api/status/1920961439554056382

제미나이 울트라: 구글의 가장 강력한 멀티모달 AI 모델

구글은 지난해 ‘제미나이 2.0’을 시작으로 ‘프로’와 ‘플래시’ 모델을 순차적으로 공개해 왔습니다. 하지만 ‘울트라’는 그 중에서도 최상위 모델로, 영상과 이미지 등 다양한 입력을 동시에 처리할 수 있는 멀티모달 처리 능력이 핵심입니다.

공개된 코드 메시지에 따르면, 울트라는 단순한 텍스트 생성 모델이 아닌 이미지 생성과 동영상 요약 등 복합 기능을 하나의 모델에서 수행하는 것이 특징입니다.
이로 인해 실제 서비스에서는 “생성된 동영상 한도에 도달했습니다. 다시 시도하거나 제미나이 울트라로 업그레이드하세요”라는 안내 메시지가 나타나는 등, 기존 모델과의 기능 격차도 분명히 존재합니다.

기술적으로 울트라는 다양한 데이터를 함께 이해하고 생성하는 능력을 기반으로 하며, 단일 작업이 아닌 **복합 작업 흐름(AI workflow)**을 수행하는 데 초점이 맞춰져 있습니다.


비오 3와 이매진 4: 고도화된 생성형 미디어 AI

이번 I/O에서 공개될 또 다른 핵심 기술은 바로 동영상 생성 모델 ‘비오 3(Veo 3)’와 이미지 생성 모델 ‘이매진 4(Imagen 4)’입니다.

비오 3는 지난해 출시된 ‘비오 2’의 후속으로 보이며, 코드 내 표현으로는 ‘veo-3.0-generate-preview’라는 형태로 등장했습니다. 동영상에 특화된 모델인 만큼, 스토리 기반의 시각 콘텐츠를 자동으로 생성하거나 요약하는 데 활용될 수 있습니다.

이매진 4는 ‘imagen-4.0-generate-preview’ 외에도 ‘울트라’ 버전이 존재하는 것으로 알려졌습니다. 특히 ‘imagen-4.0-ultra’로 표기된 부분은 제미나이 울트라와 통합되어 멀티모달 환경에서도 이미지 생성을 유기적으로 처리할 수 있음을 보여줍니다.

이러한 AI 모델들은 단순히 사진 한 장을 그리는 것을 넘어서, 시각적 콘텐츠 생성의 전 과정을 자동화하는 데 초점을 맞추고 있습니다.


새로운 프리미엄 요금제: 울트라의 문턱은 어디인가

제미나이 울트라의 등장과 함께, 구글은 새로운 요금제 시스템을 도입할 예정입니다. 현재는 월 20달러 수준의 ‘제미나이 어드밴스드’ 요금제를 통해 고급 기능을 제공하고 있으나, 이번에 등장한 ‘프리미엄 플러스’와 ‘프리미엄 프로’는 더 높은 단계의 서비스를 제공하는 것으로 추정됩니다.

코드 상 메시지에는 업그레이드를 유도하는 문구가 포함돼 있으며, 사용량 제한이 도달했을 경우 업그레이드를 통해 모델 접근 권한을 확장할 수 있도록 설계되어 있습니다.

이러한 전략은 고사양 AI 모델이 상용화되면서 발생할 수 있는 리소스 부담을 요금제로 조정하려는 의도가 엿보입니다. 사용자는 기능별로 어떤 요금제가 적절한지 판단할 수 있는 가이드가 필요해질 것입니다.


프로젝트 아스트라 & 매리너: AI 에이전트의 진화

구글은 지난해 12월 공개했던 프로젝트 아스트라와 프로젝트 매리너의 업데이트도 이번 행사에서 함께 소개할 예정입니다.

프로젝트 아스트라는 영상 분석 능력을 갖춘 AI 에이전트로, 현재는 제미나이 앱 내에 일부 기능이 통합된 상태입니다. 향후에는 삼성전자의 XR 헤드셋이나 스마트 안경 등에도 AI 음성 비서로 적용될 예정입니다. 즉, 시각 기반 인터페이스에서의 AI 확장을 보여주는 사례입니다.

프로젝트 매리너는 GUI 기반 AI 에이전트로, 오픈AI의 오퍼레이터, 앤트로픽의 컴퓨터 유즈와 같은 흐름에 대응하는 솔루션입니다. 그동안 후속 정보가 거의 없었으나, 이번에는 기능 업그레이드를 넘어 정식 출시 가능성도 제기되고 있습니다.


노트북LM과 비디오 개요 기능: 요약 기술의 새로운 방향

구글의 히트 서비스 중 하나였던 ‘노트북LM’도 이번에 새로운 기능으로 확장됩니다. 바로 ‘비디오 개요(Video Overview)’ 기능입니다.

기존의 노트북LM이 문서 기반 정보를 요약하는 데 초점을 뒀다면, 이제는 동영상을 입력하면 자동으로 핵심 내용을 추출하고 이를 팟캐스트 형태로 변환해 주는 방식입니다. 이 기능은 비오 2 모델을 기반으로 한다고 알려져 있습니다.

이 기능은 영상 콘텐츠의 소비 방식 자체를 바꿀 수 있는 잠재력을 지니고 있으며, 정보 소화 속도를 획기적으로 줄이는 도구로 주목받고 있습니다.


728x90

이번 I/O는 단순한 AI 발표가 아니다

구글 I/O 2025에서 발표될 기술은 단순히 모델 이름이 바뀐 것이 아닙니다. 제미나이 울트라를 비롯한 여러 기술은 멀티모달 AI의 실사용 시대를 알리는 신호탄이라 할 수 있습니다.

이제 AI는 단순한 텍스트 생성 수준을 넘어, 실제 업무, 콘텐츠 제작, 사용자 인터페이스의 방식까지 재정의하고 있습니다. 동영상, 이미지, 텍스트를 하나의 흐름으로 이해하고 처리하는 시스템이 본격적으로 등장했다는 점에서, 이번 구글 I/O는 중요한 전환점이 될 것입니다.

앞으로 이 기술들이 어떻게 상용화되고, 사용자 경험을 어떻게 바꿔나갈지 주목해 볼 필요가 있습니다. 빠르게 변하는 흐름 속에서 어떤 모델이 내게 맞는지, 어떤 기능이 필요한지를 판단할 수 있는 안목이 그 어느 때보다 중요해졌습니다.

 

728x90
반응형