최근 오픈AI가 챗GPT의 고급 음성 모드(AVM)에 실시간 영상 이해 기능을 추가하면서 새로운 AI 기술의 지평을 열고 있습니다. 이는 7개월 전 공개된 GPT-4o에서 데모로 소개되었던 기술로, 드디어 실제 서비스에 적용된 것입니다. 이번 업데이트는 챗GPT 플러스 사용자들을 대상으로 점진적으로 배포되고 있으며, 크리스마스를 겨냥한 특별한 산타 목소리 기능도 추가되어 사용자들에게 즐거움을 선사하고 있습니다.
실시간 영상 이해, AI의 새로운 가능성
이 새로운 기능은 스마트폰 카메라로 사물을 비추면 해당 사물을 인식하고 질문에 답하거나 설명을 제공하는 고도화된 기술입니다. 예를 들어, 복잡한 설정 메뉴를 손쉽게 이해하거나, 어려운 수학 문제를 풀이해주는 데 활용할 수 있습니다. 이런 실시간 비전 AI 기술은 AI 음성 비서의 핵심 기능으로 자리 잡을 전망입니다.
구글이 최근 발표한 AI 에이전트 '프로젝트 아스트라' 역시 실시간 영상 이해를 주요 기능으로 내세우고 있어, AI 기술 경쟁이 한층 치열해질 것으로 보입니다.
사용 방법
새로운 기능은 간단하게 사용할 수 있습니다.
- 챗GPT 앱에서 채팅 바 옆의 음성 아이콘을 탭합니다.
- 왼쪽 하단의 비디오 아이콘을 누르면 기능이 활성화됩니다.
- 필요에 따라 화면 공유도 가능합니다.
현재 이 기능은 챗GPT 플러스 사용자들에게 제공되고 있으며, 다음 주까지 업데이트가 완료될 예정입니다. 다만, 국내에서는 아직 이 기능이 적용되지 않은 상태입니다.
산타 목소리, 크리스마스 분위기를 더하다
오픈AI는 크리스마스 시즌을 맞아 AVM에 특별한 '산타 목소리'를 추가했습니다.
- 사용자는 챗GPT 앱에서 눈송이 아이콘을 탭해 산타 모드를 활성화할 수 있습니다.
- 산타 목소리는 1월 초까지 제공되며, 채팅 기록이나 메모리에 저장되지 않아 부담 없이 이용 가능합니다.
향후 업데이트
- 챗GPT 엔터프라이즈와 에듀 버전은 2024년 1월에 업데이트될 예정입니다.
- 유럽연합(EU), 스위스 등 일부 국가에서는 기능 도입이 당분간 보류됩니다.
마무리
이번 업데이트는 AI 기술이 일상생활에서 어떻게 활용될 수 있는지를 보여주는 중요한 사례입니다. 실시간 영상 이해 기능과 크리스마스를 위한 특별한 음성 모드는 사용자 경험을 더욱 풍성하게 만들어 줄 것입니다. 국내 출시가 기다려지는 만큼, 앞으로 오픈AI의 행보에 더욱 기대가 모아집니다.
'인공지능' 카테고리의 다른 글
Veo 2와 Imagen 3: 상상력을 현실로 바꾸는 Google의 최신 영상·이미지 생성 기술 (0) | 2024.12.17 |
---|---|
Gemini 2.0: 미래의 AI를 열다 - 에이전트 AI와 그 진화 이야기 (w Oriol Vinyals) (0) | 2024.12.16 |
AI 기술의 새로운 도약: 오픈AI 동영상 생성 AI 'Sora' 출시! (0) | 2024.12.13 |
구글의 새로운 AI 혁신: Gemini 2.0와 AI 에이전트 시대의 시작 (0) | 2024.12.12 |
오픈소스 AI 모델 트렌드: 가장 인기 있고 많이 다운로드된 모델은? (0) | 2024.12.11 |