본문 바로가기

인공지능

(164)

구글의 새로운 추론 모델, ‘Gemini 2.0 Flash Thinking’: 차세대 AI의 시작 구글이 인공지능(AI) 분야에서 또 한 번의 혁신을 선보였습니다. 12월 19일, 구글은 개발자 홈페이지를 통해 새로운 추론 전문 모델 ‘Gemini 2.0 Flash Thinking’을 발표하며, 이 분야의 선도적 위치를 강화했습니다. 이번 발표는 오픈AI, 알리바바, 문샷, 딥식 등 글로벌 주요 AI 기업들이 추론 모델 경쟁에 가세하는 가운데 이뤄졌습니다.‘Gemini 2.0 Flash Thinking’ 주요 특징멀티모달 기능‘Gemini 2.0 Flash Thinking’은 이미지와 텍스트를 입력으로 받아들이는 멀티모달 이해 능력을 자랑합니다. 출력은 텍스트로 제한되지만, 입력 방식의 유연성이 큰 강점으로 작용합니다.단계별 추론 과정 공개기존 모델들과 차별화된 특징으로, 사용자가 추론 과정을 단계별..

OpenAI의 혁신적 도약: 세계 최초 AGI 근접 모델 o3 공개 인공지능(AI) 연구의 궁극적인 목표였던 인공지능 일반(AGI)이 한 발짝 더 가까워졌습니다. OpenAI는 새로운 모델인 o3를 발표하며 이를 최초로 AGI에 근접한 모델로 소개했습니다. 이전의 혁신적인 모델인 o1의 후속작으로, o3는 AI 성능의 새로운 기준을 제시하며 큰 주목을 받고 있습니다. 이 발표는 OpenAI의 연례 이벤트인 Shipmas의 마지막 날에 이루어졌습니다.새로운 AI의 시대: o3의 특별함은 무엇인가?OpenAI의 o3는 단순한 업그레이드가 아니라 AI의 능력을 새로운 차원으로 끌어올린 모델입니다. OpenAI의 CEO 샘 알트먼은 "o3는 차세대 AI의 시작이며, 매우 복잡한 작업을 처리할 수 있는 능력을 갖췄다"고 설명했습니다.특히, o3는 AGI-like 능력을 평가하기 ..

“구글의 비오 2, 소라를 완전히 압도” – 테스터들이 말하는 충격적인 비교 결과 최근 구글의 동영상 생성 AI 모델 ‘비오 2(Veo 2)’가 테스트 버전으로 일부 사용자에게 공개되며, 오픈AI의 ‘소라(Sora)’와의 직접 비교가 시작되었습니다. 각종 소셜 미디어와 전문가들의 리뷰에 따르면, 비오 2는 동영상 생성에서 소라를 압도적으로 능가하며 특히 물리적 현실성을 훌륭히 반영하고 있다는 평가를 받고 있습니다.테스터들의 비교 리뷰가 쏟아지다비즈니스 인사이더는 12월 19일, 비오 2를 사용해본 테스터들이 소라보다 뛰어난 성능을 자랑하는 영상을 잇달아 공개하고 있다고 보도했습니다. 같은 프롬프트를 사용했음에도 두 모델이 생성한 결과물은 극명히 달랐는데, 많은 리뷰에서 비오 2의 압도적인 성능이 부각되었습니다.물리적 현실성에서의 큰 차이TED 진행자인 빌라왈 시두는 자신의 X(구 트위..

최첨단 인공지능의 실험적 진화: Google Gemini-Exp-1206을 만나보세요 Google이 최신 인공지능 기술을 바탕으로 Gemini 2.0 모델의 실험적 버전, Gemini-Exp-1206을 발표했습니다. 이 모델은 개발자, 학생, 전문가들에게 강력한 문제 해결 능력을 제공하며, 코드 생성, 수학적 문제 풀이, 구조화된 작업 수행 등에서 250% 이상의 성능 향상을 보여주고 있습니다. 본 블로그에서는 Gemini-Exp-1206의 주요 특징과 장점, 그리고 이 모델이 여러분의 작업과 학습에 어떻게 도움을 줄 수 있는지 자세히 살펴보겠습니다.Gemini-Exp-1206의 주요 특징복잡한 코딩 문제 해결개발자들이 가장 선호하는 기능 중 하나는 이 모델이 복잡한 코딩 문제를 빠르게 해결할 수 있다는 점입니다. 고급 수준의 코드 생성 및 디버깅 지원은 개발 생산성을 크게 향상시킬 것입..

무료로 누려보세요: GitHub Copilot Free로 코드 작성의 새로운 시대를 열다 코드를 작성하는 개발자들에게 더 좋은 소식이 있을까요? GitHub가 VS Code 사용자들을 위해 완전히 새로운 무료 요금제를 발표했습니다! GitHub Copilot Free는 이제 누구나 GitHub 계정만 있으면 사용할 수 있으며, 체험판이나 신용카드 없이 바로 시작할 수 있습니다.GitHub Copilot Free: 무엇을 제공하나요?GitHub Copilot Free는 월 2000회의 코드 완성 기능과 50회의 채팅 요청을 제공합니다. 이를 일일로 계산하면 약 80번의 코드 완성을 사용할 수 있다는 의미로, 충분한 수치입니다. 이와 더불어 GPT-4o 및 Claude 3.5 Sonnet 모델에 접근할 수 있습니다.만약 제공되는 한도를 초과할 경우, 이는 Copilot이 본인의 작업을 훌륭히 지..

LLM앱 오픈소스 Observability, Laminar를 소개합니다 요즘 ChatGPT, Bard와 같은 대규모 언어 모델(LLM)을 활용한 애플리케이션 개발이 뜨거운 관심을 받고 있습니다. 하지만 LLM 앱의 복잡한 파이프라인을 안정적으로 운영하고, 데이터를 추적하며, 분석 가능한 상태로 유지하는 것은 여전히 어려운 과제입니다. 이에 대한 해결책으로 등장한 것이 바로 Laminar입니다. Laminar는 LLM 앱을 위한 오픈소스 관찰 및 분석 플랫폼으로, DataDog과 PostHog를 결합한 형태의 혁신적인 도구입니다.Laminar란 무엇인가요?Laminar는 LLM 앱의 데이터를 추적(Trace), 평가(Evaluate), 라벨링(Label), 분석(Analyze)하는 데 특화된 플랫폼입니다. Rust 기반으로 구축되었으며, 다음과 같은 스택을 활용합니다:Rabb..

Carbon과 함께 더 강력해지는 Perplexity: 데이터를 연결하는 새로운 도약 2024년, Perplexity는 AI 기술의 혁신과 서비스 확장을 통해 전례 없는 성장을 이뤄냈습니다. 올해도 이러한 흐름을 이어가고자, 데이터 연결성을 혁신하는 스타트업 Carbon을 인수하게 되었음을 발표하게 되어 기쁩니다! Carbon은 외부 데이터 소스를 대형 언어 모델과 연결하는 획기적인 검색 엔진 기술을 보유하고 있습니다. 이번 인수를 통해 Perplexity는 사용자 경험을 한 단계 더 발전시킬 준비를 마쳤습니다.Carbon과 함께하는 데이터 연결의 진화Perplexity는 여러분의 AI가 개인화된 경험을 제공할 수 있어야 한다고 믿습니다. Carbon의 데이터 커넥터는 Notion, Google Docs와 같은 애플리케이션을 Perplexity에 직접 연결할 수 있도록 하여, 사용자들의 ..

Meshtron: 3D 아티스트 수준의 고품질 메시 생성 기술을 탐구하다 3D 모델링 세계에서 메시는 영화, 디자인, 게임 산업의 필수적인 요소로, 대부분의 3D 소프트웨어와 그래픽 하드웨어에서 기본적으로 지원되는 표준 표현 방식입니다. 최근 NVIDIA는 “Meshtron”이라는 새로운 자동 회귀 메시 생성 모델을 발표하며 3D 모델링 기술의 새로운 지평을 열었습니다. 이번 블로그에서는 Meshtron의 주요 기능과 혁신적인 기술적 특징을 알아보겠습니다.3D 메시와 Meshtron의 등장 배경3D 메시란 다각형 면으로 구성된 3D 오브젝트의 표현 방식입니다. 보통 삼각형이나 사각형 면으로 이루어져 있으며, 메시의 중요한 속성 중 하나는 “토폴로지”입니다. 이는 메시의 면이 객체의 구조와 얼마나 잘 일치하는지에 대한 조직 방식을 의미합니다. 숙련된 아티스트가 만든 메시들은 정..

이전 1 2 3 4 5 ··· 21 다음

티스토리툴바