본문 바로가기

인공지능

GPT-5.4 공개: 차세대 AI 모델의 주요 기능과 기술적 특징 정리

728x90
반응형
728x170

OpenAI는 ChatGPT, API, Codex 전반에 적용되는 최신 프런티어 모델 GPT-5.4를 공개했습니다. 이 모델은 기존 모델 대비 추론 능력, 코딩 성능, 에이전트 기반 워크플로우 수행 능력을 통합적으로 강화한 것이 특징입니다. 특히 네이티브 컴퓨터 사용 기능, 최대 1M 토큰 컨텍스트 지원, 향상된 시각 인식 및 문서 이해 능력 등 다양한 기능 개선이 이루어졌습니다.

이번 글에서는 GPT-5.4의 전반적인 개념과 등장 배경, 핵심 기술 특징, 성능 개선 사항, 그리고 실제 업무 환경에서 기대되는 활용 가능성까지 주요 내용을 정리합니다.

반응형

GPT-5.4 개요

GPT-5.4는 ChatGPT, API, Codex 환경에서 동시에 사용할 수 있는 최신 AI 모델로, 기존 GPT-5.2 및 GPT-5.3-Codex의 장점을 통합하여 설계되었습니다.

주요 특징은 다음과 같습니다.

  • 추론, 코딩, 에이전트 작업 능력 통합
  • 전문 업무 환경에서의 정확도 및 생산성 향상
  • 도구 및 소프트웨어 환경 간 연동 강화
  • 장문 컨텍스트 처리 능력 개선

특히 GPT-5.3-Codex의 코딩 능력을 통합하면서 개발 작업뿐 아니라 스프레드시트, 프레젠테이션, 문서 작성 등 다양한 업무 환경에서의 정확도와 효율성이 크게 향상되었습니다.

또한 GPT-5.4 Pro 버전은 복잡한 작업 환경에서 최대 성능을 제공하는 고성능 모델로 제공됩니다.


ChatGPT Thinking 모드 개선

GPT-5.4에서는 ChatGPT의 Thinking 모드가 크게 개선되었습니다.

주요 변화는 다음과 같습니다.

사전 사고 계획(Preamble) 제공

작업을 시작할 때 모델이 사전 계획 형태의 사고 과정을 제시합니다.
이를 통해 사용자는 응답이 생성되는 과정 중에도 방향을 조정할 수 있습니다.

이 기능은 다음과 같은 장점을 제공합니다.

  • 추가 질문 없이도 원하는 결과에 가까운 응답 생성
  • 사용자 의도와 모델 출력 간의 불일치 감소
  • 복잡한 문제 해결 과정의 가시성 향상

깊은 웹 리서치 능력 향상

특히 매우 구체적인 질문에서 다음과 같은 성능이 개선되었습니다.

  • 긴 맥락을 유지한 정보 탐색
  • 다단계 검색 기반 답변 생성
  • 복잡한 정보 분석 속도 향상

이러한 개선을 통해 복잡한 질문에서도 더 정확한 결과를 빠르게 제공할 수 있습니다.


네이티브 컴퓨터 사용 기능

GPT-5.4의 가장 큰 변화 중 하나는 네이티브 computer-use 기능입니다.

이 기능을 통해 AI 에이전트가 실제 컴퓨터 환경에서 다음과 같은 작업을 수행할 수 있습니다.

  • 웹사이트 탐색
  • 소프트웨어 조작
  • UI 기반 작업 자동화

지원 방식

GPT-5.4는 두 가지 방식의 컴퓨터 제어를 지원합니다.

  1. 코드 기반 제어
    • Playwright 같은 라이브러리를 통해 프로그램적으로 제어
  2. 화면 기반 제어
    • 스크린샷을 기반으로 마우스 및 키보드 명령 수행

또한 개발자는 confirmation policy를 통해 위험 허용 수준을 설정하고 에이전트 행동을 제어할 수 있습니다.

관련 벤치마크 성능

  • OSWorld-Verified: 75.0% (인간 성능 72.4% 초과)
  • WebArena-Verified: 67.3%
  • Online-Mind2Web: 92.8%

이는 실제 소프트웨어 작업 수행 능력이 크게 향상되었음을 보여줍니다.


시각 인식 및 문서 파싱 능력 향상

GPT-5.4는 시각 이해 능력도 크게 개선되었습니다.

이미지 입력 해상도 확장

새로운 이미지 입력 옵션이 추가되었습니다.

  • original: 최대 10.24M 픽셀 또는 6000px
  • high: 최대 2.56M 픽셀 또는 2048px

이를 통해 다음과 같은 작업에서 정확도가 향상되었습니다.

  • UI 위치 파악
  • 이미지 기반 클릭 작업
  • 복잡한 문서 이해

문서 인식 성능

OmniDocBench 기준

  • GPT-5.4: 평균 오류 0.109
  • GPT-5.2: 평균 오류 0.140

문서 파싱 정확도가 크게 향상된 것을 확인할 수 있습니다.


코딩 성능 및 개발 환경 개선

GPT-5.4는 GPT-5.3-Codex의 코딩 능력을 통합하면서 개발 환경에서도 많은 개선이 이루어졌습니다.

코딩 벤치마크

SWE-Bench Pro 기준

  • GPT-5.4: 57.7%
  • GPT-5.3-Codex: 56.8%
  • GPT-5.2: 55.6%

또한 모든 추론 수준에서 더 낮은 레이턴시를 제공합니다.

Codex 성능 개선

Codex 환경에서는 다음 기능이 추가되었습니다.

  • /fast 모드: 최대 1.5배 빠른 토큰 속도
  • Priority Processing: API에서 동일한 고속 처리 지원

또한 Playwright (Interactive) 기능을 통해 웹 및 Electron 앱을 실시간으로 테스트하고 시각적으로 디버깅할 수 있습니다.


Tool Search 기능

기존 AI 에이전트 환경에서는 모든 도구 정의를 프롬프트에 포함해야 했습니다.
이 방식은 수천~수만 토큰을 소비하는 문제가 있었습니다.

GPT-5.4에서는 Tool Search 기능을 통해 이를 개선했습니다.

작동 방식

  1. 프롬프트에는 경량 도구 목록만 포함
  2. 필요할 때 도구 정의를 동적으로 조회

효과

  • 토큰 사용량 감소
  • 캐시 활용 증가
  • 응답 속도 향상

실제 MCP Atlas 벤치마크에서는 다음과 같은 결과가 확인되었습니다.

  • 총 토큰 사용량 47% 감소
  • 정확도 동일 유지

전문 업무 및 지식 작업 성능

GPT-5.4는 실제 업무 환경에서도 높은 성능을 보였습니다.

GDPval 평가 결과

  • GPT-5.4: 83.0% 전문가 수준 일치 또는 초과
  • GPT-5.2: 70.9%

평가 작업 예시는 다음과 같습니다.

  • 영업 프레젠테이션 제작
  • 회계 스프레드시트 모델링
  • 의료 일정 관리
  • 제조 공정 다이어그램 작성

또한 투자은행 스프레드시트 모델링 벤치마크에서는 평균 87.3% 정확도를 기록했습니다.


1M 토큰 컨텍스트 지원

GPT-5.4는 최대 1M 토큰 컨텍스트 윈도우를 지원합니다.

이 기능을 통해 다음과 같은 작업이 가능해집니다.

  • 대규모 문서 분석
  • 장기 프로젝트 계획
  • 복잡한 에이전트 워크플로우 관리

Codex에서는 다음 설정을 통해 사용할 수 있습니다.

  • model_context_window
  • model_auto_compact_token_limit

다만 표준 272K를 초과하는 요청은 2배 요금이 적용됩니다.


추론 및 학술 벤치마크 성능

여러 AI 벤치마크에서도 GPT-5.4는 높은 성능을 보였습니다.

대표적인 결과는 다음과 같습니다.

ARC-AGI-1

  • GPT-5.4: 93.7%

ARC-AGI-2

  • GPT-5.4: 73.3%
  • GPT-5.4 Pro: 83.3%

FrontierMath Tier 4

  • GPT-5.4: 27.1%
  • GPT-5.4 Pro: 38.0%

또한 환각 및 오류 발생 가능성도 감소했습니다.

  • 개별 주장 오류 가능성 33% 감소
  • 전체 응답 오류 가능성 18% 감소

가격 및 출시 정보

API 모델 정보

  • gpt-5.4
  • gpt-5.4-pro

가격 (1M 토큰 기준)

gpt-5.4

  • 입력: $2.50
  • 캐시 입력: $0.25
  • 출력: $15

gpt-5.4-pro

  • 입력: $30
  • 출력: $180

또한 Batch 및 Flex 가격은 표준의 절반이며, Priority Processing은 표준의 두 배입니다.

ChatGPT에서는 다음 플랜에서 사용할 수 있습니다.

  • Plus
  • Team
  • Pro

GPT-5.2 Thinking 모델은 2026년 6월 5일에 종료될 예정입니다.


728x90

GPT-5.4는 단순한 성능 개선 모델이 아니라 추론, 코딩, 에이전트 작업 능력을 통합한 차세대 AI 플랫폼에 가까운 모델입니다.

특히 다음 세 가지 변화가 핵심이라고 볼 수 있습니다.

  1. 네이티브 컴퓨터 사용 기능을 통한 실제 작업 자동화
  2. 최대 1M 토큰 컨텍스트 기반 장문 작업 처리
  3. 전문 업무 환경에서의 높은 정확도

이러한 변화는 AI가 단순한 질의응답 도구를 넘어 실제 업무를 수행하는 에이전트 시스템으로 발전하고 있음을 보여줍니다.

앞으로 GPT-5.4 기반 기술은 다음 영역에서 활용 가능성이 높습니다.

  • 업무 자동화 에이전트
  • 개발 생산성 도구
  • 데이터 분석 및 문서 자동화
  • 지식 작업 지원 시스템

향후 AI 기술은 단순한 모델 성능 경쟁을 넘어 도구 활용 능력과 실제 업무 수행 능력 중심으로 발전할 것으로 예상됩니다.

300x250

https://openai.com/index/introducing-gpt-5-4/

 

Introducing GPT-5.4

Introducing GPT-5.4, OpenAI’s most most capable and efficient frontier model for professional work, with state-of-the-art coding, computer use, tool search, and 1M-token context.

openai.com

728x90
반응형
그리드형