
OpenAI는 ChatGPT, API, Codex 전반에 적용되는 최신 프런티어 모델 GPT-5.4를 공개했습니다. 이 모델은 기존 모델 대비 추론 능력, 코딩 성능, 에이전트 기반 워크플로우 수행 능력을 통합적으로 강화한 것이 특징입니다. 특히 네이티브 컴퓨터 사용 기능, 최대 1M 토큰 컨텍스트 지원, 향상된 시각 인식 및 문서 이해 능력 등 다양한 기능 개선이 이루어졌습니다.
이번 글에서는 GPT-5.4의 전반적인 개념과 등장 배경, 핵심 기술 특징, 성능 개선 사항, 그리고 실제 업무 환경에서 기대되는 활용 가능성까지 주요 내용을 정리합니다.
GPT-5.4 개요
GPT-5.4는 ChatGPT, API, Codex 환경에서 동시에 사용할 수 있는 최신 AI 모델로, 기존 GPT-5.2 및 GPT-5.3-Codex의 장점을 통합하여 설계되었습니다.
주요 특징은 다음과 같습니다.
- 추론, 코딩, 에이전트 작업 능력 통합
- 전문 업무 환경에서의 정확도 및 생산성 향상
- 도구 및 소프트웨어 환경 간 연동 강화
- 장문 컨텍스트 처리 능력 개선
특히 GPT-5.3-Codex의 코딩 능력을 통합하면서 개발 작업뿐 아니라 스프레드시트, 프레젠테이션, 문서 작성 등 다양한 업무 환경에서의 정확도와 효율성이 크게 향상되었습니다.
또한 GPT-5.4 Pro 버전은 복잡한 작업 환경에서 최대 성능을 제공하는 고성능 모델로 제공됩니다.
ChatGPT Thinking 모드 개선
GPT-5.4에서는 ChatGPT의 Thinking 모드가 크게 개선되었습니다.
주요 변화는 다음과 같습니다.
사전 사고 계획(Preamble) 제공
작업을 시작할 때 모델이 사전 계획 형태의 사고 과정을 제시합니다.
이를 통해 사용자는 응답이 생성되는 과정 중에도 방향을 조정할 수 있습니다.
이 기능은 다음과 같은 장점을 제공합니다.
- 추가 질문 없이도 원하는 결과에 가까운 응답 생성
- 사용자 의도와 모델 출력 간의 불일치 감소
- 복잡한 문제 해결 과정의 가시성 향상
깊은 웹 리서치 능력 향상
특히 매우 구체적인 질문에서 다음과 같은 성능이 개선되었습니다.
- 긴 맥락을 유지한 정보 탐색
- 다단계 검색 기반 답변 생성
- 복잡한 정보 분석 속도 향상
이러한 개선을 통해 복잡한 질문에서도 더 정확한 결과를 빠르게 제공할 수 있습니다.
네이티브 컴퓨터 사용 기능
GPT-5.4의 가장 큰 변화 중 하나는 네이티브 computer-use 기능입니다.
이 기능을 통해 AI 에이전트가 실제 컴퓨터 환경에서 다음과 같은 작업을 수행할 수 있습니다.
- 웹사이트 탐색
- 소프트웨어 조작
- UI 기반 작업 자동화
지원 방식
GPT-5.4는 두 가지 방식의 컴퓨터 제어를 지원합니다.
- 코드 기반 제어
- Playwright 같은 라이브러리를 통해 프로그램적으로 제어
- 화면 기반 제어
- 스크린샷을 기반으로 마우스 및 키보드 명령 수행
또한 개발자는 confirmation policy를 통해 위험 허용 수준을 설정하고 에이전트 행동을 제어할 수 있습니다.
관련 벤치마크 성능
- OSWorld-Verified: 75.0% (인간 성능 72.4% 초과)
- WebArena-Verified: 67.3%
- Online-Mind2Web: 92.8%
이는 실제 소프트웨어 작업 수행 능력이 크게 향상되었음을 보여줍니다.
시각 인식 및 문서 파싱 능력 향상
GPT-5.4는 시각 이해 능력도 크게 개선되었습니다.
이미지 입력 해상도 확장
새로운 이미지 입력 옵션이 추가되었습니다.
- original: 최대 10.24M 픽셀 또는 6000px
- high: 최대 2.56M 픽셀 또는 2048px
이를 통해 다음과 같은 작업에서 정확도가 향상되었습니다.
- UI 위치 파악
- 이미지 기반 클릭 작업
- 복잡한 문서 이해
문서 인식 성능
OmniDocBench 기준
- GPT-5.4: 평균 오류 0.109
- GPT-5.2: 평균 오류 0.140
문서 파싱 정확도가 크게 향상된 것을 확인할 수 있습니다.
코딩 성능 및 개발 환경 개선
GPT-5.4는 GPT-5.3-Codex의 코딩 능력을 통합하면서 개발 환경에서도 많은 개선이 이루어졌습니다.
코딩 벤치마크
SWE-Bench Pro 기준
- GPT-5.4: 57.7%
- GPT-5.3-Codex: 56.8%
- GPT-5.2: 55.6%
또한 모든 추론 수준에서 더 낮은 레이턴시를 제공합니다.
Codex 성능 개선
Codex 환경에서는 다음 기능이 추가되었습니다.
- /fast 모드: 최대 1.5배 빠른 토큰 속도
- Priority Processing: API에서 동일한 고속 처리 지원
또한 Playwright (Interactive) 기능을 통해 웹 및 Electron 앱을 실시간으로 테스트하고 시각적으로 디버깅할 수 있습니다.
Tool Search 기능
기존 AI 에이전트 환경에서는 모든 도구 정의를 프롬프트에 포함해야 했습니다.
이 방식은 수천~수만 토큰을 소비하는 문제가 있었습니다.
GPT-5.4에서는 Tool Search 기능을 통해 이를 개선했습니다.
작동 방식
- 프롬프트에는 경량 도구 목록만 포함
- 필요할 때 도구 정의를 동적으로 조회
효과
- 토큰 사용량 감소
- 캐시 활용 증가
- 응답 속도 향상
실제 MCP Atlas 벤치마크에서는 다음과 같은 결과가 확인되었습니다.
- 총 토큰 사용량 47% 감소
- 정확도 동일 유지
전문 업무 및 지식 작업 성능
GPT-5.4는 실제 업무 환경에서도 높은 성능을 보였습니다.
GDPval 평가 결과
- GPT-5.4: 83.0% 전문가 수준 일치 또는 초과
- GPT-5.2: 70.9%
평가 작업 예시는 다음과 같습니다.
- 영업 프레젠테이션 제작
- 회계 스프레드시트 모델링
- 의료 일정 관리
- 제조 공정 다이어그램 작성
또한 투자은행 스프레드시트 모델링 벤치마크에서는 평균 87.3% 정확도를 기록했습니다.
1M 토큰 컨텍스트 지원
GPT-5.4는 최대 1M 토큰 컨텍스트 윈도우를 지원합니다.
이 기능을 통해 다음과 같은 작업이 가능해집니다.
- 대규모 문서 분석
- 장기 프로젝트 계획
- 복잡한 에이전트 워크플로우 관리
Codex에서는 다음 설정을 통해 사용할 수 있습니다.
- model_context_window
- model_auto_compact_token_limit
다만 표준 272K를 초과하는 요청은 2배 요금이 적용됩니다.
추론 및 학술 벤치마크 성능
여러 AI 벤치마크에서도 GPT-5.4는 높은 성능을 보였습니다.
대표적인 결과는 다음과 같습니다.
ARC-AGI-1
- GPT-5.4: 93.7%
ARC-AGI-2
- GPT-5.4: 73.3%
- GPT-5.4 Pro: 83.3%
FrontierMath Tier 4
- GPT-5.4: 27.1%
- GPT-5.4 Pro: 38.0%
또한 환각 및 오류 발생 가능성도 감소했습니다.
- 개별 주장 오류 가능성 33% 감소
- 전체 응답 오류 가능성 18% 감소
가격 및 출시 정보
API 모델 정보
- gpt-5.4
- gpt-5.4-pro
가격 (1M 토큰 기준)
gpt-5.4
- 입력: $2.50
- 캐시 입력: $0.25
- 출력: $15
gpt-5.4-pro
- 입력: $30
- 출력: $180
또한 Batch 및 Flex 가격은 표준의 절반이며, Priority Processing은 표준의 두 배입니다.
ChatGPT에서는 다음 플랜에서 사용할 수 있습니다.
- Plus
- Team
- Pro
GPT-5.2 Thinking 모델은 2026년 6월 5일에 종료될 예정입니다.
GPT-5.4는 단순한 성능 개선 모델이 아니라 추론, 코딩, 에이전트 작업 능력을 통합한 차세대 AI 플랫폼에 가까운 모델입니다.
특히 다음 세 가지 변화가 핵심이라고 볼 수 있습니다.
- 네이티브 컴퓨터 사용 기능을 통한 실제 작업 자동화
- 최대 1M 토큰 컨텍스트 기반 장문 작업 처리
- 전문 업무 환경에서의 높은 정확도
이러한 변화는 AI가 단순한 질의응답 도구를 넘어 실제 업무를 수행하는 에이전트 시스템으로 발전하고 있음을 보여줍니다.
앞으로 GPT-5.4 기반 기술은 다음 영역에서 활용 가능성이 높습니다.
- 업무 자동화 에이전트
- 개발 생산성 도구
- 데이터 분석 및 문서 자동화
- 지식 작업 지원 시스템
향후 AI 기술은 단순한 모델 성능 경쟁을 넘어 도구 활용 능력과 실제 업무 수행 능력 중심으로 발전할 것으로 예상됩니다.
https://openai.com/index/introducing-gpt-5-4/
Introducing GPT-5.4
Introducing GPT-5.4, OpenAI’s most most capable and efficient frontier model for professional work, with state-of-the-art coding, computer use, tool search, and 1M-token context.
openai.com

'인공지능' 카테고리의 다른 글
| Fabric: AI 프롬프트를 체계적으로 관리하고 활용하는 오픈소스 프레임워크 (0) | 2026.03.06 |
|---|---|
| Claude Code 메모리 문제 해결 방법: QMD 검색 엔진과 /recall 스킬로 만드는 컨텍스트 중심 AI 워크플로우 (0) | 2026.03.06 |
| OpenAI Symphony: 에이전트 기반 프로젝트 관리 자동화 도구 완전 정리 (0) | 2026.03.05 |
| 코딩 에이전트 시대의 개발 방법론: Agentic Engineering Patterns 정리 (0) | 2026.03.05 |
| Vercel agent-browser 소개: AI 에이전트를 위한 새로운 헤드리스 브라우저 자동화 CLI (0) | 2026.03.05 |