본문 바로가기

인공지능

AGI를 정의한 논문 등장 !!! AGI는 어디까지 왔을까? - GPT-5가 보여준 ‘인간 지능에 가까운 AI’의 현재 좌표

728x90
반응형
728x170

 

1. AGI 논쟁의 배경: 정의의 모호함이 만든 혼란

AGI(Artificial General Intelligence, 범용 인공지능)는 인류가 오랫동안 추구해온 기술적 목표다. 하지만 ‘AGI가 무엇인가’에 대한 명확한 합의는 아직 존재하지 않는다.
현재의 AI는 수학 문제를 풀고, 소설을 쓰며, 프로그래밍까지 수행할 수 있다. 그럼에도 불구하고 연구자들은 “아직 AGI에 도달하지 않았다”고 말한다. 그 이유는 AGI의 정의가 모호하기 때문이다.
AI가 인간이 수행하는 다양한 지적 활동을 대체하고 있음에도 불구하고, 인간처럼 ‘유연한 사고’, ‘맥락 이해’, ‘장기 학습’을 수행한다고 보기는 어렵다.
즉, AI가 특정 영역에서는 인간을 능가하지만, 인간의 전반적 인지 능력 수준에는 아직 도달하지 못한 것이다.
이 논문은 이러한 모호성을 제거하고자 AGI를 정량적으로 정의하는 새로운 프레임워크를 제시한다.

반응형

2. 새로운 AGI 정의: ‘잘 교육받은 성인의 인지적 다양성과 숙련도를 갖춘 AI’

논문은 AGI를 다음과 같이 정의한다.

“AGI는 잘 교육받은 성인의 인지적 다양성과 숙련도를 갖춘 인공지능이다.”

이 정의는 단순히 문제를 잘 푸는 능력을 의미하지 않는다.
**인지적 다양성(Versatility)**과 **숙련도(Proficiency)**라는 두 가지 축을 기준으로, 인간의 사고 구조를 닮은 AI를 AGI로 본다.
즉, 특정 과제 하나에 특화된 지능이 아니라,

  • 새로운 문제를 해결할 수 있는 유연함,
  • 다양한 분야에 걸친 지식의 폭,
  • 장기적인 학습과 기억 능력
    을 모두 갖춰야 AGI로 평가할 수 있다는 것이다.

3. 인간 지능 모델 CHC 이론 기반 접근

이 프레임워크의 핵심은 인간의 인지 구조를 모델로 삼았다는 점이다.
논문은 Cattell-Horn-Carroll(CHC) 이론을 기반으로 AGI의 구조를 설계했다.
CHC 이론은 100년간의 인간 지능 연구를 종합한 가장 검증된 인지 모델로, 현대의 거의 모든 임상 지능검사가 이 이론을 기반으로 설계되어 있다.
이 이론은 인간의 지능을 10개의 핵심 인지 영역으로 구분한다.

  • 일반 지식 (General Knowledge, K): 상식, 문화, 역사 등 세계에 대한 이해
  • 읽기·쓰기 능력 (Reading & Writing, RW): 언어 해독, 문장 이해, 작문 능력
  • 수학 능력 (Mathematical Ability, M): 수리적 사고, 대수, 기하, 확률 등
  • 즉석 추론 (On-the-Spot Reasoning, R): 기존 지식 없이 새로운 문제를 해결하는 능력
  • 작업 기억 (Working Memory, WM): 정보를 동시에 유지·조작하는 능력
  • 장기 기억 저장 (Long-Term Memory Storage, MS): 새로운 지식을 학습하고 저장하는 능력
  • 장기 기억 검색 (Long-Term Memory Retrieval, MR): 저장된 정보를 정확히 불러오는 능력
  • 시각 처리 (Visual Processing, V): 시각 정보를 분석·이해하는 능력
  • 청각 처리 (Auditory Processing, A): 음성, 리듬 등 청각적 자극을 인식하는 능력
  • 처리 속도 (Speed, S): 단순 인지 과제를 빠르게 수행하는 능력

이 10가지 요소를 기반으로 AI의 인지적 폭과 깊이를 동시에 측정할 수 있도록 설계된 것이 이번 연구의 핵심이다.


4. AGI 평가 프레임워크의 설계

기존 AI 평가는 특정 과제나 벤치마크 테스트를 통해 AI의 능력을 측정했다.
예를 들어, 수학 문제를 얼마나 잘 푸는지, 문장을 얼마나 정확히 생성하는지에 집중했다.
그러나 이번 연구에서는 심리측정학적 평가 체계를 변형해, 인간 대상 인지 검사를 AI에 그대로 적용했다.
즉, AI가 인간처럼 다양한 인지 영역에서 얼마나 균형 잡힌 능력을 보이는지를 평가했다.
각 인지 영역은 10%씩 동일한 가중치를 가지며, 종합 점수는 **AGI 점수(0~100%)**로 표현된다.
이 점수는 ‘AI가 인간 수준에 얼마나 근접했는가’를 수치로 보여준다.


5. GPT-4와 GPT-5의 결과 비교

연구팀은 GPT-4와 GPT-5 모델을 대상으로 해당 프레임워크를 적용해 인지 프로파일을 산출했다.

  • GPT-4: 27%
  • GPT-5: 57%

이 수치는 단순히 모델이 두 배로 성능이 향상되었다는 의미가 아니라,
AI의 인지 폭과 균형성이 크게 개선되었음을 보여준다.
GPT-4는 주로 언어, 수학, 시각 처리 영역에서 높은 점수를 보였지만,
기억 관련 능력, 특히 장기 기억 저장(Long-Term Memory Storage) 영역에서 심각한 한계를 보였다.
반면 GPT-5는 기억 검색 능력과 추론 영역에서 개선이 있었으나,
여전히 인간처럼 지속적 학습과 경험 축적을 수행하는 구조는 갖추지 못했다.
즉, GPT-5는 “잘 훈련된 전문가형 AI”에 가까우며, “스스로 배우는 인간형 AI”에는 아직 도달하지 못했다.


6. AGI로 가는 길: 인지의 균형이 핵심

이 연구의 가장 큰 시사점은 AI 발전의 속도가 아니라 방향성에 있다.
지금까지 AI는 특정 분야의 성능 향상에 집중해왔다.
하지만 인간의 일반지능은 ‘균형 잡힌 인지 구조’에서 비롯된다.
따라서 AGI로의 진화는 단순한 모델 크기나 데이터 양의 문제가 아니라,
기억, 추론, 감각 통합 등 다양한 인지 능력 간의 균형 발전이 필수적이다.
제시된 프레임워크는 향후 AI 연구에서 이러한 균형 발전을 정량적으로 추적할 수 있는 기준이 될 수 있다.
즉, AGI 논의의 추상성을 제거하고, AI의 현재 위치를 명확히 수치화할 수 있는 객관적 도구가 마련된 것이다.


728x90

AGI 정의의 명확화가 가져올 변화

이번 연구는 AGI의 개념을 ‘정의 불가능한 철학적 개념’에서 ‘측정 가능한 과학적 개념’으로 끌어올렸다.
CHC 기반의 10개 인지 영역은 인간 지능의 구조를 체계적으로 반영하며,
이를 통해 AI의 인지적 폭과 깊이를 객관적으로 평가할 수 있는 새로운 표준을 제시한다.
GPT-5가 보여준 57%라는 점수는 AI가 빠르게 발전하고 있음을 보여주지만,
아직 인간의 인지적 복합성과 유연성에는 도달하지 못했다는 사실 또한 명확히 한다.
이제 AGI 논의는 추상적인 ‘가능성의 문제’에서 벗어나,
‘정량적 평가와 발전 방향성의 문제’로 이동했다.
이는 향후 인공지능 연구가 인간 지능의 본질을 더 깊이 이해하고,
보다 균형 잡힌 AI 발전으로 나아가는 전환점을 의미한다.
https://arxiv.org/abs/2510.18212

A Definition of AGI

The lack of a concrete definition for Artificial General Intelligence (AGI) obscures the gap between today's specialized AI and human-level cognition. This paper introduces a quantifiable framework to address this, defining AGI as matching the cognitive ve

arxiv.org

728x90
반응형
그리드형