Helix 02: 휴머노이드 로봇의 전신 자율 제어를 구현한 통합 AI 모델

728x90

728x170

이 글에서는 Figure가 공개한 최신 휴머노이드 로봇 제어 모델 Helix 02에 대해 정리합니다.
Helix 02는 단일 신경망으로 로봇의 보행, 조작, 균형을 동시에 제어하며, 실제 환경에서 수 분 단위의 복잡한 작업을 사람 개입 없이 수행할 수 있는 전신 자율성을 구현했습니다. 기존 휴머노이드 로봇이 가지던 한계를 어떻게 극복했는지, 핵심 기술 구조와 특징, 그리고 실제 시연 결과를 중심으로 살펴봅니다.

Helix 02 개요: 전신을 하나의 시스템으로 제어하다

Helix 02는 로봇의 상체만 제어하던 이전 Helix에서 확장되어, 로봇 전체 신체를 픽셀 입력부터 직접 제어하는 Figure의 가장 진보된 휴머노이드 모델입니다.

주요 특징은 다음과 같습니다.

단일 신경 시스템으로 보행, 물체 조작, 균형을 동시에 수행
모든 센서를 하나의 시각-운동(visuomotor) 신경망으로 통합
인간 동작 데이터를 기반으로 학습된 전신 제어 모델 적용
촉각 센서와 손바닥 카메라를 활용한 고난도 정밀 조작 가능

이를 통해 Helix 02는 방 하나 규모의 공간에서 연속적이고 자연스러운 작업 수행이 가능해졌습니다.

휴머노이드 로봇의 난제: 이동과 조작의 통합

로봇 공학에서 로코-매니퓰레이션(loco-manipulation), 즉 이동과 조작을 하나의 연속된 행동으로 수행하는 것은 오랫동안 해결되지 않은 문제였습니다.

그 이유는 다음과 같습니다.

물체를 들면 균형이 바뀌고, 걸음을 옮기면 팔의 도달 범위가 바뀜
팔과 다리는 항상 서로 영향을 주는 관계
기존 시스템은 보행과 조작을 분리된 컨트롤러로 처리

전통적인 방식은
걷기 → 멈춤 → 안정화 → 팔 뻗기 → 잡기 → 다시 걷기
와 같은 상태 머신 구조를 사용해, 동작이 느리고 환경 변화에 취약했습니다.

Helix 02는 이 문제를 단일 학습 시스템으로 전신을 동시에 판단하고 제어하는 방식으로 해결합니다.

Helix 02 아키텍처: System 0, 1, 2의 계층 구조

Helix 02는 세 개의 계층으로 구성된 통합 제어 구조를 사용합니다.

System 0 (S0): 인간 같은 전신 제어의 기반

System 0는 Helix 02의 핵심 기반 계층입니다.

역할: 균형, 접촉, 전신 협응을 1kHz 속도로 제어
학습 방식:
- 1,000시간 이상의 인간 전신 동작 데이터 기반 학습
- 시뮬레이션에서 20만 개 이상의 병렬 환경으로 강화 학습
특징:
- 10M 파라미터 규모의 신경망
- 기존 10만 줄 이상의 C++ 수작업 제어 코드를 대체
- 자연스럽고 안정적인 인간형 움직임 구현

S0는 상위 시스템이 어떤 작업을 요구하더라도, 실제 동작이 부드럽고 안전하게 실행되도록 보장합니다.

System 1 (S1): 모든 센서를 모든 관절로 연결

System 1은 실제 행동을 만들어내는 시각-운동 정책 계층입니다.

입력:
- 머리 카메라
- 손바닥 카메라
- 손가락 촉각 센서
- 전신 고유감각(proprioception)
출력:
- 다리, 몸통, 머리, 팔, 손목, 손가락까지 포함한 전 관절 제어

특히 Figure 03 하드웨어에 새로 추가된 기능이 중요합니다.

손바닥 카메라: 손이 시야를 가릴 때도 물체를 인식
촉각 센서: 3g 수준의 미세한 힘 감지 가능

이를 통해 Helix 02는 시각만으로는 어려운 힘 조절 기반의 정밀 조작을 수행할 수 있습니다.

System 2 (S2): 장면 이해와 언어 기반 목표 설정

System 2는 의미적 추론을 담당합니다.

역할:
- 장면 인식
- 언어 명령 이해
- 행동 시퀀스 생성
변화점:
- 단순한 “물체 집기”에서
- “식기세척기로 이동해 문을 열고, 그릇을 옮겨 정리하라” 수준까지 확장

S2는 세부 동작을 계획하지 않고, **의미적 목표(latent)**만 생성합니다.
이 목표를 S1이 전신 동작으로 변환하고, S0가 실제 물리 제어를 담당합니다.

장시간 자율 로코-매니퓰레이션 결과

Helix 02는 실제 환경에서 4분간 끊김 없는 자율 작업을 수행했습니다.

식기세척기 작업 시연의 의미

주방 전체를 이동하며 식기 언로드 및 재적재
사람 개입, 리셋, 원격 조작 없이 완전 자율 수행
총 61개의 로코-매니퓰레이션 행동을 올바른 순서로 실행

이 시연이 보여주는 핵심 포인트는 다음과 같습니다.

물체를 들고 이동하면서도 안정적인 보행 유지
손이 바쁠 때 엉덩이와 발을 활용해 문 닫기
양손 협응을 통한 물체 전달 및 적재
밀리미터 단위 손가락 조작부터 방 규모 이동까지 하나의 신경망으로 처리
오류 발생 시 암묵적 복구 수행

촉각과 인핸드 비전을 활용한 고난도 정밀 조작

Helix 02는 네 가지 대표적인 정밀 조작 작업을 자율 수행했습니다.

병뚜껑 돌려 열기
- 병을 안정적으로 고정하며 회전 토크 조절
약통에서 알약 하나 집기
- 시야 가림 상황에서도 손바닥 카메라와 촉각으로 정밀 파지
주사기로 정확히 5ml 밀어내기
- 저항 변화에 대응하는 힘 제어 기반 조작
잡동사니 상자에서 금속 부품 분리
- 겹치고 움직이는 환경에서도 안정적인 집기 수행

이 작업들은 순수 시각 기반 정책으로는 구현하기 어려운 영역으로, Helix 02의 센서 통합 설계가 가진 강점을 잘 보여줍니다.

728x90

Helix 02는 휴머노이드 로봇 제어에서 중요한 전환점을 보여줍니다.

전신을 분리하지 않고 하나의 학습 시스템으로 제어
픽셀 입력부터 토크 출력까지 완전 통합
인간 동작 데이터 기반의 자연스러운 움직임
수 분 단위, 방 규모의 연속 자율 작업 실현

아직 초기 단계이지만, Helix 02가 보여준 결과는 휴머노이드 로봇이 실제 생활 환경에서 장시간 자율적으로 일할 수 있는 가능성을 분명히 드러냅니다.
앞으로 이와 같은 전신 자율 제어 기술은 가정, 제조, 물류 등 다양한 분야에서 로봇 활용의 기준을 바꾸는 핵심 기술이 될 것으로 기대됩니다.

300x250

https://www.figure.ai/news/helix-02?fbclid=IwY2xjawPnvDBleHRuA2FlbQIxMQBzcnRjBmFwcF9pZBAyMjIwMzkxNzg4MjAwODkyAAEer2VTayYivA2jSlGbbqRn4TpuSTr08MWV3jPWtQMBiKRWNq76pnUbiGHS-Cw_aem_A9Jk8xduwCXoIsjyQ13Z9A

Introducing Helix 02: Full-Body Autonomy

www.figure.ai

728x90

그리드형

저작자표시 비영리 변경금지 (새창열림)

'인공지능' 카테고리의 다른 글

지침을 실제로 따르는 LLM 에이전트 프레임워크, Parlant 기술 개요 (0)	2026.01.30
Paper2Slides로 문서를 슬라이드와 포스터로 자동 변환하는 방법 (0)	2026.01.29
Gemini 3 Flash의 Agentic Vision: 코드 실행으로 진화한 시각 이해 기술 (0)	2026.01.29
Agentic Organization과 AsyncThink: AI가 스스로 사고를 조직하는 새로운 추론 패러다임 (0)	2026.01.29
AI 에이전트의 장기 작업을 위한 컨텍스트 관리 전략 – LangChain Deep Agents SDK 정리 (0)	2026.01.29

평범한 직장인이 사는 세상

Helix 02: 휴머노이드 로봇의 전신 자율 제어를 구현한 통합 AI 모델

Helix 02 개요: 전신을 하나의 시스템으로 제어하다

휴머노이드 로봇의 난제: 이동과 조작의 통합

Helix 02 아키텍처: System 0, 1, 2의 계층 구조

System 0 (S0): 인간 같은 전신 제어의 기반

System 1 (S1): 모든 센서를 모든 관절로 연결

System 2 (S2): 장면 이해와 언어 기반 목표 설정

장시간 자율 로코-매니퓰레이션 결과

식기세척기 작업 시연의 의미

촉각과 인핸드 비전을 활용한 고난도 정밀 조작

'인공지능' 카테고리의 다른 글

티스토리툴바

Helix 02: 휴머노이드 로봇의 전신 자율 제어를 구현한 통합 AI 모델

Helix 02 개요: 전신을 하나의 시스템으로 제어하다

휴머노이드 로봇의 난제: 이동과 조작의 통합

Helix 02 아키텍처: System 0, 1, 2의 계층 구조

System 0 (S0): 인간 같은 전신 제어의 기반

System 1 (S1): 모든 센서를 모든 관절로 연결

System 2 (S2): 장면 이해와 언어 기반 목표 설정

장시간 자율 로코-매니퓰레이션 결과

식기세척기 작업 시연의 의미

촉각과 인핸드 비전을 활용한 고난도 정밀 조작

'인공지능' 카테고리의 다른 글

'인공지능' Related Articles

티스토리툴바