
이 글에서는 Figure가 공개한 최신 휴머노이드 로봇 제어 모델 Helix 02에 대해 정리합니다.
Helix 02는 단일 신경망으로 로봇의 보행, 조작, 균형을 동시에 제어하며, 실제 환경에서 수 분 단위의 복잡한 작업을 사람 개입 없이 수행할 수 있는 전신 자율성을 구현했습니다. 기존 휴머노이드 로봇이 가지던 한계를 어떻게 극복했는지, 핵심 기술 구조와 특징, 그리고 실제 시연 결과를 중심으로 살펴봅니다.
Helix 02 개요: 전신을 하나의 시스템으로 제어하다
Helix 02는 로봇의 상체만 제어하던 이전 Helix에서 확장되어, 로봇 전체 신체를 픽셀 입력부터 직접 제어하는 Figure의 가장 진보된 휴머노이드 모델입니다.
주요 특징은 다음과 같습니다.
- 단일 신경 시스템으로 보행, 물체 조작, 균형을 동시에 수행
- 모든 센서를 하나의 시각-운동(visuomotor) 신경망으로 통합
- 인간 동작 데이터를 기반으로 학습된 전신 제어 모델 적용
- 촉각 센서와 손바닥 카메라를 활용한 고난도 정밀 조작 가능
이를 통해 Helix 02는 방 하나 규모의 공간에서 연속적이고 자연스러운 작업 수행이 가능해졌습니다.
휴머노이드 로봇의 난제: 이동과 조작의 통합
로봇 공학에서 로코-매니퓰레이션(loco-manipulation), 즉 이동과 조작을 하나의 연속된 행동으로 수행하는 것은 오랫동안 해결되지 않은 문제였습니다.
그 이유는 다음과 같습니다.
- 물체를 들면 균형이 바뀌고, 걸음을 옮기면 팔의 도달 범위가 바뀜
- 팔과 다리는 항상 서로 영향을 주는 관계
- 기존 시스템은 보행과 조작을 분리된 컨트롤러로 처리
전통적인 방식은
걷기 → 멈춤 → 안정화 → 팔 뻗기 → 잡기 → 다시 걷기
와 같은 상태 머신 구조를 사용해, 동작이 느리고 환경 변화에 취약했습니다.
Helix 02는 이 문제를 단일 학습 시스템으로 전신을 동시에 판단하고 제어하는 방식으로 해결합니다.
Helix 02 아키텍처: System 0, 1, 2의 계층 구조
Helix 02는 세 개의 계층으로 구성된 통합 제어 구조를 사용합니다.
System 0 (S0): 인간 같은 전신 제어의 기반
System 0는 Helix 02의 핵심 기반 계층입니다.
- 역할: 균형, 접촉, 전신 협응을 1kHz 속도로 제어
- 학습 방식:
- 1,000시간 이상의 인간 전신 동작 데이터 기반 학습
- 시뮬레이션에서 20만 개 이상의 병렬 환경으로 강화 학습
- 특징:
- 10M 파라미터 규모의 신경망
- 기존 10만 줄 이상의 C++ 수작업 제어 코드를 대체
- 자연스럽고 안정적인 인간형 움직임 구현
S0는 상위 시스템이 어떤 작업을 요구하더라도, 실제 동작이 부드럽고 안전하게 실행되도록 보장합니다.
System 1 (S1): 모든 센서를 모든 관절로 연결
System 1은 실제 행동을 만들어내는 시각-운동 정책 계층입니다.
- 입력:
- 머리 카메라
- 손바닥 카메라
- 손가락 촉각 센서
- 전신 고유감각(proprioception)
- 출력:
- 다리, 몸통, 머리, 팔, 손목, 손가락까지 포함한 전 관절 제어
특히 Figure 03 하드웨어에 새로 추가된 기능이 중요합니다.
- 손바닥 카메라: 손이 시야를 가릴 때도 물체를 인식
- 촉각 센서: 3g 수준의 미세한 힘 감지 가능
이를 통해 Helix 02는 시각만으로는 어려운 힘 조절 기반의 정밀 조작을 수행할 수 있습니다.
System 2 (S2): 장면 이해와 언어 기반 목표 설정
System 2는 의미적 추론을 담당합니다.
- 역할:
- 장면 인식
- 언어 명령 이해
- 행동 시퀀스 생성
- 변화점:
- 단순한 “물체 집기”에서
- “식기세척기로 이동해 문을 열고, 그릇을 옮겨 정리하라” 수준까지 확장
S2는 세부 동작을 계획하지 않고, **의미적 목표(latent)**만 생성합니다.
이 목표를 S1이 전신 동작으로 변환하고, S0가 실제 물리 제어를 담당합니다.
장시간 자율 로코-매니퓰레이션 결과
Helix 02는 실제 환경에서 4분간 끊김 없는 자율 작업을 수행했습니다.
식기세척기 작업 시연의 의미
- 주방 전체를 이동하며 식기 언로드 및 재적재
- 사람 개입, 리셋, 원격 조작 없이 완전 자율 수행
- 총 61개의 로코-매니퓰레이션 행동을 올바른 순서로 실행
이 시연이 보여주는 핵심 포인트는 다음과 같습니다.
- 물체를 들고 이동하면서도 안정적인 보행 유지
- 손이 바쁠 때 엉덩이와 발을 활용해 문 닫기
- 양손 협응을 통한 물체 전달 및 적재
- 밀리미터 단위 손가락 조작부터 방 규모 이동까지 하나의 신경망으로 처리
- 오류 발생 시 암묵적 복구 수행
촉각과 인핸드 비전을 활용한 고난도 정밀 조작
Helix 02는 네 가지 대표적인 정밀 조작 작업을 자율 수행했습니다.
- 병뚜껑 돌려 열기
- 병을 안정적으로 고정하며 회전 토크 조절
- 약통에서 알약 하나 집기
- 시야 가림 상황에서도 손바닥 카메라와 촉각으로 정밀 파지
- 주사기로 정확히 5ml 밀어내기
- 저항 변화에 대응하는 힘 제어 기반 조작
- 잡동사니 상자에서 금속 부품 분리
- 겹치고 움직이는 환경에서도 안정적인 집기 수행
이 작업들은 순수 시각 기반 정책으로는 구현하기 어려운 영역으로, Helix 02의 센서 통합 설계가 가진 강점을 잘 보여줍니다.
Helix 02는 휴머노이드 로봇 제어에서 중요한 전환점을 보여줍니다.
- 전신을 분리하지 않고 하나의 학습 시스템으로 제어
- 픽셀 입력부터 토크 출력까지 완전 통합
- 인간 동작 데이터 기반의 자연스러운 움직임
- 수 분 단위, 방 규모의 연속 자율 작업 실현
아직 초기 단계이지만, Helix 02가 보여준 결과는 휴머노이드 로봇이 실제 생활 환경에서 장시간 자율적으로 일할 수 있는 가능성을 분명히 드러냅니다.
앞으로 이와 같은 전신 자율 제어 기술은 가정, 제조, 물류 등 다양한 분야에서 로봇 활용의 기준을 바꾸는 핵심 기술이 될 것으로 기대됩니다.
Introducing Helix 02: Full-Body Autonomy
Introducing Helix 02: Full-Body Autonomy
www.figure.ai

'인공지능' 카테고리의 다른 글
| 지침을 실제로 따르는 LLM 에이전트 프레임워크, Parlant 기술 개요 (0) | 2026.01.30 |
|---|---|
| Paper2Slides로 문서를 슬라이드와 포스터로 자동 변환하는 방법 (0) | 2026.01.29 |
| Gemini 3 Flash의 Agentic Vision: 코드 실행으로 진화한 시각 이해 기술 (0) | 2026.01.29 |
| Agentic Organization과 AsyncThink: AI가 스스로 사고를 조직하는 새로운 추론 패러다임 (0) | 2026.01.29 |
| AI 에이전트의 장기 작업을 위한 컨텍스트 관리 전략 – LangChain Deep Agents SDK 정리 (0) | 2026.01.29 |