
이 글은 로보틱스(Robotics)와 피지컬 AI(Physical AI) 환경에서 발생하는 대규모 센서 데이터를 보다 효율적으로 관리하고 활용하기 위해 등장한 오픈소스 데이터 플랫폼 Mosaico를 소개합니다.
Mosaico가 왜 필요한지, 어떤 개념과 배경에서 만들어졌는지, 핵심적인 특징과 구조는 무엇인지, 그리고 간단한 실행 방법까지 정리해 로보틱스·AI 개발자 관점에서 이해하기 쉽게 설명합니다.
로보틱스와 피지컬 AI에서 데이터가 중요한 이유
로보틱스와 피지컬 AI 시스템은 카메라, 라이다(LiDAR), IMU, 포스 센서 등 다양한 센서로부터 방대한 데이터를 지속적으로 생성합니다.
이 데이터는 단순한 기록이 아니라 다음과 같은 핵심 역할을 합니다.
- 로봇의 환경 인식 및 행동 판단의 기반
- 학습 데이터셋으로 활용되는 핵심 자산
- 실험 재현, 디버깅, 성능 개선을 위한 분석 자료
하지만 현실에서는 여전히 센서 데이터를 대형 바이너리 파일이나 단일 파일 묶음으로 관리하는 경우가 많아, 검색·분석·재사용이 어렵다는 문제가 존재합니다.
Mosaico란 무엇인가
Mosaico는 이러한 문제를 해결하기 위해 등장한
로보틱스와 피지컬 AI를 위한 오픈소스 데이터 플랫폼입니다.
Mosaico의 핵심 메시지는 명확합니다.
센서 데이터를 파일처럼 다루지 말고, 데이터셋처럼 다뤄라.
이를 위해 Mosaico는 기존의 단일 파일 기반 데이터 관리를 벗어나, 구조화된 아카이브 형태의 데이터 관리 방식을 제공합니다.
Mosaico의 개발 배경과 접근 방식
코드 중심(Code-first) 접근
Mosaico는 SQL과 유사한 새로운 질의 언어를 강요하지 않습니다.
대신, 개발자가 이미 익숙한 프로그래밍 언어 기반 SDK를 제공하는 코드 중심 접근 방식을 채택했습니다.
- 초기 지원 SDK: Python
- 별도의 쿼리 언어 학습 불필요
- 코드 안에서 자연스럽게 데이터 업로드 및 조회 가능
이 접근 방식은 로보틱스 및 AI 개발자들이 실험 코드와 데이터 처리 코드를 하나의 흐름으로 유지할 수 있도록 돕습니다.
시스템 구조와 아키텍처 개념
Mosaico는 표준적인 클라이언트–서버 모델로 동작합니다.
1. 서버: mosaicod
- Rust로 작성된 서버 데몬
- 데이터 변환, 압축, 구조화된 저장을 담당
- 시스템의 중심 허브 역할 수행
2. 클라이언트: Python SDK
- 실제 개발자가 코드에서 사용하는 인터페이스
- 서버와의 통신 로직을 관리
- 내부 구현이 변경되더라도 API 사용은 안정적으로 유지
이 구조를 통해 Mosaico는 성능과 안정성은 서버에서, 사용 편의성은 SDK에서 책임지는 형태를 갖추고 있습니다.
기술 스택과 저장 방식의 특징
Mosaico는 다음과 같은 기술적 특징을 갖고 있습니다.
- Rust + Python 기반
- 대형 단일 파일 대신 구조화된 아카이브 저장 방식
- 데이터 압축 및 관리에 최적화된 설계
- 빠른 데이터 검색과 처리 성능 지향
이를 통해 대규모 센서 데이터를 보다 체계적으로 관리하고, 이후 학습이나 분석 단계로 자연스럽게 연결할 수 있습니다.
오픈소스 모노레포(Monorepo) 구성
Mosaico는 하나의 저장소에서 모든 코드를 관리하는 모노레포 구조를 채택하고 있습니다.
- Python SDK (mosaico-sdk-py)
- Rust 기반 서버(mosaicod)
이 구성의 목적은 다음과 같습니다.
- 테스트 단순화
- SDK와 서버 간 호환성 문제 최소화
- 전체 플랫폼의 일관성 유지
테스트 환경 구성
Mosaico는 서버와 SDK를 모두 포함하는 테스트 파이프라인을 제공합니다.
./scripts/test_suite.sh
테스트 실행을 위해 필요한 요소는 다음과 같습니다.
- Poetry
- Rust 툴체인
- Docker
테스트에는 유닛 테스트와 통합 테스트가 모두 포함되어 있습니다.
현재 개발 단계와 유의사항
Mosaico는 현재 **초기 개발 단계(Early Development Phase)**에 있습니다.
- 프로덕션 환경 사용 비권장
- 버전 1.0 이전까지 API 및 내부 구조 변경 가능
- 기능 및 네이밍이 예고 없이 변경될 수 있음
이는 빠른 실험과 피드백을 위한 단계로 이해하는 것이 중요합니다.
Mosaico는 로보틱스와 피지컬 AI 분야에서 오랫동안 당연하게 여겨졌던 파일 중심 데이터 관리 방식에 문제를 제기합니다.
센서 데이터를 단순한 파일이 아닌 활용 가능한 데이터셋으로 다루고자 하는 시도는, 향후 로봇 학습과 실험 자동화 흐름에 중요한 전환점이 될 수 있습니다.
아직 초기 단계이지만,
- 코드 중심 접근
- 구조화된 데이터 관리
- 로보틱스 특화 데이터 플랫폼
이라는 방향성은 분명합니다.
앞으로 Mosaico가 성숙해질수록 로보틱스와 피지컬 AI 데이터 관리 방식에 의미 있는 변화를 가져올 것으로 기대됩니다.
https://github.com/mosaico-labs/mosaico/
GitHub - mosaico-labs/mosaico: Mosaico is the open-source data platform for Robotics and Physical AI
Mosaico is the open-source data platform for Robotics and Physical AI - mosaico-labs/mosaico
github.com

'인공지능' 카테고리의 다른 글
| Claude Code 창시자 Boris Cherny의 실전 활용 전략 정리 (0) | 2026.01.05 |
|---|---|
| LLM 시대, “어떤 API를 호출해야 할까?”라는 질문이 더 이상 의미 없는 이유 (0) | 2026.01.05 |
| Adala란 무엇인가? 자율 학습 기반 데이터 라벨링 에이전트 프레임워크 완전 정리 (0) | 2026.01.04 |
| Oh My OpenCode란 무엇인가? - 에이전트 시대를 여는 AI 개발 오케스트레이션 플랫폼 정리 (0) | 2026.01.04 |
| Claude Code 실행 상태를 한눈에 보여주는 플러그인, Claude HUD 소개 (0) | 2026.01.04 |