본문 바로가기

인공지능

ARIS(Code) 자동화 연구 워크플로우 개념과 기술적 특징 정리

728x90
반응형
728x170

이 글은 ARIS(Auto-claude-code-research-in-sleep) 라는 자동화 연구 워크플로우와 이를 구현한 ARIS-Code CLI를 중심으로, 해당 기술이 어떤 배경에서 등장했고 어떤 문제를 해결하려는지, 그리고 어떤 특징과 강점을 가지는지를 정리한 글입니다.
AI 연구나 기술 문서 작업을 하다 보면 조사, 정리, 검토, 재작성 과정이 반복되고 많은 시간을 소모하게 됩니다. ARIS는 바로 이 과정을 자동화된 에이전트 기반 워크플로우**로 구조화해, 연구 생산성을 근본적으로 개선하려는 시도입니다.

반응형

ARIS란 무엇인가

ARIS는 단순한 도구나 CLI 프로그램이 아니라 연구 워크플로우 방법론입니다.
핵심 아이디어는 다음과 같습니다.

  • 연구 과정(조사 → 분석 → 실험 → 검토 → 서술)을 명시적인 단계로 분리
  • 각 단계를 AI 에이전트가 수행
  • 실행 에이전트와 검토 에이전트를 서로 다른 모델로 분리해 자기검증 한계를 극복

즉, ARIS는 “하나의 모델이 혼자 모든 걸 하는 방식”이 아니라,
역할이 다른 모델들이 협력·대립하며 연구 품질을 끌어올리는 구조를 지향합니다.


등장 배경과 문제의식

기존 AI 기반 연구 보조 도구에는 몇 가지 구조적인 한계가 있었습니다.

  1. 자기검토(Self-play)의 한계
    동일한 모델이 실행과 리뷰를 모두 수행하면 사고 패턴이 반복되며 맹점이 생김
  2. 워크플로우 비표준화
    연구 과정이 프롬프트 단위로 흩어져 재현성과 확장성이 떨어짐
  3. 도구 종속성 문제
    특정 플랫폼이나 프레임워크에 묶여 다른 환경으로 옮기기 어려움

ARIS는 이런 문제를 해결하기 위해
Markdown 기반, 제로 의존성, 교체 가능한 LLM 구조를 선택했습니다.


ARIS-Code CLI의 핵심 구조

1. 에이전트 기반 분업 구조

ARIS-Code는 최소 2개의 역할을 전제로 합니다.

  • Executor(실행자)
    빠르고 유연하게 작업을 수행하는 모델
  • Reviewer(검토자)
    느리지만 엄밀하게 논리·증거·결함을 검증하는 모델

이 구조는 단일 모델 사용 시 발생하는 국소 최적(Local minima) 문제를 줄이고,
실제 연구 리뷰에 가까운 피드백을 유도합니다.


2. 크로스 모델 협업 설계

ARIS는 특정 모델에 종속되지 않습니다.

  • Claude, Codex, Kimi, GLM, MiniMax 등 다양한 조합 가능
  • 로컬 모델(LM Studio, Ollama)도 지원
  • 두 모델만 사용해도 충분하다는 설계 철학
    (1 → 2의 개선 폭이 가장 크고, 그 이상은 비용 대비 효율 감소)

이는 “속도 × 엄밀성”이라는 서로 다른 강점을 결합하기 위한 선택입니다.


3. 완전한 경량 구조

기술적 특징 중 가장 눈에 띄는 부분은 극단적으로 가벼운 구조입니다.

  • 의존성 없음
  • 데이터베이스 없음
  • Docker 불필요
  • 모든 스킬과 워크플로우는 Markdown 파일

덕분에 특정 IDE나 플랫폼에 묶이지 않고,
Cursor, Claude Code, Codex CLI, Trae 등 다양한 환경에서 동일한 방식으로 활용할 수 있습니다.


주요 기능과 워크플로우 예시

1. Research Pipeline

/research-pipeline "factorized gap in discrete diffusion LMs"
  • 주제를 입력하면
  • 관련 연구 조사
  • 약점 분석
  • 아이디어 제안
  • 실험 수행
  • 서술 초안 작성까지 자동으로 진행

마치 “이 논문을 읽고, 부족한 점을 찾고, 코드로 보완해줘”라고 지시하는 것과 유사합니다.


2. 타겟 기반 개선 모드

  • 참조 논문만 제공 → 개선 아이디어 도출
  • 코드 저장소만 제공 → 새로운 활용 아이디어 제안
  • 논문 + 코드 제공 → 해당 코드로 논문 약점 보완

연구 맥락을 유지한 채 실질적인 개선에 집중할 수 있는 구조입니다.


3. Rebuttal 자동화

리뷰 대응(Rebuttal)을 위한 전용 모드도 제공됩니다.

  • 모든 리뷰 코멘트 추적
  • 허위 주장 방지
  • 과도한 약속 차단
  • 분량 제한 준수

최종 결과물은 바로 제출 가능한 텍스트
편집용 확장 버전으로 나뉘어 제공됩니다.


기술적 차별점 요약

  • 단일 모델 기반 자동화가 아닌 대립적 협업 구조
  • 연구 과정을 프롬프트가 아닌 파이프라인으로 관리
  • 오픈소스 + Markdown 중심 설계로 재현성과 이식성 확보
  • 연구, 실험, 리뷰, 서술을 하나의 흐름으로 연결

728x90

ARIS와 ARIS-Code는 “AI로 연구를 도와준다”는 수준을 넘어,
연구라는 행위 자체를 구조화하고 자동화하려는 시도입니다.

특히 다음과 같은 점에서 의미가 있습니다.

  • AI를 도구가 아닌 협업자로 다루는 방식 제시
  • 연구 품질을 떨어뜨리지 않으면서 속도를 높이는 구조
  • 특정 모델이나 플랫폼에 종속되지 않는 설계 철학

앞으로 AI 기반 연구 자동화가 보편화될수록,
이처럼 워크플로우 중심의 접근은 더 중요해질 가능성이 큽니다.
ARIS는 그 방향성을 비교적 명확하게 보여주는 사례라고 볼 수 있습니다.

300x250

https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep

 

GitHub - wanshuiyin/Auto-claude-code-research-in-sleep: ARIS ⚔️ (Auto-Research-In-Sleep) — Lightweight Markdown-only skill

ARIS ⚔️ (Auto-Research-In-Sleep) — Lightweight Markdown-only skills for autonomous ML research: cross-model review loops, idea discovery, and experiment automation. No framework, no lock-in — works...

github.com

728x90
반응형
그리드형