
AWS가 공개한 Nova Forge는 기업이 자체 데이터를 활용해 맞춤형 대규모 언어 모델을 구축할 수 있도록 돕는 새로운 서비스다. 기존 LLM으로 해결되지 않는 조직별 요구사항, 그리고 파인튜닝 과정의 복잡함과 위험성을 해결하기 위해 등장했다. 이 글에서는 Nova Forge가 무엇인지, 어떤 특징을 갖고 있으며, 실제 기업은 어떻게 활용하고 있는지, 그리고 도입 시 고려해야 할 점들을 정리한다.
Nova Forge란 무엇인가?
Nova Forge는 기업이 보유한 데이터를 AWS의 Nova 모델(현재는 Nova 2 Lite 한정)에 학습 단계별로 적용해, 해당 기업에 최적화된 커스텀 모델을 생성할 수 있도록 제공되는 서비스다.
AWS는 이를 “Open Training”이라고 표현하지만, Nova 모델 자체가 공개 모델은 아니며, AWS 환경 내에서만 학습이 이루어진다. 다만 기업이 원하는 방식으로 데이터를 주입해 모델을 조직 특화 지식으로 확장할 수 있다는 점이 핵심이다.
왜 이런 서비스가 필요할까?
기존 LLM은 강력하지만, 특정 조직의 문맥이나 도메인 지식을 정확하게 반영하지 못하는 경우가 많다. 파인튜닝은 대안이지만, 성능 퇴화(regression), 높은 비용, 많은 ML 전문성 등 부담이 크다. Nova Forge는 이러한 문제를 해소하기 위한 새로운 접근 방식이다.
Nova Forge의 핵심 특징
1. 학습 단계별 데이터 혼합 기능
Nova Forge는 다음 세 학습 단계에 기업 데이터를 섞을 수 있다.
- Pre-trained 모델 단계
- Mid-training 단계
- Post-training(Instruction tuning 등) 단계
이 방식의 장점은 모델이 이미 보유한 일반적 지식을 유지하면서도, 기업 고유의 문서나 규정, 업무 지식을 자연스럽게 흡수할 수 있다는 점이다.
2. 강화 학습(RL)을 활용한 정교한 튜닝
기본 학습 외에도 강화 학습을 통해 모델의 응답 톤, 정확성, 조직 정책 준수 등을 추가로 조정할 수 있다.
이 기능은 향후 내부 검수 데이터나 피드백을 활용해 응답 방식을 미세하게 제어하고 싶은 기업에게 유용하다.
3. 경량화된 Distilled 모델 생성
학습된 맞춤형 모델을 더 작고 경제적인 버전으로 증류(distillation)할 수 있다.
이는 추론 비용을 낮추거나, 대규모 서비스 운영 시 비용을 최적화하려는 기업에 도움이 된다.
4. AWS Responsible AI 도구 기반의 안전성
학습 및 생성되는 모델 전반에 걸쳐 안전성 검증 기능을 제공한다.
비즈니스 영역에서 중요한 규제 준수, 안전한 응답 생성 등에 신뢰성을 더한다.
Nova Forge와 파인튜닝·RAG의 차이점
기존 파인튜닝과의 차이
- 파인튜닝은 모델에 특정 태스크를 학습시키는 과정이지만, Nova Forge는 모델의 “학습 단계 전체”에 데이터를 녹여 넣는다.
- 파인튜닝은 성능 손상 위험이 존재하는 반면, Nova Forge는 안정적으로 기존 지식을 유지하도록 설계됐다.
RAG와의 차이
- RAG는 실시간 정보 제공에 유리하지만, 매번 외부 지식을 검색해야 하고, 응답 품질이 벡터 검색 정확도에 영향을 받는다.
- Nova Forge는 모델 자체가 조직의 지식을 내재화하기 때문에 더 자연스럽고 컨텍스트에 맞는 응답을 생성할 수 있다.
- 다만 조직 데이터가 자주 변경되는 환경에서는 RAG가 더 적합할 수 있다.
Nova Forge는 어떻게 사용하는가?
현재 Nova Forge는 Nova 2 Lite 모델 전용이며, Amazon Bedrock에서만 배포 및 실행할 수 있다.
기본 사용 흐름 예시
- 기업이 보유한 문서, 매뉴얼, 정책 문서 등을 AWS에 업로드한다.
- Pre/Mid/Post 단계 중 원하는 위치에 데이터를 삽입해 학습을 시작한다.
- 필요하다면 RL을 활용해 응답 방식을 세밀하게 조정한다.
- 결과물로 생성된 조직 맞춤형 모델(“Novella”)을 Bedrock 환경에서 서비스한다.
- Distilled 모델을 생성해 비용을 낮춘 경량 모델 운영도 가능하다.
실제 사례: Reddit의 콘텐츠 모더레이션 개선
Reddit는 Nova Forge를 활용해 콘텐츠 모더레이션을 단일 모델 기반으로 통합했다.
기존에는 다양한 모델이 흩어져 운영되었기 때문에 일관성 및 정확성 문제가 발생했지만, Nova Forge를 기반으로 구축한 통합 모델은 더 정확하고 효율적인 모더레이션을 제공하고 있다.
Reddit CTO Chris Slowe는 “안전성 노력에서 이미 효과를 확인했고, 앞으로 비즈니스의 다른 영역에서도 Nova Forge 적용을 검토 중”이라고 밝혔다.
고려해야 할 제약 사항
1. 연간 10만 달러 비용
Nova Forge는 연간 10만 달러의 사용료가 필요하다.
이는 중소 규모 기업에게는 부담이 될 수 있다.
2. Bedrock에서만 모델 운영 가능
학습된 모델을 외부로 가져와 자체 인프라에서 사용할 수 없다.
AWS는 이를 통해 데이터 보안, 확장성, 안정성을 보장한다고 설명하지만, 장기적으로 선택권 확대가 필요해 보인다.
3. Nova 모델은 오픈소스가 아님
모델 가중치를 직접 다룰 수 없기 때문에, 완전한 제어권을 원하는 기업에는 적합하지 않을 수 있다.
Nova Forge는 조직별 데이터를 기반으로 맞춤형 LLM을 만들고자 하는 기업에게 강력한 선택지가 될 수 있다.
복잡한 파인튜닝 과정을 단순화하고, 학습 전 과정에 도메인 지식을 자연스럽게 주입할 수 있다는 점은 기존 접근 방식 대비 큰 장점이다.
다만 비용과 사용 환경 제한은 고려해야 하며, 자주 변하는 데이터 환경에서는 RAG 기반 아키텍처가 더 실용적일 수 있다.
그럼에도 불구하고, 조직의 핵심 지식이 안정적으로 정리되어 있고, 이를 기반으로 고품질의 모델을 구축하고 싶은 기업이라면 Nova Forge는 높은 효율성과 신뢰성을 제공할 수 있다.
향후 AWS가 모델 이동성이나 지원 범위를 확장할 경우, Nova Forge는 많은 기업에게 실질적인 AI 도입 가속화를 가져올 것으로 기대된다.
With Nova Forge, AWS Makes Building Custom AI Models Easy
AWS's new Nova Forge easily lets businesses create custom large language models using their own data.
thenewstack.io

'인공지능' 카테고리의 다른 글
| Multi-Agent Collaboration via Evolving Orchestration 논문 리뷰 - LLM 멀티 에이전트 협업 방식 (0) | 2025.12.04 |
|---|---|
| 오픈소스 LLM - Mistral 3 모델 제품군 새소식 (0) | 2025.12.04 |
| KTransformers: 차세대 LLM 추론·파인튜닝을 위한 유연한 이기종 최적화 프레임워크 (0) | 2025.12.02 |
| PageLM: AI 기반 학습을 완전히 새롭게 바꾸는 오픈소스 교육 플랫폼 (0) | 2025.12.02 |
| Google Antigravity: 차세대 에이전틱 개발 플랫폼 완전 분석 (0) | 2025.12.02 |