피지컬 AI

NVIDIA Cosmos

WFM(World Foundation Model), 영상 데이터 처리 라이브러리, 영상 평가, 사후 학습 프레임워크를 갖춘 피지컬 AI를 위한 오픈 플랫폼입니다.

Cookbook   |   문서   |   Discord

월드 파운데이션 모델

세계 생성 및 이해를 위한 오픈 모델

Cosmos Predict

모든 피지컬 AI 작업 또는 환경에 적응할 수 있는 선도적인 세계 생성 모델입니다.

2B/14B 모델을 통해 텍스트, 이미지 또는 영상으로부터 30초 분량의 예측 영상 월드를 생성하거나, 데이터에 대한 포스트 트레이닝을 통해 맞춤형 엣지 케이스, 폐쇄형 루프 정책, 멀티뷰 로봇 중심 시뮬레이션을 구축하세요.

Cosmos Transfer

시뮬레이션에서 포토리얼 변환을 위한 멀티제어 모델입니다.

CARLA 또는 NVIDIA Isaac Sim과 같은 피지컬 AI 시뮬레이션 프레임워크와 결합하여 다양한 환경과 조명 조건에서 합성 데이터 생성을 가속화할 수 있습니다.

Cosmos Reason

로봇과 비전 AI 에이전트가 인간처럼 추론할 수 있도록 지원하는 선도적인 비전 언어 모델(VLM)입니다.

공공 안전, 교통 모니터링, 물류, 품질 검사, 피지컬 AI 전반에 걸쳐 실시간 경고와 실행 가능한 인사이트를 위한 사전 지식, 물리학, 상식을 결합합니다.

데이터 처리 및 평가

효율적인 데이터셋 처리 및 평가 속도를 높입니다.

Cosmos 큐레이터

Cosmos Curator를 통해 대량의 센서 데이터를 신속하게 필터링, 주석 달기 및 중복 제거하세요.

Cosmos 데이터셋 검색

NVIDIA Cosmos 데이터셋 검색(CDS)을 통해 데이터셋을 즉시 쿼리하고 시나리오를 검색하세요.

Cosmos Evaluator

Cosmos Evaluator를 사용하여 대규모 생성형 영상 출력을 검토하고 채점하세요.

사용 사례

Cosmos가 다양한 산업에서 AI 혁신을 가속하는 방법

Cosmos WFMs을 사용하여 로보틱스, 자율주행차, 산업 비전 시스템을 위한 데이터를 가속화하고 추론하며 생성합니다.

로봇 학습

다운스트림 작업, 환경, 카메라 또는 센서 레이아웃, 정책을 위한 맞춤형 월드 모델을 구축하세요.

  • 로봇 특정 뷰 또는 제어 정책을 위해 Cosmos Predict를 사후 학습시키세요.
  • Cosmos Transfer를 통해 환경과 조명 조건에 걸쳐 합성 데이터 생성
  • Cosmos RL 프레임워크를 사용하여 비전-언어-액션(VLA) 모델을 구축하도록 Cosmos Reason을 사후 학습시키세요.
  • Cosmos를 기반으로 구축된 피지컬 AI 데이터 팩토리 Blueprint를 사용하여 엔드 투 엔드 합성 데이터 증강 및 평가 파이프라인을 구축합니다.

자율주행차 학습

자율주행차를 안전하게 학습, 테스트 및 검증하기 위해 맞춤형의 다양하고 고성능 센서 데이터를 생성하세요.

  • Cosmos Transfer를 활용해 새로운 날씨, 조명, 지리 위치 데이터를 추가하여 기존 데이터의 다양성을 확보합니다.
  • Cosmos Predict를 사용하여 다중 센서 뷰로 확장합니다.
  • Cosmos를 기반으로 구축된 피지컬 AI 데이터 팩토리 Blueprint를 사용하여 엔드 투 엔드 합성 데이터 증강 및 평가 파이프라인을 구축합니다.

영상 분석 AI 에이전트

산업 및 도시 환경 전반에서 자동화와 안전, 운영 효율성을 향상시킵니다. 

Cosmos Reason을 통해 AI 에이전트는 실시간 또는 녹화된 영상 스트림을 분석 및 요약하고 상호작용함으로써 다음을 수행할 수 있습니다.

  • 실시간 질의응답과 알림 서비스를 제공합니다.
  • 풍부한 맥락적 인사이트를 제공합니다.
  • 영상 검색 및 요약을 위한 NVIDIA Blueprint를 통해 대규모 영상 데이터에서 인사이트를 추출합니다.

시작 옵션

NVIDIA Cosmos 시작하기

1

구축할 준비가 되셨나요? 오픈 모델과 코드에 직접 액세스하세요.

2

아직 구축할 준비가 되지 않았나요? 호스팅된 카탈로그에서 Cosmos 모델을 사용해 보세요.

3

도움이 필요하신가요? 핸즈온 모델 레시피를 활용해 빠르게 시작해 보세요.

신뢰할 수 있는 AI

피지컬 AI 커뮤니티 지원

Cosmos 모델, 가드레일 및 토크나이저는 Hugging Face 및 GitHub에서 제공되며, 피지컬 AI 학습 시 발생하는 데이터 부족 문제 해결에 필요한 리소스가 함께 제공됩니다.

AI 인프라

NVIDIA Blackwell을 통해 최고의 성능을 경험하세요.

NVIDIA RTX PRO 6000 Blackwell 시리즈 서버는 학습, 합성 데이터 생성, 시뮬레이션, 추론 전반에서 로봇, 자율주행차, AI 에이전트를 위한 피지컬 AI 개발을 가속화합니다.

NVIDIA Blackwell GB200에서 Cosmos 월드 파운데이션 모델의 최고 성능을 발휘하여 산업 사후 훈련 및 추론 워크로드를 처리할 수 있습니다.

에코시스템

주요 피지컬 AI 혁신 기업들이 채택한 솔루션

로보틱스, 자율주행, 비전 AI 분야의 모델 개발자들이 Cosmos를 활용해 피지컬 AI 개발을 가속화하고 있습니다.

다음 단계

Cosmos 커뮤니티 참여하기

Cosmos 전문가 및 동료 개발자들과 교류하며 모델 피드백을 공유하고, 라이브 스트림과 레시피를 통해 지속적인 학습 기회를 활용해 보세요.

Cosmos Cookbook

로보틱스, 시뮬레이션, 자율 시스템 및 물리적 장면 이해 전반에 걸친 실제 산업별 애플리케이션을 위해 NVIDIA Cosmos 생태계를 활용하는 종합 가이드입니다.

영상 분석 AI 에이전트 구축

Cosmos Reason을 영상 검색 및 요약(VSS)을 위한 NVIDIA Blueprint와 함께 사용하여 확장 가능한 실시간 영상 이해를 지원하는 AI 에이전트를 구축하세요.

리소스

Cosmos 개발자 최신 정보

자주 묻는 질문

[2026년 1월 22일] 시각 운동 제어 및 계획을 위해 Cosmos Predict-2를 기반으로 구축된 Cosmos Policy에 대한 연구가 발표되었습니다.

[2026년 2월 9일] 새로운 Cosmos Reason 2를 위한 컴퓨팅 지원, 양자화 및 CUDA 호환성이 향상되었습니다.

[2025년 12월 19일] Hugging Face를 통한 Cosmos-Predict2.5-2B Diffusers 지원, Hugging Face의 Cosmos-Predict2.5-2B Text2World 증류된 체크포인트 및 증류 가이드가 출시되었습니다.

[2025년 12월 19일] Cosmos Transfer 2.5를 위한 Image2Image 및 ImagePrompt 기능이 출시되었습니다. 여기에서 추론 가이드를 확인하세요.

더 자세한 내용은 GitHub를 살펴보세요.

Cosmos WFM은 NVIDIA 오픈 모델 라이선스를 통해 모든 사람이 사용할 수 있습니다.

로보틱스 및 자율 시스템을 위한 NVIDIA의 Cosmos 세계 기반 모델을 신속하게 구축하고 맞춤화하여 배포할 수 있도록, 단계별 레시피와 사후 학습 스크립트가 수록된 새로운 Cosmos Cookbook을 참고하세요.

예, Cosmos를 활용하여 선호하는 파운데이션 모델 또는 모델 아키텍처를 기반으로 처음부터 구축할 수 있습니다. Cosmos Curator를 사용하여 먼저 비디오 데이터 전처리 작업을 합니다. 그런 다음 Cosmos 토크나이저를 사용하여 데이터를 압축하고 디코딩합니다. 데이터를 처리를 마친 후에는 모델을 학습시키거나 파인 튜닝할 수 있습니다. 

NVIDIA NIM™ 마이크로서비스를 사용하면 클라우드, 데이터센터, 워크스테이션 등 다양한 환경에서 애플리케이션에 피지컬 AI 모델을 쉽게 통합할 수 있습니다.

또한 NVIDIA DGX Cloud를 사용하여 AI 모델을 학습시키고 어디에나 대규모로 배포할 수 있습니다.

세 가지 모두 서로 다른 역할을 가진 WFM입니다.

  • Cosmos Predict는 텍스트, 이미지, 비디오 프롬프트를 활용해 다채로운 비디오 장면을 생성하므로, 로봇 공학이나 자율주행차 분야의 사후 학습용 데이터를 구축하는 데 최적화되어 있습니다.
  • Cosmos Transfer는 NVIDIA Omniverse™와 같은 시뮬레이터에서 생성된 물리 기반 영상에 조명 및 환경을 변경하는 멀티 제어 스타일 전환을 적용합니다.
  • Cosmos Reason은 영상 및 이미지 입력을 기반으로 추론하여 질의에 답변합니다. Cosmos Reason은 Cosmos Predict를 위한 하나의 시작 영상에서 새롭고 다양한 텍스트 프롬프트를 생성하거나 Predict 및 Transfer가 생성한 합성 데이터를 비평할 수 있습니다.

Omniverse는 다양한 생성형 API, SDK 및 NVIDIA RTX 렌더링 기술을 사용하여 실제 작업에 대한 사실적인 3D 시뮬레이션을 생성합니다.

개발자는 Omniverse 시뮬레이션을 인스트럭션 영상으로 Cosmos Transfer 모델에 입력해, 제어 가능한 포토리얼 합성 데이터를 생성할 수 있습니다.

Omniverse는 학습 전후의 시뮬레이션 환경을 제공하며, Cosmos는 비디오 데이터를 생성하고 물리 AI 모델을 학습시키는 파운데이션 모델을 제공합니다.

NVIDIA Omniverse에 대해 자세히 알아보세요.