世界基盤モデル
あらゆるフィジカル AI のタスクまたは環境に適応可能な、最先端の世界生成モデル。
2B/14B モデルを使用してテキスト、画像、またはビデオから 30 秒の予測ビデオの世界を生成します。また、独自のデータでポストトレーニングを行うことで、カスタム エッジ ケース、クローズドループ ポリシー、マルチビューのロボット中心シミュレーションを作成できます。
シミュレーションからフォトリアルへの変換を実現するマルチコントロール モデル。
CARLA や NVIDIA Isaac Sim™ などのフィジカル AI シミュレーション フレームワークと組み合わせることで、さまざまな環境や照明条件において合成データ生成を高速化します。
ロボットとビジョン AI エージェントが人間のように推論できるようにする、最先端の視覚言語モデル (VLM) です。
事前知識、物理学、常識を組み合わせて、公共の安全、交通監視、ロジスティクス、品質検査、フィジカル AI に及ぶリアルタイムのアラートと実用的なインサイトを提供します。
効率的なデータセットの処理と評価を高速化します。
ユース ケース
ダウンストリームのタスク、環境、カメラまたはセンサーのレイアウト、ポリシー向けにカスタム世界モデルを構築します。
多様なカスタマイズ可能な高精度センサー データを生成し、自動運転車の安全なトレーニング、テスト、検証を実現します。
産業環境および都市環境全体における自動化、安全性、運用効率を向上させます。
AI エージェントは、Cosmos Reason を活用することで、リアルタイムまたは録画された映像ストリームを分析・要約し、以下のことを実現します。
導入時の選択肢
AI インフラストラクチャ
NVIDIA RTX PRO 6000 Blackwell シリーズ サーバーは、ロボット、自動運転車、AI エージェント分野でのフィジカル AI 開発における トレーニング、合成データ生成、シミュレーション、推論を高速化します。
NVIDIA Blackwell GB200 ならば、産業分野でのポスト トレーニングおよび推論ワークロードでの Cosmos 世界基盤モデルの能力を最大限に引き出せます。
エコシステム
ロボティクス、自動運転車、ビジョン AI 業界のモデル開発者は、Cosmos を使用して物理 AI 開発を高速化しています。
[2026 年 1 月 22 日] Cosmos Predict-2 を基盤に、視覚運動制御と計画を実現する Cosmos Policy に関する研究をリリースしました。
[2026 年 2 月 9 日] 新しい Cosmos Reason 2 で、コンピューティング サポート、量子化、CUDA 互換性を強化しました。
[2025 年 12 月 19 日] Hugging Face 経由での Cosmos-Predict2.5-2B Diffusers サポート、Hugging Face での Cosmos-Predict2.5-2B Text2World 蒸留済みチェックポイント、および蒸留ガイドをリリースしました。
[2025 年 12 月 19 日] Cosmos Transfer 2.5 向けの Image2Image と ImagePrompt 機能をリリースしました。推論ガイドはこちらをご覧ください。
詳細については、GitHub をご覧ください。
Cosmos 世界基盤モデルは、NVIDIA Open Model License の下で誰でも利用できます。
新しい Cosmos Cookbookを参照してください。この Cookbook には、ロボティクスおよび自律システム向けの NVIDIA Cosmos 世界基盤モデルを迅速に構築、カスタマイズ、デプロイするためのステップバイステップのレシピと事後トレーニング スクリプトが含まれています。
Cosmos を活用して、お好みの基礎モデルやモデル アーキテクチャを使用してゼロから構築できます。 ビデオ データの前処理に Cosmos Curator を活用することで始めましょう。次に、Cosmos Tokenizer を使用してデータを圧縮およびデコードします。 データの処理が完了したら、モデルのトレーニングまたはファインチューニングを行うことができます。
NVIDIA NIM™ マイクロサービスを使用することで、クラウド、データ センター、ワークステーションにある貴社のアプリケーションにフィジカル AI モデルを簡単に統合できます。
また、NVIDIA DGX Cloudを使用してAIモデルをトレーニングし、どこにでも大規模にデプロイできます。
3 つの世界基盤モデルはそれぞれ明確な役割を持っています。
Omniverse は、さまざまな生成 API、SDK、NVIDIA RTX レンダリング テクノロジを使用して、実世界のタスクのリアルな 3D シミュレーションを作成します。
開発者は、Omniverse シミュレーションを Cosmos Transfer モデルに指示映像として入力し、制御可能な写真のようにリアルな合成データを生成することができます。
両方を活用すると、Omniverse からはトレーニング前後のシミュレーション環境が提供され、Cosmos からは動画データを生成し、フィジカル AI モデルをトレーニングするための基盤モデルが提供されます。
NVIDIA Omniverse の詳細については、こちらをご覧ください。