世界基礎模型
頂尖的世界生成模型,可因應任何物理 AI 任務或環境而調整。
利用 2B/14B 模型,從文字、影像或影片生成 30 秒預測性影像世界,或者對資料進行後期訓練,建立自訂的邊緣案例、閉環原則以及多個檢視畫面且以機器人為中心的模擬。
用於模擬到擬真轉換的多重控制模型。
搭配 CARLA 或 NVIDIA Isaac Sim™ 等物理 AI 模擬框架,加速各種環境與光照條件的合成資料生成。
頂尖的視覺語言模型 (VLM) 讓機器人與視覺 AI 代理像人類一樣推理。
結合先驗知識、物理原理與常識,為公共安全、交通監控、物流、品質檢查與物理 AI 提供即時警示與可據以行動的深入解析。
加速高效的資料集處理與評估。
使用案例
為下游任務、環境、攝影機或感應器佈局與原則量身打造世界模型。
生成自訂、多樣化且高擬真的感應器資料,以安全的方式訓練、測試與驗證自駕車。
在工業與城市環境中強化自動化、安全與營運效率。
有了 Cosmos Reason,AI 代理程式可分析、總結與即時或錄製的影片串流互動,以便:
入門選項
AI 基礎架構
NVIDIA RTX PRO 6000 Blackwell 系列伺服器,加速機器人、自駕車與 AI 代理的物理 AI 技術開發,涵蓋訓練、合成資料生成、模擬與推論等環節。
針對工業後期訓練與推論工作負載,在 NVIDIA Blackwell GB200 讓 Cosmos 世界基礎模型發揮最佳效能。
生態系統
機器人、自駕車和視覺 AI 產業的模型開發人員都使用 Cosmos 加速物理 AI 發展。
[2026 年 1 月 22 日] 發布關於 Cosmos Policy 的研究,以 Cosmos Predict-2 為基礎,用於視覺運動控制與規劃。
[2026 年 2 月 9 日]增強新的 Cosmos Reason 2 運算支援、量化與 CUDA 相容性。
[2025 年 12 月 19 日] 透過 Hugging Face 發布 Cosmos-Predict2.5-2B Diffusers 支援、Hugging Face 上的 Cosmos-Predict2.5-2B Text2World 蒸餾檢查點以及蒸餾指南。
[2025 年 12 月 19 日] 發佈 Cosmos Transfer 2.5 的 Image2Image 與 ImagePrompt 功能。 請參閱此處的推論指南。
探索 GitHub 深入瞭解。
所有人均可透過 NVIDIA 開放式模型授權取得 Cosmos 世界基礎模型。
請參閱全新的 Cosmos 實用手冊,其中包含逐步方法和後期訓練指令碼,以快速打造、自訂及部署 NVIDIA Cosmos 世界基礎模型,適用於機器人與自主系統。
是,您可以利用 Cosmos 使用自己偏好的基礎模型或模型架構,從頭開始建置。 您可以先使用 Cosmos Curator 進行影片資料預處理。然後利用 Cosmos 符元化工具 壓縮並解碼資料。 處理完資料後,即可訓練或微調模型。
透過 NVIDIA NIM™ 微服務,您可以輕鬆地將物理 AI 模型整合到雲端、資料中心和工作站的應用程式。
您也可以運用 NVIDIA DGX Cloud 訓練 AI 模型,並大規模部署在任何地方。
這三者皆是具有獨特角色的世界基礎模型:
Omniverse 利用不同的生成 API、SDK 和 NVIDIA RTX 渲染技術,為實際任務建立逼真的 3D 模擬。
開發人員可將 Omniverse 模擬當成教學影片輸入 Cosmos Transfer 模型,生成可控制的擬真合成資料。
Omniverse 提供訓練前後的模擬環境,而 Cosmos 則提供基礎模型,用於生成影片資料並訓練物理 AI 模型。
深入瞭解 NVIDIA Omniverse。