This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

物理 AI

NVIDIA Cosmos

利用頂尖的世界基礎模型以及開放資料處理、訓練與評估框架，加快物理 AI 開發速度。

立即試用 | 影片 | 部落格文章

Cosmos 3

開放式物理 AI 基礎模型

首款具備原生推理、世界與行動產生功能的 omni 模型。使用 Mixture-of-Transformers 打造。

Power Vision AI 推理

將其當成視覺語言模型 (VLM) 時，可在複雜的真實世界情境中對物件、互動與意圖進行推理。

針對品質檢查、公共安全、交通監控、物流與自動駕駛等領域，提供即時警示與密集字幕。

建立策略模型

將 Cosmos 3 當作世界行動模型 (WAM) 的骨幹，加快機器人學習策略的速度。

在專用攝影機與具體資料上，針對廣義世界基礎模型進行後期訓練。策略模型會根據特定任務、領域與行為，大規模調整預先學習的動作。

模擬世界

以可控制、符合物理定律的世界模擬器形式執行，可預測多種方法、在封閉迴圈中評估結果，並整合出正確的行為。

跨環境、任務與條件調整迴圈，持續改善，無實際風險。

大規模合成影片資料

從文字、影像、影片、環境聲音與動作輸入中，產生無限個合理的未來景象。

運用影片生成技術，發揮想像力訓練物理 AI，不受實際拍攝內容限制。

影片

Cosmos 隆重登場

YouTube Video

聆聽 NVIDIA 創辦人暨執行長黃仁勳在 2026 年國際電腦展上發表 NVIDIA Cosmos 3 的演講，這是全球最先進的基礎模型，能協助開發人員打造能理解、模擬並在真實世界中行動的自主系統。

入門選項

開始使用 NVIDIA Cosmos

1

準備好建置了嗎？直接存取開放式模型與程式碼。

下載模型客製化模型

2

尚未準備好建置嗎？在我們的託管目錄中試用 Cosmos 模型。

3

需要協助？立即開始參考我們的實作模型方法。

瀏覽實用手冊

使用 Cosmos 開發

使用與 Cosmos 3 相同的技術、開放式框架與技能，讓全球開發人員可自訂、延伸物理 AI 技術，貢獻一臂之力。

資料庋用 (data curation)

利用 Cosmos Curator 快速篩選、註釋並去除大量感應器資料中的重複內容。

前往 GitHub 下載 Cosmos Curator

利用 Cosmos Evaluator 大規模審核生成式影像輸出並評分。

在 GitHub 下載 Cosmos Evaluator

訓練與加速

運用開放式後期訓練、評估、最佳化框架、推論指令碼與技能，快速建立、後期訓練或部署世界模型。

開始使用 GitHub 打造

產生合成資料的代理技能

將程式碼代理程式轉變為物理 AI 開發的合成資料專家。

使用案例

Cosmos 如何在各行各業加速 AI

使用 Cosmos 世界基礎模型進行模擬、推理與資料生成，以支援機器人、自駕車和工業視覺系統的下游處理流程。

機器人學習
自駕車訓練
影像分析 AI 代理

機器人學習

建立機器人學習策略，讓具體代理程式能在真實環境中的已知與未知條件下運作。

針對具體任務、環境、攝影機或感測器佈局以及策略，對 Cosmos 3 進行後期訓練
執行符合物理定律的精準封閉迴圈模擬
利用 Cosmos 上的代理技能，建立端到端合成資料增強與評估流程

自駕車訓練

產生自訂、多樣化且高擬真的感測器資料，以安全的方式訓練、測試與驗證自駕車。

利用新的天氣、光線與地理位置資料，擴大現有資料的多樣性
使用後期訓練將視野擴展至多感測器視角
利用 Cosmos 上的代理技能，建立端到端合成資料增強與評估流程

影像分析 AI 代理

在工業與城市環境中強化自動化、安全與營運效率。

有了 Cosmos，AI 代理程式可分析、總結並與即時或錄製的影片串流互動，以便：

提供即時情境警示
與影片對話，並從即時攝影機畫面或大型影片資源庫中擷取深入解析
利用 NVIDIA Metropolis Blueprint 打造有影片搜尋與摘要功能的影片分析 AI 代理程式
產生合成訓練資料，進一步提升理解準確度

效能

在 NVIDIA AI 上執行效果最佳

Cosmos 3 為 NVIDIA 硬體進行最佳化，藉此發揮最佳效能。NVIDIA RTX PRO 6000 Blackwell 系列伺服器，加速機器人、自駕車與 AI 代理的物理 AI 技術開發，涵蓋訓練、合成資料生成、模擬與推論等環節。

針對工業後期訓練與推論工作負載，在 NVIDIA Blackwell GB200 讓 Cosmos 世界基礎模型發揮最佳效能。

生態系

深受頂尖物理 AI 創新者的青睞

機器人、自駕車和視覺 AI 產業的模型開發人員都使用 Cosmos 加速物理 AI 發展。

後續步驟

加入 Cosmos 社群

與 Cosmos 專家交流、與其他開發人員互動、提供模型回饋，並瀏覽直播與方法來持續學習。

Cosmos Cookbook

這是一份全方位指南，可指導您與 NVIDIA Cosmos 生態系統有效合作，實現機器人技術、模擬、自主系統與物理場景理解的實際特定應用。

建置影像分析 AI 代理

使用 Cosmos Reason 搭配 NVIDIA Blueprint 來處理影片搜尋和摘要 (VSS)，建置具備擴充性、能即時理解影片的 AI 代理。

資源

Cosmos 開發人員的最新消息

最新消息
演講
技術展示

查看所有技術部落格查看所有主題最新消息

YouTube Video

運用 NVIDIA Halos 確保自駕安全無虞

YouTube Video

運用 Omniverse 與 Cosmos 實現自駕數據規模化

YouTube Video

模擬如何實現更安全的自駕車 | Foretellix

YouTube Video

利用 NVIDIA Omniverse 與 Cosmos 加速自駕車開發

YouTube Video

機器人如何學習成為機器人：訓練、模擬與現實世界部署

YouTube Video

機器人大腦如何模擬及探索未知世界

YouTube Video

在數位孿生打造及測試智慧城市 AI 代理程式

YouTube Video

NVIDIA Cosmos：物理 AI 適用的世界基礎模型平台

YouTube Video

利用 NVIDIA Cosmos 為物理 AI 生成合成資料

YouTube Video

利用 NVIDIA Omniverse 與 Cosmos 進行自駕車模擬

YouTube Video

利用 NVIDIA Cosmos 世界基礎模型進行物理 AI 開發

常見問題

Cosmos 3 使用 Mixture of Transformers 打造而成。推理與產生器模組採用不同的 Transformer，兼顧產生效率與效能。因此，模型會先推理後產生，進而在各方面展現頂尖的物理精準度。在此處深入瞭解架構。

所有人均可透過 NVIDIA 開放式模型授權取得 Cosmos 世界基礎模型。

Cosmos 3 現已在 GitHub 上開放，並針對每種模態與模組提供後期訓練指令碼。此外，NVIDIA TAO 7 提供一套代理技能與工具，用於微調視覺 AI 模型，包括 Cosmos 3，以及程式碼代理程式與自然語言提示。在 GitHub 上下載 TAO 7 代理技能與工具。

是，您可以利用 Cosmos 使用自己偏好的基礎模型或模型架構，從頭開始建置。您可以先使用 Cosmos Curator 進行影片資料預處理。然後利用 Cosmos 符元化工具壓縮並解碼資料。處理完資料後，即可訓練或微調模型。

透過 NVIDIA NIM™ 微服務，您可以輕鬆地將物理 AI 模型整合到雲端、資料中心和工作站的應用程式。

您也可以使用 NVIDIA DGX Cloud 訓練 AI 模型，並大規模部署在任何地方。

Cosmos 3 是一種 omni 模型，可跨文字、影像、影片、聲音與動作產生內容。Cosmos 2.5 與 Cosmos 2 則保留了獨立感知與產生模型與模式，且僅限於文字、影像與影片。

Omniverse 利用不同的生成 API、SDK 和 NVIDIA RTX 渲染技術，為實際任務建立逼真的 3D 模擬。

開發人員可將 Omniverse 模擬作為教學影片輸入 Cosmos Transfer 模型，生成可控的擬真合成資料。

Omniverse 提供訓練前後模擬環境，而 Cosmos 則提供基礎模型，用於生成影片資料與訓練物理 AI 模型。

深入瞭解 NVIDIA Omniverse。