NVIDIA DSX 參考設計中,針對特定世代且經過驗證的 AI 工廠架構,涵蓋運算、網路、儲存、設施基礎設施與硬體叢集設計。
NVIDIA DSX™ 統合了設計、模擬、營運與生態系技術,協助以最低 token 成本建置最佳化的 AI 工廠。
概覽
NVIDIA DSX 定義了在完整堆疊設計、建置及最佳化 AI 工廠的方式,範圍涵蓋晶片與系統,以及基礎設施軟體、設施及合作夥伴技術。
DSX 結合開放式軟體函式庫、工作流程指南與參考設計,以及 NVIDIA 運算平台和共同設計的 OEM 基礎設施,建構出廣泛的軟硬體解決方案生態系。
優勢
NVIDIA DSX AI 工廠是共同設計的統合產品,針對每百萬瓦最低 Token 成本最佳化。
技術
NVIDIA DSX 這款平台涵蓋的多項技術,不僅支援合作夥伴協同開發,還可供擴充建置之用,將 AI 工廠的每瓦 AI Token 產量最大化。
貫穿晶片至電網的 AI 工廠驗證架構
AI 工廠設計與營運的模擬
大規模高效營運 AI 工廠
動態電源管理,將每瓦 Token 最大化
AI 工廠的電網回應式電力統籌系統
跨 IT、OT 與 AI 工廠營運安全交換資料
NVIDIA AI 雲端就緒 ISV 驗證計畫,為 NVIDIA 雲端合作夥伴部署評估跨網路、運算、統籌與 AI 平台層的基礎設施軟體。
資源
利用 NVIDIA 參考架構、模擬工具與生態系軟體,設計並最佳化 AI 工廠。
探索經驗證符合 NVIDIA AI 工廠應用功能需求的產品。
NVIDIA DSX 是 NVIDIA 的 AI 工廠級平台。它結合設計、模擬、營運與生態系技術,協助合作夥伴以最低 token 成本打造最佳化的 AI 工廠。DSX 涵蓋晶片與系統、基礎設施軟體、設施與合作夥伴技術,讓 AI 工廠得以每瓦產出更多 Token。
它包括下列技術:DSX 參考設計、DSX Sim、DSX MaxLPS、DSX Flex、DSX Exchange 與 DSX OS。
AI 工廠是專為 AI 工作負載而生,著重推論效能、能源效率與最低 token 成本。NVIDIA DSX AI 工廠是共同設計的統合式系統,涵蓋晶片、系統、網路、基礎設施軟體、電力、冷卻與營運,有別於通常以孤立元件拼湊而成的傳統資料中心。
傳統資料中心主要用於儲存、處理、檢索及交付資訊。AI 工廠會生成智慧,將資料與能源轉化為 Token、預測結果、模擬與採用 AI 技術的輸出結果。
NVIDIA Omniverse DSX Blueprint 是開放式全方位框架,用於設計與運營大規模 AI 工廠。它已在 build.nvidia.com 正式上線,並與 NVIDIA Vera Rubin DSX AI 工廠參考設計完全相容。
這款 Blueprint 讓開發者能為 AI 工廠打造符合物理定律的數位孿生,即時模擬營運,並在施工或部署前先將效能最佳化。它包含完整的 AI 工廠數位孿生、NVIDIA SimReady 資產、硬體配置、預先建置的 Web UI、範例指令碼、工作流程指南,以及 NVIDIA CUDA-X™ 與 Omniverse 核心技術。
NVIDIA DSX 服務的對象是廣泛的跨領域生態系:NVIDIA 雲端合作夥伴 (NCP)、主權雲,以及土地/電力/廠房外殼 (LPS) 提供者;電力與冷卻設備製造商;設計、模擬與設施營運的獨立軟體供應商 (ISV);原始設備製造商 (OEM) 與系統整合商;建築、工程與營建公司;以及提供 IaaS 與 PaaS 解決方案的基礎設施 ISV。
DSX 提供通用設計標準,因此無論是冷卻液分配器 (CDU) 製造商或 ISV,無須量身打造的整合,即可為打造 AI 工廠貢獻一己之力。
NVIDIA DSX 讓 AI 工廠能以相同的電力、基礎設施與營運預算,產出更多 token,有助於降低 token 成本。DSX 並非將運算、冷卻、電力與營運視為個別系統,而是將它們視為整合式 AI 工廠。
DSX MaxLPS 有助於釋放擱置電力,讓客戶以相同的百萬瓦電力預算,多配置高達 40% 的 GPU。DSX OS 將機群規模營運最佳化,延長正常運作時間。DSX 參考設計可加速部署,而 DSX Exchange 與 DSX Sim 則協助統合設施、電力、冷卻與運算訊號,進而提高傳輸量、效率與每瓦 Token 數量。
閱讀 NVIDIA DSX 說明文件,開始探索建置 AI 工廠的參考設計、軟體元件與合作夥伴整合途徑。這些文件為設計、最佳化及營運 DSX 相容的基礎設施提供技術指引。