隨著預先訓練、後期訓練與推論時間擴充定律的聚合,現代資料中心在嘗試支援需要複雜、多步驟思維鏈的模型時,面臨效能與效率瓶頸。
NVIDIA DGX™ Vera Rubin NVL72 是專為應對這些挑戰而打造的一站式 AI 基礎架構解決方案,可在提供頂尖效能的同時,大幅提高能源效率。DGX Vera Rubin NVL72 為所有 AI 工作負載提供領先業界的每瓦效能與每瓦 Token 效能,讓企業能夠大幅拓展智慧,同時改善 Token 經濟效益。
DGX Vera Rubin NVL72 結合節能的 NVIDIA Vera CPU 與 NVIDIA Rubin GPU,提供頂尖的每瓦效能。這讓企業能夠在現有能源足跡內,擴展訓練與長內容推論,將資料中心轉變為 AI 創新的高效能引擎。
NVIDIA DGX SuperPOD™ 搭載 DGX Vera Rubin NVL72 系統,在部署大規模 AI 基礎架構時,移除所有不確定性。憑藉簡單、易於部署的機架式架構,此設計旨在發揮資料中心工程的最新技術。
NVIDIA Mission Control™ 加速了營運的各個層面,包括設定 DGX Vera Rubin NVL72 與設施整合,以及管理叢集與工作負載。在智慧整合軟體支援下,企業能掌控冷卻和電力事件,進而重新定義基礎架構韌性。
NVIDIA DGX 搭載 NVIDIA DGX SuperPOD,專為企業 AI 全程量身打造,結合 NVIDIA 軟體、基礎架構和專業技術的優勢,打造出現代化的統一 AI 開發解決方案。
| GPU | 72 個 NVIDIA Rubin GPU、36 個 NVIDIA Vera CPU |
| GPU 記憶體總計 | 頻寬 | 20.7 TB | 最高每秒 28.8 TB |
| 總快速記憶體 | 75 TB |
| 效能 | NVFP4 Inference: 3,600 PFLOPS NVFP4 Training: 2,520 PFLOPS FP8/FP6 Training: 1,260 PFLOPS |
| 網路 | > 144 個 OSFP 單連接埠 NVIDIA® ConnectX®-9 VPI,支援 800 Gb/s NVIDIA InfiniBand 與乙太網路 > 18 個雙連接埠 NVIDIA BlueField®-4 VPI,支援 400 Gb/s NVIDIA InfiniBand 與乙太網路 |
| NVIDIA NVLink™ Switch 系統 | 9x L1NVIDIA NVLink 交換器 |
| 管理網路 | 內建 RJ45 的主機板管理控制器 (BMC) |
| 軟體 | NVIDIA Mission Control、NVIDIA AI Enterprise、NVIDIA DGX OS |
| 企業支援 | 針對硬體與軟體提供為期三年的企業標準支援服務 |
Specifications subject to change
與 NVIDIA 專家討論 NVIDIA DGX Vera Rubin NVL72。
瞭解 NVIDIA DGX 為何是經實證的企業級 AI 標準。
透過從地端到託管解決方案的靈活部署選項,全面釋放 AI 的潛能。