概覽
代理 AI 與推理模型正在重新定義運算的極限。 但若要充分利用這些突破性技術,企業需要可在內部推理、在模型與代理程式之間快速傳遞資訊的基礎架構。 基礎架構必須以符合成本效益的方式解決訓練、後期訓練與推論的通訊、協調、記憶體移動與延遲問題。
NVIDIA DGX™ Rubin NVL8 提供代理 AI 時代的成功藍圖。 DGX Rubin NVL8 採用 NVIDIA Rubin 架構,是一款一站式的基礎架構解決方案,專為加速任何 AI 工作負載並大規模提供智慧而打造。
特色
DGX Rubin NVL8 系統採用 8 顆 NVIDIA Rubin GPU,提供 400 petaFLOPS 的推論效能和每秒 160 TB 的高頻寬記憶體 (HBM),確保資料能盡快透過基礎架構傳輸。DGX Rubin NVL8 採用第六代 NVIDIA NVLink™ 技術,確保實現大規模模型平行運算的無縫點對點通訊。
DGX Rubin NVL8 在整個 AI 生命週期中最佳化效能,大幅提高經濟可行性。 它具有專門為推理工作流程設計的專用多代理引擎,以及可最佳化硬體記憶體移動的專用強化學習引擎,強化學習速度比 NVIDIA Blackwell 系統快上 3 倍。
NVIDIA Mission Control™ 加速了營運的各個層面,包括設定 DGX Rubin NVL8 與設施整合,以及管理叢集與工作負載。 在智慧整合軟體支援下,企業能掌控冷卻和電力事件,進而重新定義基礎架構韌性。
NVIDIA DGX 搭載 NVIDIA DGX SuperPOD™,專為企業人工智慧全程量身打造,結合 NVIDIA 軟體、基礎架構和專業技術的優勢,打造出現代化的統一人工智慧開發解決方案。
規格
| GPU | 8 個 NVIDIA Rubin GPU |
| GPU 記憶體總計 | 頻寬 | 2.3 TB | 每秒 160 TB |
| 效能 | NVFP4 Inference: 400 PF NVFP4 Training: 280 PF FP8/FP6 Training: 140 PF |
| CPU | 2 個 Intel® Xeon® 6776P 處理器 |
| NVIDIA NVLink 交換器系統 | 4 倍 |
| NVIDIA NVLink 頻寬 | 總頻寬達每秒 28.8 TB |
| 系統功率使用量 | ~24 kW |
| 網路 | 8 個 OSFP 連接埠,可連接 8 個單連接埠 NVIDIA® ConnectX®-9 VPI
|
| 軟體 | NVIDIA DGX OS、Ubuntu、Red Hat Enterprise Linux、Rocky |
|
*規格可能會變更。 |
|
最新優惠與活動
與 NVIDIA 專家討論 NVIDIA DGX Rubin NVL8。
瞭解 NVIDIA DGX 為何是經實證的企業級 AI 標準。
透過從內部部署到託管解決方案的靈活部署選項,解鎖 AI 的全部潛力。