專為代理 AI 打造的 CPU
NVIDIA Vera CPU Rack 以 AI 工廠規模驅動強化學習與代理 AI。本身採用 NVIDIA MGX™ 架構,最多整合 256 顆 Vera CPU,可同時執行逾 22,500 個環境。
產品特點
代理 AI 的效能受限於傳統 CPU 瓶頸。在代理程式的推理循環中,CPU 會查詢 SQLite 記憶體、編譯生成的程式碼、執行 Python 工具鏈,並利用 RegEx 解析輸出。NVIDIA Vera 可將所有五種工作負載加速至頂尖 x86 CPU 的 1.8 倍,大幅提升代理式內部循環,將 AI 工廠輸出最大化。
根據測量資料得出的相對效能,可能有所變更。NVIDIA Vera CPU 效能基準為 x86 CPU (AMD EPYC Turin),涵蓋各種工作負載,包括程式碼編譯、解譯器、指令碼編寫、執行階段引擎、擷取、轉換與載入 (ETL)、資料分析與圖形。
根據測量資料得出的相對效能,可能有所變更。搭載 LPDDR5X 的 NVIDIA Vera CPU 在關鍵 CPU 記憶體效能指標方面,以搭載 DDR5 的 x86 CPU (AMD EPYC Turin) 為基準。
傳統 DDR5 必須在頻寬、效率與可維護性之間取捨。NVIDIA Vera 結合 LPDDR5X 記憶體與 SOCAMM、可拆卸、可現場更換的模組,提供低功耗 (LP) 效率,以及伺服器級的靈活性與可升級的容量。其成果是相較於搭載 DDR5 的領先 x86 CPU,提供 2 倍記憶體頻寬、3 倍每核心頻寬,以及 4 倍能源效率,進一步提升超大規模與企業級 AI 工廠的產出能力。
使用案例
產品特點
專為強化學習與代理 AI 的需求打造,NVIDIA Vera 結合自研 Olympus 核心、高頻寬 LPDDR5X 記憶體,以及低延遲 NVIDIA 可擴充連貫網狀架構 (SCF)。Vera 透過 NVIDIA NVLink™-C2C 連線、機密運算以及完整的 Arm® 相容性,可擴展至加速系統與現代化資料中心環境。本身的整合式運算架構確保軟體環境回應穩定、資料順暢流通,將 AI、分析與高效能運算工作負載的傳輸量、能源效率與 GPU 使用率極大化。
NVIDIA Vera Rubin NVL72 整合 NVIDIA 的尖端技術,包括 72 顆 Rubin GPU、36 顆 Vera CPU、ConnectX®-9 SuperNIC 與 BlueField-4 DPU。它透過搭載 NVLink 6 交換器的機架級平台擴充智慧,並藉由 NVIDIA Quantum-X800 InfiniBand 與 Spectrum-X™ 乙太網路橫向擴充,驅動 AI 工業革命。
立即開始
訂閱以接收 NVIDIA 的最新消息與更新。