系統輸送量極大化

系統輸送量極大化

NVIDIA® NVLink 技術透過針對多 GPU 與多 GPU/CPU 系統設定,提供更高的頻寬、更多的連結,及更佳的擴展性,來解決這項互連問題。單一 NVIDIA Tesla® V100 GPU 可支援多達六個 NVLink 連結,總頻寬高達每秒 300 GB,是 PCIe 3 的 10 倍。如全新的 NVIDIA DGX-1 伺服器可以發揮這些技術的優勢,提供更好的擴展性,以進行超快速的深度學習訓練。

將 GPU 對 GPU 加速提升至全新境界

Tesla V100 上市時採用 NVIDIA Pascal™ 架構,現在利用 NVLink,已將雙向訊號傳輸率從每秒 20 GB 提升至 25 GB。NVLink 可以用於 GPU 對 CPU 或 GPU 對 GPU 通訊,像是 DGX-1V 伺服器與 Tesla V100 互連。

Tesla V100 利用 NVLink 進行 GPU 對 GPU 與 GPU 對 CPU 連線
Hybrid Cube Mesh Topology
將效能提升至全新境界

將效能提升至全新境界

針對其他設定完全相同的伺服器,NVIDIA NVLink 可以將效能提升高達 31%。這項技術大幅增加頻寬並減少延遲時間,可以處理更大量的深度學習工作負載,依照工作負載增加而隨之調整效能。

NVSWITCH: 完全連結的 NVLINK

深度學習工作負載成長迅速,因此對於更快速、擴充性更高的互連技術需求也增加了,PCIe 的頻寬則逐漸成為多 GPU 系統層級的發展瓶頸。

NVLink 是一項重大的技術突破,可以在單一伺服器中使用八個 GPU,並加快效能,超越 PCIe 的效能。然而,若要進一步提升深度學習效能,需要能夠在單一伺服器中使用更多 GPU 的 GPU 網狀架構,並且讓各 GPU 能以全頻寬互連。

NVIDIA NVSwitch 是第一款節點式交換機架構支持 16 個完全連接的 GPU,並能分別以每秒 300 GB 的驚人速度驅動八對 GPU 之間通訊。此外,這 16 個完全連結的 GPU 可以作為具備 0.5 TB 統一記憶體空間以及 2 PetaFLOPS 運算能力的單一大型加速器。

NVSwitch Chart Speedup