システムのスループットの最大化

システムのスループットの最大化

NVIDIA® NVLink テクノロジでは、帯域幅を広くし、リンクを増やし、マルチ GPU および マルチ GPU/CPU システム構成の拡張性を改善することで、この相互接続の問題に対処しています。1つの NVIDIA Tesla® V100 GPU は、最大 6 つの NVLink リンクで合計 300 Gb/sec の帯域幅 (すなわち、PCIe 3 の 10 倍) をサポートします。新しい NVIDIA DGX-1 のようなサーバーでは、このような技術を利用して、超高速のディープラーニングのトレーニングに対してより大きな拡張性を提供します。

新しいレベルの GPU to GPU アクセラレーション

NVIDIA Pascal アーキテクチャで初めて導入された Tesla V100 の NVLink は、各方向の信号速度を 20 GB/秒から 25 GB/秒に向上させました。これは、Tesla V100 搭載 DGX-1V サーバーで見られるような GPU to CPU または GPU to GPU 通信で使用できます。

NVLink で GPU to GPU および GPU to CPU 接続した Tesla V100
DGX-1V サーバーでは、NVLink が 8 基の Tesla V100
新たなレベルの性能

新たなレベルの性能

NVIDIA NVLink は、他の点では全く同じように構成されたサーバーに対して、性能を最大 31% 向上できます。劇的に帯域幅が広がりレイテンシが減少したため、ディープラーニングのワークロードが増え続けても、パフォーマンスを向上させていくことができるでしょう。

NVSWITCH: NVLINK による完全接続

ディープラーニングのワークロードの急速な増大に伴い、PCIe の帯域幅がボトルネックとなる傾向が強まる中、高速かつスケーラブルな相互接続性の確保が至急の課題となっています。

NVLink の開発は大きな前進でした。単一のサーバーで 8 基の GPU を使用でき、PCIe を上回るパフォーマンスを実現しました。しかし、ディープラーニングの性能を新たなレベルに引き上げるには、単一サーバーで利用可能な GPU 数をさらに増やし、GPU 間で全帯域幅を使用した相互接続を可能にする構造が必要です。

NVIDIA NVSwitch は、単一サーバー ノードで 16 基の完全結合 GPU をサポートし、8 組の GPU すべてをそれぞれ驚くべきことに 300 GB/s で同時通信するという初めてのオンノード スイッチ アーキテクチャです。そしてこれら 16 基の完全結合 GPU は、0.5 テラバイトの統合メモリ空間と 2 ペタ FLOPS の計算処理能力を持った 1 つの大型アクセラレータとして使用できます。

NVSwitch Chart Speedup