NVLink と NVSwitch

高速なマルチ GPU コミュニケーションの構成要素であり、大規模なデータセットを短時間でモデルに送り、GPU 間でデータを高速に交換します。

より高速でスケールアップな相互接続に対するニーズ

エクサスケールコンピューティングや兆単位パラメーターの AI モデルの可能性を最大限に引き出せるかどうかは、サーバークラスター内での GPU 間のシームレスな高速通信にかかっています。第 5 世代の NVIDIA® NVLink® は、1 兆から数兆単位のパラメーターの AI モデルを処理する高速パフォーマンスを可能にするスケールアップな相互接続です。

NVIDIA NVlink でシステムスループットを最大化する

第 5 世代 NVLink は、大規模なマルチ GPU システムのスケーラビリティを大幅に向上させます。1 基の NVIDIA Blackwell Tensor コア GPU で最大 18 本の NVLink 100 GB/s (ギガバイト毎秒) 接続をサポートし、帯域幅の合計は 1.8 TB/s (テラバイト毎秒) となり、前世代の帯域幅の 2 倍、PCIe Gen5 の帯域幅の 14 倍以上になります。GB200 NVL72 などのサーバープラットフォームでこのテクノロジを活用すると、現代の複雑な大規模モデルの大半でスケーラビリティが上がります。

NVLink パフォーマンス

NVIDIA H100 の NVLink は、前世代と比較して GPU 間通信の帯域幅が 1.5 倍になっており、研究者はより大規模で高度なアプリケーションを使用し、さらに複雑な問題を解くことができます。

NVLink 通信で GPU スループットを上げる

NVIDIA NVLink と NVIDIA NVSwitch で GPU を完全接続

NVLink は GPU 間で 1.8TB/秒の直接相互接続であり、サーバー内でマルチ GPU の入出力 (IO) を拡張します。NVIDIA NVLink Switch は複数の NVLink を接続し、単一ラック内やラック間で、あらゆる GPU 通信を NVLink フルスピードで提供します。

高速な集合演算を可能にするために、各 NVLink Switch には NVIDIA SHARP™ (Scalable Hierarchical Aggregation Reduction Protocol) 用のエンジンがあり、ネットワーク内のデータ送信量を減らし、マルチキャストで高速化します。

NVLink Switch の詳細を見る

NVLink Switch System で数兆単位のパラメーターモデルを学習する

NVLink Switch を使用すると、NVLink 接続をノード間で拡張し、シームレスで高帯域幅なマルチノード GPU クラスターを構築できます。データセンターサイズの GPU が効果的に形成されます。NVIDIA NVLink Switch は、1 つの NVL72 で 130TB/秒の GPU 帯域幅を可能にし、大規模なモデルを並列処理します。NVLink を使用するマルチサーバークラスターは、コンピューティングの増加とバランスをとりながら GPU 通信を拡張します。その結果、NVL72 は、単一の 8 GPU システムに比べて 9 倍の GPU カウントをサポートできます。

NVIDIA GB200 NVL72 の詳細を見る

NVIDIA NVLink Switch

NVIDIA NVLink Switch は 144 個の NVLink ポートを備え、そのノンブロッキングスイッチング容量は 14.4TB/秒です。このラックスイッチは NVIDIA GB200 NVL72 システム中に、高帯域で低遅延に設計されており、外部の第 5 世代 NVLink 接続をサポートします。

技術ブログを読む

エンタープライズからエクサスケールにスケーリング

完全接続で比類のないパフォーマンス

NVLink Switch は、ノンブロッキングのコンピューティングファブリックで最大 576 基の接続された GPU をフルサポートできる、初のラックレベルスイッチチップです。NVLink Switch はあらゆる GPU ペアを驚異的な 1,800 GB/秒で相互接続します。完全な All-to-All 通信をサポートします。GB200 NVL72 の 72 基の GPU は、最大 1.4 petaFLOPS の AI 演算能力を備えた 1 台の高性能アクセラレータとして利用できます。

非常にパワフルな AI/HPC プラットフォーム

ハードウェア、ネットワーク、ソフトウェア、ライブラリ、最適化された AI モデル、NVIDIA AI Enterprise ソフトウェアスイートならびに NVIDIA NGC™ カタログからのアプリケーションが組み込まれた完全な NVIDIA データセンターソリューションにおいて、極めて重要な構成要素が NVLink と NVLink Switch です。最もパワフルなエンドツーエンド AI/HPC プラットフォームであり、研究者は現実に成果を出し、ソリューションを本番環境に展開でき、かつてない高速化があらゆる規模で可能となります。

仕様

NVLink
NVLink Switch

	第 2 世代	第 3 世代	第 4 世代	第 5 世代
GPU あたりの NVLink 帯域幅	300GB/秒	600GB/秒	900GB/秒	1,800GB/秒
GPU あたりの最大リンク数	6	12	18	18
サポートされている NVIDIA アーキテクチャ	NVIDIA Volta™ アーキテクチャ	NVIDIA Ampere アーキテクチャ	NVIDIA Hopper™ アーキテクチャ	NVIDIA Blackwell アーキテクチャ

	第 1 世代	第 2 世代	第 3 世代	NVLink Switch
1 NVLink ドメイン内の直接接続 GPU 数	最大 8	最大 8	最大 8	最大 576
NVSwitch GPU 間帯域幅	300GB/秒	600GB/秒	900GB/秒	1,800GB/秒
合計帯域幅	2.4TB/秒	4.8TB/秒	7.2TB/秒	1PB/秒
サポートされている NVIDIA アーキテクチャ	NVIDIA Volta™ アーキテクチャ	NVIDIA Ampere アーキテクチャ	NVIDIA Hopper™ アーキテクチャ	NVIDIA Blackwell アーキテクチャ

仮の仕様であり、変更される場合があります。

NVIDIA Blackwell アーキテクチャの詳細をご覧ください。

詳細を見る