NVIDIA Quantum-2 InfiniBand プラットフォーム

あらゆる規模のクラウドネイティブスーパーコンピューティングに対応する卓越したパフォーマンス

ネットワーク通信における記録的なパフォーマンス

NVIDIA InfiniBand アーキテクチャの第 7 世代である NVIDIA Quantum-2 は、世界で最も困難な課題を解決するのを支援する最速のネットワークパフォーマンスと機能群を AI の開発者や科学研究者に提供します。NVIDIA Quantum-2 は、ソフトウェアデファインドネットワーク、In-Network Computing、パフォーマンスの分離、先進のアクセラレーションエンジン、リモートダイレクトメモリアクセス (RDMA)、最大 400 Gb/秒の最速のスピードおよびフィードを提供することで、世界屈指のスーパーコンピューティングデータセンターに力を与えます。

データ速度

パフォーマンスの向上

TCO の向上

エクサスケール対応

高速化されたディープラーニング

HPC および AI のスーパーコンピューターやアプリケーションを強化する

高速化された In-Network Computing

現代のハイパフォーマンスコンピューティング (HPC)、AI、ハイパースケールインフラは、より効率的で高速にデータを分析し、複雑なシミュレーションを実行するために、より高速な相互接続とよりインテリジェントなネットワークを必要とします。NVIDIA Quantum-2 は、第 3 世代の NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™、Message Passing Interface (MPI) Tag Matching、MPI All-to-All、プログラマブルエンジンなど、事前構成もしくはプログラマブルなコンピューティングエンジンを使用して、In-Network Computing を強化し拡張します。これによりノードあたり最小のコストおよび最大の ROI を実現します。

パフォーマンスの分離

NVIDIA Quantum 2 InfiniBand プラットフォームでは、革新的かつプロアクティブな監視と輻輳管理が可能で、トラフィックの分離を実現し、パフォーマンスジッターがほぼ排除され、アプリケーションは、専用システムで実行されている様な、予測可能なパフォーマンスが得られます。

クラウドネイティブスーパーコンピューティング

NVIDIA クラウドネイティブスーパーコンピューティングプラットフォームは、高速で低レイテンシの NVIDIA Quantum-2 InfiniBand ネットワークとともに、NVIDIA® BlueField® のデータプロセシングユニット (DPU) アーキテクチャを活用します。このソリューションにより、ベアメタルのパフォーマンス、ユーザー管理とアイソレーション、データ保護、オンデマンドのハイパフォーマンスコンピューティング (HPC)、AI サービスが、シンプルかつ安全に提供されます。

光速のデータ送信

アダプター

PCIe Gen4 および Gen5 をサポートした NVIDIA ConnectX-7 InfiniBand アダプターはさまざまなフォームファクターに対応し、シングルまたはデュアルのネットワークポートで毎秒 400 ギガビットの速度を実現します。

ConnectX-7 InfiniBand アダプターには、高度な In-Network Computing 機能が備えられているほか、データアルゴリズムの前処理を可能にし、アプリケーション制御パスをネットワークにオフロードするプログラマブルエンジンも追加されています。

NVIDIA ConnectX-7 アダプター

スイッチ

NVIDIA Quantum-2 ファミリのスイッチは、64 個の 400Gb/秒ポートまたは 128 個の 200Gb/秒ポートが 32 個の物理 OSFP (Octal Small Form-factor) コネクタ上に構成されています。このコンパクトな 1U スイッチには、空冷バージョンと液冷バージョンがあり、内部管理または外部管理されます。

NVIDIA Quantum-2 ファミリのスイッチは、双方向スループットが毎秒 51.2 テラビット (Tb/s) となり、転送能力は毎秒 665 億パケット (bpps) を超えます。

NVIDIA Quantum-2 スイッチ

トランシーバーとケーブル

NVIDIA Quantum-2 は、選択したトポロジを構築するための柔軟性を最大限に高める接続オプションを備えています。NVIDIA Quantum 2 の接続オプションには、さまざまなトランシーバーとマルチファイバープッシュオン (MPO) コネクタ、アクティブカッパーケーブル (ACC)、ダイレクトアタッチケーブル (DAC、1 対 2 および 1 対 4 スプリッターを選択可能) があります。

また、新しい 400 Gb/秒のクラスターを既存の 200 Gb/秒または 100 Gb/秒ベースのインフラに接続できる下位互換性も備えています。

NVIDIA LinkX のケーブルとトランシーバー

世界をリードするネットワークパフォーマンス、スケーラビリティ、効率性

パフォーマンス

ポートあたり 400 Gb/秒の帯域幅
スイッチあたり 400 Gb/秒のポートを 64 個、または 200 Gb/秒のポートを 128 個
NVIDIA Quantum-2 スイッチデバイスあたり毎秒 665 億パケット以上 (双方向)

自己記録をさらに更新

前世代と比較してポートあたりの帯域幅が 2 倍
前世代と比較してスイッチ基数が 3 倍
MPI パフォーマンスが 4 倍
前世代と比較してスイッチあたりの AI アクセラレーション性能が 32 倍向上
4 スイッチ層 (3 ホップ) の DragonFly+ ネットワークで 100 万台以上の 400 Gb/秒ノード、この数字は前世代と比べて 6.5 倍
データセンターの電力とスペースが 7% 軽減

主な特徴

フルトランスポートオフロード
RDMA、GPUDirect® RDMA、GPUDirect Storage
プログラマブルな In-Network Computing エンジン
MPI All-to-All ハードウェアアクセラレーション
MPI Tag Matching ハードウェアアクセラレーション
NVIDIA SHARPv3
高度なアダプティブルーティング、輻輳制御、QoS
ネットワークの自己回復