NVIDIA Quantum-2 InfiniBand
アーキテクチャ

あらゆる規模のクラウドネイティブ スーパーコンピューティングに対応する卓越したパフォーマンス

ネットワーク通信における記録的なパフォーマンス

NVIDIA InfiniBand アーキテクチャの第 7 世代である NVIDIA Quantum 2 は、世界で最も困難な問題に挑む AI 開発者や科学研究者に、世界有数のスーパーコンピューティング データセンターを強化するための、最速のネットワーク性能と機能群 (ソフトウェアデファインド ネットワーク、リモート ダイレクト メモリ アクセス (RDMA)、In-Network Computing、高度なアクセラレーション エンジン、そして最速となる最大 400Gb/s の帯域)を提供します。

2X Data Throughput

データ速度

4X MPI Performance

パフォーマンスの向上

5X Switch System Capacity

TCO の向上

6.5X Higher Scalability

エクサスケール対応

32X More AI Acceleration

高速化されたディープラーニング

インパクトを与えるパフォーマンス

HPC および AI のスーパーコンピューター/アプリケーションを強化する

高速化された In-Network Computing

現代のハイパフォーマンス コンピューティング (HPC)、AI、ハイパースケール インフラストラクチャは、より速く効率的にデータを分析し、複雑なシミュレーションを実行するために、より高速なインターコネクトとよりインテリジェントなネットワークを必要とします。NVIDIA Quantum 2 は、第 3 世代の NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™、Message Passing Interface (MPI) Tag Matching、MPI All-to-All、およびプログラマブル エンジンなど、事前に設定されたものやプログラマブルなコンピューティング エンジンによって In-Network Computing を強化および拡張し、最も低いノードあたりのコストと最高の ROI を実現します。

 
Benefits of Performance Isolation

パフォーマンスの分離

NVIDIA Quantum-2 InfiniBand プラットフォームでは、革新的かつプロアクティブな監視と輻輳管理により、トラフィックの分離を実現。パフォーマンス ジッターはほぼ排除され、アプリケーションが専用システムで実行されているかのような予測可能なパフォーマンスが得られます。

クラウドネイティブ スーパーコンピューティング

NVIDIA クラウドネイティブ スーパーコンピューティング プラットフォームは、高速で低レイテンシの NVIDIA Quantum-2 InfiniBand ネットワークとともに、NVIDIA ® BlueField® のデータ処理ユニット (DPU) アーキテクチャを活用します。このソリューションにより、ベアメタルのパフォーマンス、ユーザー管理と隔離、データ保護、オンデマンドのハイ パフォーマンス コンピューティング (HPC)、AI サービスを、シンプルかつ安全に提供します。

Data center with NVIDIA Quantum-2 InfiniBand architecture with SHARPv3 technology

光速のデータ送信

ホスト チャンネル アダプター

NVIDIA ConnectX-7 InfiniBand ホスト チャンネル アダプター (HCA) は、世界で最も困難なワークロードに対応するための最高のネットワーク パフォーマンスを提供します。

PCIe Gen4 および Gen5 をサポートした ConnectX-7 InfiniBand HCA はさまざまなフォーム ファクターに対応し、シングルまたはデュアルのネットワーク ポートで毎秒 400 ギガビット (Gb/s) の速度を実現します。

ConnectX-7 InfiniBand HCA には、MPI All-to-All および MPI Tag Matching ハードウェア エンジンを備えた高度な In-Network Computing 機能が含まれています。また、サービス品質 (QoS) を強化するために、アダプティブ ルーティングや輻輳制御といったファブリックの改良も行われています。HCA には、データ アルゴリズムの前処理を可能にし、アプリケーション制御パスをネットワークにオフロードするプログラマブルなエンジンを新たに追加しています。これにより、パフォーマンスとスケーラビリティが向上し、計算処理と通信のオーバーラップも強化されます。

固定構成のスイッチ

NVIDIA Quantum-2 製品群の固定構成スイッチは、64 個の 400Gb/秒ポートまたは 128 個の 200Gb/秒ポートが 32 個の物理 OSFP (Octal Small Form-factor) コネクタ上に構成されています。このコンパクトな 1U スイッチには、空冷バージョンと液冷バージョンがあり、内部または外部管理されます。

NVIDIA Quantum-2 製品群の固定構成スイッチは、双方向スループットが毎秒 51.2 テラビット (Tb/s) となり、転送能力は毎秒 665 億パケットを超えます。このスイッチは理想的なラックマウント型 InfiniBand ソリューションであり、Fat Tree、DragonFly+、多次元 Torus、Hypercube といったさまざまなトポロジで動作し、最高の柔軟性を提供します。

モジュール式スイッチ

NVIDIA Quantum-2 製品群のモジュール式スイッチには、以下のポート構成があります。

  • 2,048 個の 400Gb/秒ポート、または 4,096 個の 200Gb/秒ポート
  • 1,024 個の 400Gb/秒ポート、または 2,048 個の 200Gb/秒ポート
  • 512 個の 400Gb/秒ポート、または 1,024 個の 200Gb/秒ポート

最大構成のモジュール式スイッチの場合、前世代 NVIDIA Quantum InfiniBand モジュール式スイッチの 5 倍にあたる、毎秒 1.64 ペタビットの合計双方向スループットを実現します。

トランシーバーとケーブル

NVIDIA Quantum 2 の接続オプションには、さまざまなトランシーバーやマルチファイバー プッシュオン (MPO) コネクタ、アクティブ カッパー ケーブル (ACC)、ダイレクト アタッチ ケーブル (DAC、1 対 2 および 1 対 4 スプリッターを選択可能) があります。あらゆるトポロジで最高のパフォーマンスを提供する最高の柔軟性を提供します。

世界をリードするネットワーク パフォーマンス、スケーラビリティ、効率性

パフォーマンス

  • ポートあたり 400 Gb/秒の帯域幅
  • 1 つのスイッチで 400 Gb/秒のポートを 64 個、または 200 Gb/秒のポートを 128 個
  • 1 つのモジュール式スイッチで 400 Gb/秒のポートを 2,048 個、または 200 Gb/秒のポートを 4,096 個
  • 1 つの NVIDIA Quantum 2 スイッチ デバイスで毎秒 665 億パケット以上 (双方向)

自己記録をさらに更新

  • 前世代と比較してポートあたりの帯域幅が 2 倍
  • 前世代と比較してスイッチ基数が 3 倍
  • MPI パフォーマンスが 4 倍
  • 前世代と比較してスイッチあたりの AI アクセラレーション性能が 32 倍向上
  • 4 スイッチ層 (3 ホップ) の DragonFly+ ネットワークで 100 万台以上の 400 Gb/s ノード、この数字は前世代と比べて 6.5 倍
  • データ センターの電力とスペースが 7% 軽減

主な特徴

  • フル トランスポート オフロード
  • RDMA、GPUDirect® RDMA、GPUDirect Storage
  • プログラマブルな In-Network Computing エンジン
  • MPI All-to-All ハードウェア アクセラレーション
  • MPI Tag Matching ハードウェア アクセラレーション
  • NVIDIA SHARPv3
  • 高度なアダプティブ ルーティング、輻輳制御、QoS
  • ネットワークの自己回復

NVIDIA Quantum-2 InfiniBand プラットフォームの詳細については、アーキテクチャ概要の完全版をご覧ください。