NDR 400Gb/s InfiniBand アーキテクチャ

あらゆる規模でのクラウドネイティブ スーパーコンピューティングの卓越したパフォーマンス

ネットワーク通信における記録的なパフォーマンス

NDR 400Gb/s を搭載した第 7 世代 NVIDIA InfiniBand アーキテクチャは、AI の開発者や科学研究者に、世界で最も困難な課題に立ち向かうための最速のネットワーク パフォーマンスを提供します。ソフトウェア デファインド ネットワーキング、リモート ダイレクトメモリ アクセス (RDMA)、In-Network Computing、高度なアクセラレーション エンジン、最速のスピードとフィードを備えた NDR InfiniBand は、世界有数のスーパーコンピューティング データ センターに力を与えています。

nvidia-networking-ndr-technology-numbers-1cn-d

HPC および AI のスーパーコンピューター/アプリケーションを強化する

高速化された In-Network Computing

現代のハイパフォーマンス コンピューティング (HPC)、AI、ハイパースケール インフラストラクチャは、より速く効率的にデータを分析し、複雑なシミュレーションを実行するために、より高速なインターコネクトとよりインテリジェントなネットワークを必要とします。NVIDIA InfiniBand は、第 3 世代の NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3)™、Message Passing Interface(MPI)Tag Matching、MPI All-to-All、およびプログラム可能なエンジンなど、事前構成されたプログラム可能なコンピューティング エンジンを搭載した In-Network Computing を強化、および拡張し、ノードあたりのコストと ROI を最大限に高めます。

NVIDIA Mellanox InfiniBand アーキテクチャで加速する In-Network Computing
NVIDIA Mellanox NDR InfiniBand アーキテクチャと SHARPv3 テクノロジを導入したデータ センター

無限のスケーラビリティ

SHARPv3 テクノロジを採用した NDR InfiniBand は、ネットワーク経由の大規模なデータ集約のスケーラビリティが実質的に、無制限になり、最大 64 の並列フローがサポートされ、前世代の HDR InfiniBand と比較して AI 高速化のパワーは 32 倍になります。MPI All-to-All および MPI Tag Matching ハードウェア エンジンは、強化された輻輳制御、アダプティブ ルーティング、自己回復ネットワークなどの機能とともに、HPC および AI クラスターの重要な機能をもたらし、そのパフォーマンスをさらに高めます。

光速のデータ送信

ホスト チャンネル アダプター

NVIDIA ConnectX-7 NDR 400Gb/s InfiniBand ホスト チャネル アダプター (HCA) は、世界で最も困難なワークロードに対応できる最高のネットワーク パフォーマンスを提供します。

PCIe Gen4 および Gen5 を搭載した NDR InfiniBand HCA はさまざまなフォーム ファクターに対応し、シングルまたはデュアルのネットワーク ポートで毎秒 400 ギガビット (Gb/s) を提供します。

NDR InfiniBand HCA には、MPI All-to-All および MPI Tag Matching ハードウェア エンジンを備えた高度な In-Network Computing 機能が含まれています。また、サービス品質 (QoS) を強化するために、他のファブリックでは、アダプティブ ルーティングと輻輳制御を向上させました。HCA には、データ アルゴリズムの前処理を可能にし、アプリケーション制御パスをネットワークにオフロードするプログラム可能なエンジンも新たに追加しています。これにより、パフォーマンスとスケーラビリティが高まり、計算処理と通信間のオーバーラップも向上します。

エッジ スイッチ

NDR InfiniBand 製品群の固定構成スイッチは、32 個の物理 OSFP (Octal Small Form-factor) コネクタ上に、64 個の NDR ポートまたは 128 個の NDR200 ポートで構成されています。このコンパクトな 1U スイッチには、空冷バージョンと液冷バージョンがあり、内部管理または外部管理されます。

NDR InfiniBand 製品群の固定構成スイッチは、双方向スループットが毎秒 51.2 テラビット (Tb/s) となり、転送能力は毎秒 665 億パケットを超えます。このスイッチは理想的なラックマウント型 InfiniBand ソリューションであり、Fat Tree、DragonFly+、多次元 Torus、Hypercube といったさまざまなトポロジで動作し、最高の柔軟性を提供します。

モジュール式スイッチ

NDR InfiniBand 製品群のモジュール式スイッチ製品群には、以下のポート構成があります。

  • NDR (400Gb/s) のポートが 2,048 個、または NDR200 (200Gb/s) のポートが 4,096 個
  • NDR (400Gb/s) のポートが 1,024 個または、NDR200 (200Gb/s) のポートが 2,048 個
  • NDR (400Gb/s) のポートが 512 個または、NDR200 (200Gb/s) のポートが 1,024 個

最大のモジュール式スイッチの場合、前世代 HDR InfiniBand モジュール式スイッチの 5 倍にあたる、毎秒 1.64 ペタビットの合計双方向スループットを実現します。

トランシーバーとケーブル

NDR InfiniBand の接続オプションには、さまざまなトランシーバーとマルチファイバー プッシュオン (MPO) コネクタ、アクティブ カッパー ケーブル (ACC)、ダイレクト アタッチ ケーブル (DAC、1 対 2 および 1 対 4 スプリッターを選択可能) があります。あらゆるトポロジで最高のパフォーマンスを提供する最高の柔軟性を提供します。

世界をリードするネットワーク パフォーマンス、スケーラビリティ、効率性

パフォーマンス

  • ポートあたり 400 Gb/秒の帯域幅
  • 1 つのスイッチで NDR 400 Gb/秒のポートを 64 個、または NDR200 200 Gb/秒のポートを 128 個
  • 1 つのモジュール式スイッチで NDR ポートを 2,048 個、または NDR200 ポートを 4,096 個
  • 1 つの NDR スイッチ デバイスで毎秒 665 億パケット超 (双方向)

自己記録をさらに更新

  • HDR に比べてポートあたり 2 倍の帯域幅
  • HDR に比べて 3 倍のスイッチ ラディックス
  • HDR に比べてスイッチあたり 32 倍のAI 高速化パワー
  • 4 スイッチ層 (3 ホップ) の DragonFly+ ネットワークで 100 万台以上の 400 Gb/s ノード、HDR と比べて 6.5 倍

主な特徴

  • フル トランスポート オフロード
  • RDMA、GPUDirect® RDMA、GPUDirect Storage
  • プログラミング可能な In-Network Computing エンジン
  • MPI All-to-All ハードウェア アクセラレーション
  • MPI Tag Matching ハードウェア アクセラレーション
  • NVIDIA SHARPv3
  • 高度なアダプティブ ルーティング、輻輳制御、QoS
  • ネットワークの自己回復

NDR の詳細については、アーキテクチャ概要の完全版をご覧ください。