クラウドネイティブ スーパーコンピューティング

AI、データ分析、HPC アプリケーション

のための安全でマルチテナント
なベアメタル パフォーマンス。  

マルチテナント分離とベアメタル パフォーマンスの実現

クラウドネイティブなスーパーコンピューティングは、ハイ パフォーマンス コンピューティングのパワーと、クラウド コンピューティング サービスのセキュリティや使いやすさを融合しています。NVIDIA クラウドネイティブ スーパーコンピューティング プラットフォームは、NVIDIA ® BlueField® データ処理ユニット (DPU) のアーキテクチャと高速で低遅延の NVIDIA Quantum InfiniBand ネットワーキングを活用し、ベアメタルのパフォーマンス、ユーザー管理と分離、データ保護、オンデマンドのハイ パフォーマンス コンピューティング (HPC)、AI サービスを簡単かつ安全に提供します。

これからの 10 年、さらにその先を見据えたイノベーション

クラウドネイティブ スーパーコンピューティング プラットフォーム

最大のパフォーマンスを実現するために、スーパーコンピューターはマルチテナント セキュリティを提供する必要があります。これはクラウドネイティブなプラットフォームを通じて理想的に実現されます。このアーキテクチャの移行を可能にする重要な要素は DPU です。

完全統合されたオンチップ型データ センター プラットフォームとして、DPU はホスト プロセッサの代わりにデータ センター インフラストラクチャのオフロードと管理を行い、スーパーコンピューターのセキュリティとオーケストレーションを可能にします。

NVIDIA Quantum InfiniBand スイッチ と組み合わせることで、このアーキテクチャは最適なベアメタル パフォーマンスを提供し、マルチノード テナント分離をネイティブでサポートします。

クラウドネイティブ スーパーコンピューティング プラットフォーム
ゼロトラスト アーキテクチャに向けて

ゼロトラスト アーキテクチャに向けて

クラウドネイティブのスーパーコンピューティング システムは、マルチテナント環境で最大のパフォーマンス、セキュリティ、オーケストレーションを実現するように設計されています。

BlueField DPU は、信頼されていないマルチノード テナントをホストすることができる一方で、スーパーコンピューティング リソースが以前の残骸を残すことなく、新しいテナントにクリーンに引き渡されることを保証します。これを実現するために、 BlueField DPU は新たにスケジュールされたテナントにクリーンなブートイメージを提供し、完全なクリーンアップと信頼性の再確立を行い、ストレージを仮想化し、承認されたストレージエリアへのアクセスを許可します。

アプリケーション パフォーマンスの高速化

HPC と AI の通信フレームワークとライブラリはレイテンシと帯域幅に敏感で、アプリケーションのパフォーマンスを決定する上で重要な役割を果たします。

ホスト CPU または GPU から Bluefield DPU にライブラリをオフロードすることで、通信と計算の同時実行のための最高レベルのオーバーラップを実現します。また、オペレーティング システムのジッターによる悪影響を低減し、アプリケーションのパフォーマンスを劇的に向上させます。これは次世代のスーパーコンピューター アーキテクチャを実現するための鍵です。

オハイオ州立大学の初期の研究結果から、クラウドネイティブのスーパーコンピューターは従来のスーパーコンピューターの 1.3 倍の速度で HPC ジョブを実行できることがわかっています。

DPU が P3DFFT で 1.3 倍のパフォーマンス高速化を実現

アプリケーション パフォーマンスの高速化
NVIDIA Cloud-Native Supercomputer Delivers Bare-Metal Performance

パフォーマンスの分離

NVIDIA Quantum-2 InfiniBand プラットフォームで、革新的かつプロアクティブな監視と輻輳管理が可能になるため、トラフィックの分離が実現し、パフォーマンス ジッターがほぼ排除され、アプリケーションが専用システムで実行されているかのような予測パフォーマンスが得られます。

クラウドネイティブ スーパーコンピューティング プラットフォーム

NVIDIA Bluefield

NVIDIA BlueField DPU 業界をリードする NVIDIA ConnectX® ネットワーク アダプター、複数の Arm コアと PCIe サブシステム、専用 HPC ハードウェア高速化エンジンを組み合わせ、データ センターのオンチップ型インフラストラクチャのプログラミングを完全に実現します。

InfiniBand

NVIDIA Quantum InfiniBand ネットワーキングでは、データ転送の高速化とオフロードを行って、データ不足や帯域不足に起因するコンピューティング リソースの欠乏を確実に回避することができます。InfiniBand ネットワークは異なるユーザーまたはテナント間で分割でき、セキュリティと QoS を保証します。

DOCA

NVIDIA DOCA SDK により、インフラストラクチャ開発者は業界標準の API を活用して NVIDIA BlueField DPU 上でネットワーク、ストレージ、セキュリティ、管理、AI および HPC のアプリケーションとサービスを迅速に作成できます。DOCA があれば、開発者は高性能で、ソフトウェア デファインドの、クラウドネイティブな DPU 対応サービスを開発し、未来のスーパーコンピューティング インフラストラクチャをプログラムできます。

Magnum IO

NVIDIA MAGNUM IO™ ソフトウェア開発キットを利用することにより、開発者はアプリケーションの入出力 (IO) を最適化し、ワークフローのエンドツーエンド時間を短縮できます。

Magnum IO は、ストレージ、ネットワーク、マルチ GPU、マルチノード通信など、IO のあらゆる側面をカバーします。また、アプリケーションをプロファイリングおよび最適化し、IO のボトルネックを解消するツールも含まれています。

主な特徴

  • マルチテナント分離、データ保護、セキュリティ
  • インフラストラクチャ サービスのオフロード
  • 通信フレームワークを加速させる専用ハードウェア エンジン
  • サービス品質の向上 (QoS)

メリット

  • ベアメタルのパフォーマンスを最適化
  • CPU の可用性、アプリケーションのスケーラビリティ、システム効率を向上
  • より多くの計算と通信とのオーバーラップを実現
  • ジッターやシステムノイズを低減
  • インフラ費用を削減

クラウドネイティブなスーパーコンピューティングの詳細については、技術概要をご覧ください。