NVIDIA vComputeServer

仮想 GPU により極めて計算負荷の高いサーバー ワークロードにパワーを

AI、ディープラーニング、データ サイエンス向けにコンピューティングを仮想化

NVIDIA 仮想コンピューティング サーバー (vCompute Server) により、データ センターは GPU でサーバーの仮想化を高速化できます。その結果、人工知能 (AI)ディープラーニングHPC (ハイ パフォーマンス コンピューティング) など、非常に計算負荷の高いワークロードを仮想マシン (VM) で実行できます

特徴

GPU 共有

GPU 共有

GPU 共有 (分割使用) は、NVIDIA vGPU テクノロジでのみ可能です。複数の仮想マシンで GPU を共有し、GPU アクセラレーションを必要とする軽めのワークロードの使用率を最大化します。

GPU 集約

GPU 集約

GPU 集約により、VM から複数の GPU にアクセスできます。これはよく計算負荷の高いワークロードに必要となります。vCompute Server は、マルチ vGPU と P2P コンピューティングの両方に対応しています。マルチ vGPU では、GPU は直接接続されません。P2P では、 NVLink を介して帯域幅を広げます。

管理機能と監視機能

管理機能と監視機能

vComputeServer では、アプリレベル、ゲストレベル、ホストレベルでの監視をサポートしています。さらに、予防的管理機能では、vGPU 管理 SDK を通じて、ライブ マイグレーションの実行、中断と再開、およびユーザーの体験に影響を与える消費傾向を明らかにするしきい値を作成することができます。

NGC

NGC

NVIDIA GPU Cloud (NGC) は、GPU 最適化ソフトウェア用のハブであり、 ディープラーニング、機械学習、HPC のワークフローを簡素化します。また、NVIDIA vCompute Server で仮想化環境をサポートするようになりました。

P2P コンピューティング

P2P コンピューティング

NVIDIA® NVLinkは、高速な GPU-GPU の直接相互接続であり、帯域幅を広くし、リンク数を増やし、マルチ GPU システム設定のスケーラビリティを向上させます。現在は、NVIDIA 仮想 GPU (vGPU) テクノロジにより、仮想的にサポートされています。

ECC とページ リタイアメント

ECC とページ リタイアメント

エラー修正コード (ECC) とページ リタイアメントにより、データ破壊に敏感なアプリケーションの処理により高い信頼性をもたらします。GPU が非常に大きなデータセットを処理し、長期間にわたってアプリケーションを実行する大規模クラスターコンピューティング環境では、これらは特に重要です。

NVIDIA vComputeServer

推奨 GPU

  NVIDIA T4 NVIDIA V100 (SXM2)
RT コア 48 -
Tensor コア 320 640
CUDA® コア 2,560 5,120
メモリ 16 GB GDDR6 32 GB HBM2
FP 16/FP 32 (混合精度) 64 TFLOPS 125 TFLOPS
FP 32 (単精度) 8.1 TFLOPS 15.7 TFLOPS
FP 64 (倍精度) - 7.8 TFLOPS
NVLink: VM あたりの GPU の数 - 最大 8 基
ECC とページ リタイアメント
VM あたりのマルチ GPU 最大 16 基 最大 16 基

仮想化のパートナー

よく寄せられる質問

NVIDIA 仮想 GPU ソフトウェアの詳細を見る

製品リリース ノートと対応サードパーティ製ソフトウェア製品をご覧ください。.