生成 AI アプリケーションは、ニューラル ネットワークを使用して既存のデータ内のパターンや構造を識別し、画像、音声、アニメーション、3D モデルなど、さまざまな入力と出力から新しいオリジナルのコンテンツを生成できます。NVIDIA の生成 AI ソリューション、NeMo™ フレームワーク (NVIDIA AI Enterprise に付属) を A800 40GB Active GPU と共に活用すると、カスタマイズ可能な生成 AI モデルを短期間で簡単に開発できます。
NVIDIA Ampere アーキテクチャを採用した NVIDIA® A800 40GB Active GPU は、NVIDIA AI Enterprise ソフトウェアを搭載する究極のワークステーション開発プラットフォームです。次世代のデータサイエンス、AI、HPC、エンジニアリング シミュレーションまたは CAE のワークロードを高速化する強力なパフォーマンスを提供します。
9.7 TFLOPS¹
1,247 AI TOPS²
1.5 TB/秒
1 ピーク レートは GPU ブースト クロックに基づきます。2 スパース行列を使用した理論上の INT8 TOPS。
NVIDIA A800 40GB Active GPU は驚異的なパフォーマンスを提供し、AI トレーニングと推論から複雑なエンジニアリング シミュレーション、モデリング、データ分析まで、計算負荷が非常に高いワークステーション プラットフォームのワークフローに対応します。前世代の 2 倍以上のパフォーマンスを誇る A800 40GB Active は、計算負荷の高いさまざまなワークロードを見事にサポートします。
ResNet-50 V1.5 トレーニング。 バッチサイズ = 256、精度 = 混合。
BERT 大規模事前トレーニング フェーズ 2 バッチサイズ = 8、精度 = Mixed。
GTC バージョン 4.5、TAE、精度 = FP32。
LAMMPS patch_8Feb2023、Atomic Fluid Lennard-Jones 2.5 (カットオフ)、精度 = FP64。
ResNet-50 V1.5 推論。バッチサイズ = 128、精度 = 混合。
BERT 大規模推論。バッチサイズ = 128、精度 = INT8。
A800 40GB Active GPU、Quadro GV100 GPU、Intel Xeon Gold 6126 プロセッサーを使用したパフォーマンス テスト。
スーパーコンピューターの性能をデスクトップで実現する NVIDIA RTX™ 搭載の AI ワークステーションにより、データセンターのリソース需要を軽減します。最新の NVIDIA RTX GPU と NVIDIA AI Enterprise ソフトウェアを搭載したワークステーション プラットフォームは、次世代の AI 拡張アプリケーションとモデルの構築、トレーニング、展開に適した強力な AI パフォーマンスを提供します。
GPU メモリ | 40GB HBM2 |
メモリ インタフェース | 5,120 ビット |
メモリ帯域幅 | 1,555.2 GB/秒 |
CUDA コア | 6,912 |
Tensor コア | 432 |
倍精度演算性能 | 9.7 TFLOPS |
単精度演算性能 | 19.5TFLOPS |
ピーク Tensor 性能 | 1,247 AI TOPS | 623.8 TFLOPS |
マルチインスタンス GPU | 最大 7 つの MIG インスタンス @ 5GB |
NVIDIA NVLink | 対応 |
NVLink 帯域幅 | 400GB/秒 |
グラフィックス バス | PCIe4.0×16 |
最大消費電力 | 240 W |
サーマル | アクティブ |
フォーム ファクター | 4.4” H x 10.5” L デュアル スロット |
ディスプレイ機能* | - |
*A800 40GB Active にはディスプレイ ポートが装備されていません。ディスプレイ出力機能をサポートするには、NVIDIA RTX 4000 Ada 世代、NVIDIA RTX A4000、または NVIDIA T1000 GPU のいずれかが必要です。 |