NVIDIA A800 40GB Active グラフィックスカード

AI、データサイエンス、HPC 向けの究極のワークステーション開発プラットフォーム。

ご購入はこちら

NVIDIA のデザインおよびビジュアライゼーションのパートナーを探す。

ワークステーションのためのスーパーコンピューティングプラットフォーム

NVIDIA Ampere アーキテクチャを採用した NVIDIA® A800 40GB Active GPU は、NVIDIA AI Enterprise ソフトウェアを搭載する究極のワークステーション開発プラットフォームです。次世代のデータサイエンス、AI、HPC、エンジニアリングシミュレーションまたは CAE のワークロードを高速化する強力なパフォーマンスを提供します。

NVIDIA A800 40GB Active を利用開始する

ディスプレイ表示用にコンパニオン GPU を使用して、NVIDIA A800 40GB Active をセットアップし、NVIDIA AI Enterprise ライセンスをアクティブ化する方法をご紹介します。

動画を見る

ハイライト

業界をリードするパフォーマンス

倍精度演算 (FP64) 性能

9.7 TFLOPS¹

Tensor パフォーマンス

1,247 AI TOPS²

メモリ帯域幅

1.5 TB/秒

¹ ピークレートは GPU ブーストクロックに基づきます。² スパース行列を使用した理論上の INT8 TOPS。

特徴

NVIDIA Ampere アーキテクチャのパワー

第 3 世代 Tensor コア

倍精度 (FP64) と Tensor Float 32 (TF32) 精度をサポートし、さまざまな AI アプリケーションや HPC アプリケーションに対応するパフォーマンスと汎用性により、前世代と比較してパフォーマンスと効率が最大 2 倍向上し、RTX 搭載の AI ワークステーション上で迅速なモデルのトレーニングと推論を直接実行できます。ハードウェアは構造化されたスパースネットワークをサポートしているため、推論のスループットが倍増します。

マルチインスタンス GPU

高帯域幅メモリ、キャッシュ、コンピューティングコアを専用で搭載し、ハードウェアレベルで完全に分離された安全なマルチテナント性を実現します。マルチインスタンス GPU (MIG) により GPU アクセラレーテッドインフラストラクチャを最大限に活用します。A800 40GB Active GPU を最大 7 つの独立インスタンスに分割し、複数のユーザーが GPU アクセラレーションにアクセスできるようになります。

第 3 世代 NVIDIA NVLink

GPU 間の相互接続帯域幅の増加により、単一のスケーラブルなメモリを提供し、計算処理のワークロードを高速化して、より大規模なデータセットへの対応が可能になります。NVIDIA NVLink® を使用して NVIDIA A800 40GB Active GPU を 2 台で接続すると、最大 400 GB/秒 (双方向) の GPU 間データ転送を可能にすることで、有効なメモリのフットプリントが 80 GB に増加し、アプリケーションのパフォーマンスが向上します。

超高速 HBM2 メモリ

40GB の高速 HBM2 メモリと、クラス最高の 1.5 TB/秒のメモリ帯域幅で膨大な計算スループットを実現します。これは前世代と比較して 70% 以上の増加となります。また、40MB のレベル 2 キャッシュなど、オンチップメモリも大幅に増強されたため、計算負荷が非常に高い AI および HPC ワークロードを高速化します。

NVIDIA Ampere GPU アーキテクチャの詳細を見る

ワークロード

さまざまな業界で AI と HPC のワークフローをスーパーチャージ

生成 AI

生成 AI アプリケーションは、ニューラルネットワークを使用して既存のデータ内のパターンや構造を識別し、画像、音声、アニメーション、3D モデルなど、さまざまな入力と出力から新しいオリジナルのコンテンツを生成できます。NVIDIA の生成 AI ソリューション、NeMo™ フレームワーク (NVIDIA AI Enterprise に付属) を A800 40GB Active GPU と共に活用すると、カスタマイズ可能な生成 AI モデルを短期間で簡単に開発できます。

AI ワークステーションのソリューション概要を読む

エンジニアリングシミュレーション /CAE

A800 40GB Active GPU は、GPU 対応の CAE (コンピューター支援エンジニアリング) アプリケーションに優れたパフォーマンスを提供します。エンジニアリングアナリストと CAE スペシャリストは、大規模シミュレーションやエンジニアリング分析のコードを完全 FP64 の精度と驚異的なスピードで実行し、開発期間と価値創出までの期間を短縮できます。

RTX 対応 GPU を追加すると、前処理と後処理のための表示機能が提供され、デザイナーとエンジニアは大規模なシミュレーションとモデルを、デザイン全般において高い忠実度で映像化できます。

エンジンのシミュレーション画像 — Image credit: Dassault Systèmes

データサイエンスとデータ分析

強力なパフォーマンスでエンドツーエンドのデータサイエンスおよび分析ワークフローを高速化し、大規模データセットから意味ある洞察を短時間で抽出します。A800 40GB Active のハイパフォーマンスコンピューティング機能と NVIDIA AI Enterprise を組み合わせることで、データ実務担当者は、ライブラリ、ツール、テクノロジからなる大規模なコレクションを活用し、データの準備と分析からモデリングまで、データサイエンスのワークフローを高速化します。

AI トレーニングと推論

データセンターとクラウドベースのコンピューティングリソースをオフロードし、ローカルの AI トレーニングと推論のワークロード向けに、スーパーコンピューティングのパフォーマンスをデスクトップにもたらします。4 基の A800 40GB Active GPU を搭載したパワフルなワークステーションが、2.5 ペタフロップを超える AI コンピューティングパフォーマンスと 160GB の HBM2 メモリを提供します。

AI トレーニングのソリューション概要を読む

AI 推論のソリューション概要を読む

AI プラットフォーム

NVIDIA AI Enterprise の本番稼働対応 AI

すぐに使える AI 開発

NVIDIA A800 40GB Active GPU には、本番環境対応の生成 AI、コンピュータービジョン、スピーチ AI などを迅速に開発および展開するためのエンドツーエンドのエンタープライズソフトウェアプラットフォームである NVIDIA AI Enterprise の 3 年間のサブスクリプションが付属しています。ソフトウェアのアクティベーションが必要です。

データパイプラインの高速化

NVIDIA AI Enterprise には、インサイトを得るまでの時間を短縮する、データサイエンスのライブラリとツールが含まれています。組織は NVIDIA RAPIDS™ を使用して、エンドツーエンドのデータサイエンスパイプラインを最大 50 倍高速化できます。

AI トレーニングと推論

NVIDIA AI Enterprise は、データの準備やモデルのトレーニングから大規模な推論およびデプロイまで、AI 導入のあらゆる段階を高速化します。

NVIDIA TAO で学習済みモデルにアクセス
NVIDIA® TensorRT で推論向けに最適化
NVIDIA Triton™ Inference Server で大規模のデプロイを実現

NVIDIA AI Enterprise の詳細を見る

パフォーマンス

計算負荷の高い AI と HPC のワークロードに対処する

NVIDIA A800 40GB Active GPU は驚異的なパフォーマンスを提供し、AI トレーニングと推論から複雑なエンジニアリングシミュレーション、モデリング、データ分析まで、計算負荷が非常に高いワークステーションプラットフォームのワークフローに対応します。前世代の 2 倍以上のパフォーマンスを誇る A800 40GB Active は、計算負荷の高いさまざまなワークロードを見事にサポートします。

AI トレーニング - ResNet-50 V1.5

ResNet-50 V1.5 トレーニング。バッチサイズ = 256、精度 = 混合。

AI トレーニング - BERT - 大規模

BERT 大規模事前トレーニングフェーズ 2 バッチサイズ = 8、精度 = Mixed。

HPC - GTC

GTC バージョン 4.5、TAE、精度 = FP32。

HPC - LAMMPS

LAMMPS patch_8Feb2023、Atomic Fluid Lennard-Jones 2.5 (カットオフ)、精度 = FP64。

AI 推論 - ResNet-50 V1.5

ResNet-50 V1.5 推論。バッチサイズ = 128、精度 = 混合。

AI 推論 - BERT - 大規模

BERT 大規模推論。バッチサイズ = 128、精度 = INT8。

A800 40GB Active GPU、Quadro GV100 GPU、Intel Xeon Gold 6126 プロセッサーを使用したパフォーマンステスト。

デスクトップワークステーションのスーパーコンピューティングパフォーマンス

スーパーコンピューターの性能をデスクトップで実現する NVIDIA RTX™ 搭載の AI ワークステーションにより、データセンターのリソース需要を軽減します。最新の NVIDIA RTX GPU と NVIDIA AI Enterprise ソフトウェアを搭載したワークステーションプラットフォームは、次世代の AI 拡張アプリケーションとモデルの構築、トレーニング、展開に適した強力な AI パフォーマンスを提供します。

NVIDIA RTX 搭載のワークステーションの詳細を見る

仕様