NVIDIAの新しい Ampere データセンター GPU の生産が本格化

新しい NVIDIA A100 GPU により AI の学習と推論が最大 20 倍高速化、NVIDIA 初のエラスティックなマルチインスタンス GPU がデータアナリティクス、学習および推論を一元処理、世界の主要クラウドプロバイダーやサーバーメーカーが採用

2020 年 5 月 14 日、カリフォルニア州サンタクララ - GTC 2020 - NVIDIA は本日、NVIDIA^® Ampere アーキテクチャをベースとした初の GPU である NVIDIA A100 の生産が本格化され、全世界のお客様に出荷中であることを発表しました。

A100 は NVIDIA Ampere アーキテクチャの画期的なデザインを採用しており、NVIDIA の全 8 世代の GPU のなかで最大の性能向上を遂げています。A100 は AI の学習と推論を一元処理し、前世代に比べて最大 20 倍の性能向上を実現しています。汎用的なワークロードアクセラレーターである A100 は、データアナリティクスやサイエンティフィックコンピューティング、クラウドグラフィックスといった用途も想定して作られています。

NVIDIA の創業者/CEO であるジェンスンフアン (Jensen Huang) は、次のように述べています。「クラウドコンピューティングと AI の強力なトレンドは、データセンターの設計に構造的な転換をもたらしています。かつては CPU のみのサーバーで溢れていたものが、今では GPU アクセラレーテッドコンピューティングになっています。NVIDIA A100 GPUは AI 性能を 20 倍に飛躍させ、データアナリティクスから学習、推論まで、エンドツーエンドの機械学習を加速します。NVIDIA A100 はスループットを向上し、同時にデータセンターの費用削減を実現します。」

A100 に組み込まれている新しいエラスティックコンピューティングテクノロジにより、あらゆる処理に適切な規模の演算能力を提供できるようになります。マルチインスタンス GPU 機能により、各 A100 GPU を最大 7 つの独立したインスタンスに分割して推論タスクを処理できるようになり、さらに第 3 世代 NVIDIA NVLink^® インターコネクトテクノロジにより、複数の A100 GPU を単一の巨大な GPU として動作させることで、これまで以上に大規模な学習タスクに対応できるようにもなります。

世界の主要クラウドプロバイダーやシステムビルダーが、A100 GPU を自社の製品やサービスに採用する予定です。それらのなかには、Alibaba Cloud や Amazon Web Services (AWS)、Atos, Baidu Cloud、Cisco、Dell Technologies、富士通、GIGABYTE、Google Cloud、New H3C Information Technologies、Hewlett Packard Enterprise (HPE)、Inspur Electronic Information、Lenovo、Microsoft Azure、Oracle、Quanta/QCT、Supermicro、Tencent Cloud などが含まれています。

全世界で即座に採用
NVIDIA A100 GPU のパワーを採用する企業のなかには Microsoft も含まれており、同社は A100 の性能とスケーラビリティを活用する予定です。

Microsoft Corp. のコーポレートバイスプレジデントであるミハイルパラキン (Mikhail Parakhin) 氏は、次のように話しています。「Microsoft は、現行世代の NVIDIA GPU を積極的に活用して、世界最大の言語モデルである Turing Natural Language Generation を学習してきました。NVIDIA の新世代の A100 GPU を使用すれば、Azure ではるかに大規模な AI モデルを学習できるようになり、言語、音声、ビジョンおよびマルチモダリティの可能性がさらに押し広げられるでしょう。」

DoorDash はオンデマンドのフードプラットフォームを供給しており、パンデミックの最中での飲食業界のライフラインとなっています。同社は AI インフラストラクチャが柔軟性を持つことの重要性に注目しています。

DoorDash の機械学習エンジニアであるゲイリーレン (Gary Ren) 氏は、次のように話しています。「大量のデータを要求する今日の複雑な AI の学習や推論のワークロードは、モデルの学習時間の削減や、機械学習の開発プロセスのスピード向上などの点において、NVIDIA A100 GPU のような最先端のテクノロジから恩恵を受けることができます。さらに、クラウドベースの GPU クラスタを使用することで、必要に応じてスケールアップやスケールダウンが可能な柔軟性が生まれ、効率性の向上、運用の簡略化、そしてコストの削減などに貢献することが新たにわかりました。」

その他のアーリーアダプターには、国立研究所やいくつかの世界最高レベルの教育機関および研究機関が含まれており、それぞれが A100 を使って次世代スーパーコンピューターに利用しようとしています。それらの機関には、以下が含まれています。

米国のインディアナ大学では、HPE の Cray Shasta システムをベースにした Big Red 200 スーパーコンピューターによって、科学や医学の研究、ならびに人工知能、機械学習およびデータアナリティクスでの先進的な研究を支援しようとしています。
ドイツのユーリッヒスーパーコンピューティングセンターにある、Atos が構築した JUWELS ブースターシステムは、究極の演算能力と人工知能タスクのために設計されています。
ドイツのカールスルーエ工科大学では、Lenovo とともに HoreKa スーパーコンピューターを構築しており、材料科学、地球システム科学、エネルギーとモビリティの研究のための工学、素粒子と天体素粒子物理学の分野において、きわめて大規模な、マルチスケールシミュレーションを行おうとしています。
ドイツのマックスプランクコンピューティング/データ施設では、Lenovo が構築した次世代のスーパーコンピューターである Raven を活用して、マックスプランク研究所にハイパフォーマンスコンピューティングアプリケーションの開発、最適化、解析およびビジュアライゼーションのためのハイレベルなサポートを提供しています。
ローレンスバークレー国立研究所にある米国エネルギー省管轄国立エネルギー研究科学計算センターでは、HPE の Cray Shasta システムをベースにして、次世代スーパーコンピューターの Perlmutter を構築し、エクストリームスケール科学を支援し、新エネルギー源の開発、エネルギー効率の改善、ならびに新素材の発見などを目的としています。

A100 の 5 つのブレイクスルー
NVIDIA A100 GPU は、以下のような 5 つの主要なイノベーションにより、技術的デザインのブレイクスルーを実現しています：

NVIDIA Ampere アーキテクチャ — A100 の核となるのは、NVIDIA Ampere GPU アーキテクチャです。540 億以上のトランジスターで構成されており、世界で最もトランジスターの集積密度が高い 7 nm プロセスのプロセッサです。
TF32 に対応した第 3 世代 Tensor コア — 広く採用されているNVIDIA の Tensor コアが、より柔軟に、より速く、より使いやすくなっています。強化された機能のなかには、AI 向け TF32 が含まれています。これにより、コードを変更することなく FP32 の精度を維持しながら AI 性能を最大で 20 倍向上させることができます。また、Tensor コアが FP64 に対応し、前世代の HPC アプリケーションに比べて、演算能力が最大で 2.5 倍向上しています。
マルチインスタンス GPU (MIG) — 新しい技術的特徴である MIG により、単一の A100 GPU を最大 7 つの　GPU に分割することができます。これにより、規模の異なるさまざまな処理に合わせて演算能力を提供することができ、利用率が最適化され、投資効果を最大化できます。
第 3 世代 NVIDIA NVLink — 2 倍速くなった GPU 間の高速接続により、サーバー内で性能を効率的にスケーリングできます。
構造的疎性 — この新しい効率化技術は、AI 数学が本来持っているスパースな性質を利用して性能を倍増させます。

これらの新機能により、NVIDIA A100 は AI の学習と推論だけでなく、科学シミュレーション、会話型 AI、レコメンデーションシステム、ゲノミクス、ハイパフォーマンスデータアナリティクス、地震モデリングおよび金融予測といった、多様で要件の厳しいワークロードに最適な GPU です。

NVIDIA A100 が新たなシステムで利用可能になり、クラウドでの利用もまもなく可能に
本発表と共に発表された NVIDIA DGX A100™ システムには、NVIDIA NVLink で相互接続された 8 基の NVIDIA A100 GPU が搭載されています。このシステムは、NVIDIA および認定パートナーより間もなく提供が開始されます。

Alibaba Cloud、AWS、Baidu Cloud、Google Cloud、Microsoft Azure、Oracle および Tencent Cloud では、A100 を活用したサービスを計画しています。

また、A100 をベースにした多様なサーバーが、Atos やCisco、 Dell Technologies、富士通、GIGABYTE、New H3C Information Technologies、HPE、Inspur Electronic Information、Lenovo、Quanta/QCT、Supermicro といった、世界の大手システムメーカーより発売される予定です。

パートナーのサーバー開発を加速させるために、NVIDIA は複数の GPU 構成で統合されたベースボード形式のサーバービルディングブロックである HGX A100 を作成しました。

4 GPU の HGX A100 では、NVLink によってすべての GPU が相互接続され、8 GPU 構成では、NVIDIA NVSwitch™ を通じてすべての GPU が全帯域幅で接続されます。新しいマルチインスタンス GPU アーキテクチャを実装した HGX A100 は、それぞれが NVIDIA T4 より高速な56 個の小型 GPU という構成から、10 PFLOPS の AI 性能を持つ、巨大な 8 GPU サーバーにまでのあらゆる構成を組むことができます。

A100 向けの NVIDIA ソフトウェアの最適化
NVIDIA は、アプリケーション開発者が A100 のイノベーションを活用できるようにするために、ソフトウェアスタックのいくつかのアップデートも発表しました。このアップデートには、グラフィックス、シミュレーションおよび AI を高速化するために使用される 50 以上の CUDA-X™ ライブラリ、CUDA 11、マルチモーダルな対話型 AI サービスのフレームワークであるNVIDIA Jarvis、ディープラーニングレコメンデーションアプリケーションフレームワークの NVIDIA Merlin、ならびに HPC 開発者が A100 用のコードのデバッグおよび最適化を行うためのコンパイラ、ライブラリおよびツールで構成された NVIDIA HPC SDK の新バージョンが含まれています。

※NVIDIA Jarvis の名称は 2021 年 7 月に NVIDIA Riva に変更されました。

NVIDIA について
1999 年における NVIDIA (NASDAQ 表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューターグラフィックスを再定義し、並列コンピューティングに革命的変化を起こしました。最近では、GPU ディープラーニングが最新の AI (次世代コンピューティング) に火をつけ、世界を知覚し理解することができるコンピューター、ロボット、自律走行車の脳として GPU は機能しています。詳細は、こちらのリンクから: www.nvidia.com/ja-jp/

NVIDIA A100、NVIDIA Ampere GPU アーキテクチャ、NVIDIA NVLink インターコネクトテクノロジ、TF32 対応の Tensor コア、マルチインスタンス GPU、構造的疎性、NVIDIA DGX A100 システム、HGX A100および A100 対応の NVIDIA ソフトウェアの最適化を含む NVIDIA の製品およびテクノロジの利益、性能、機能および可用性、NVIDIA がデータセンターの構造的な変化を主導すること、NVIDIA A100 GPU ならびに Kubernetes と融合した Mellanox 高速ネットワーキングの影響、クラウドサービスプロバイダーやシステムビルダーが A100 GPU を自社の製品やサービスに採用する予定となっていること、NVIDIA A100 GPU を使用して Microsoft が計画していること、および、国立の研究所や世界最高レベルの教育機関および調査機関が A100 の性能を活用して次世代のスーパーコンピューターを計画していることおよびそれに関連する影響など、本プレスリリースにおける一定の記載は将来の見通しに関する記述であり、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、当社製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に当社製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

© 2020 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIA のロゴ、CUDA-X、DGX A100、NVLink、NVSwitch および TensorRT は、米国およびその他の国における NVIDIA Corporation の商標または登録商標です。その他の会社名および製品名は、それぞれの所有企業の商標または登録商標である可能性があります。機能、価格、可用性、および仕様は予告なしに変更されることがあります。