NVIDIA Tesla P100、HPCアプリケーションのパフォーマンスを30倍以上に|NVIDIA

NVIDIA Tesla P100、HPCアプリケーションのパフォーマンスを30倍以上に

Pascalアーキテクチャを採用したTesla P100がデータセンターのスループットを大幅に向上

ドイツ・フランクフルト—ISC16—（2016年6月20日）－ NVIDIA（本社：米国カリフォルニア州サンタクララ、社長兼CEO：ジェンスン・フアン（Jen-Hsun Huang）、Nasdaq：NVDA）は本日、現代のデータセンターに対するかつてない計算処理上の需要に応えるため、PCIeサーバ対応NVIDIA® Tesla® P100 GPUアクセラレータを発表しました。このアクセラレータは、CPUベースのシステムに比べてパフォーマンスと効率の大幅な向上をもたらします。

スーパーコンピューティング・サイクルに対する需要がかつてないほど高まっています。アメリカ国立科学財団のデータによると、科学者の大半が自身の研究を行うのに十分な時間を、スーパーコンピューティング・システムに確保することができません¹。また、計算処理上の要求が高いディープラーニング・アプリケーションの処理速度を高めるため、高性能コンピューティング（HPC）テクノロジがますます必要とされる一方で、研究者は従来の科学分野の発展を促進するため、AI技術の応用を進めています。

PCIe対応Tesla P100 GPUアクセラレータは、NVIDIA Pascal™ GPUアーキテクチャの比類なきパフォーマンスと効率により、こうした計算処理上の需要に対応できます。CPUベースの汎用ノード32台分を超えるスループットを提供し、資本コストと運用コストを最大70%削減できる「スーパー・ノード」の実現を可能にします²。

NVIDIAのアクセラレーテッド・コンピューティング担当バイス・プレジデントであるイアン・バック（Ian Buck）は、次のように述べています。「HPCやAIによるスーパーコンピューティングに対する研究者の限りない需要に対応するうえで、進むべき唯一の道がアクセラレーテッド・コンピューティングです。このような需要への対応においてCPUのみのシステムを展開すると、大量の汎用計算ノードが必要になるため、コストが大幅に増加するわりに、それに見合ったパフォーマンスが得られないということになるでしょう。一方、より台数が少なく、より優れたTesla P100採用ノードによって劇的にパフォーマンスを高めることで、高額なインフラ・コストの代わりにコンピューティングへの投資を増やすことができます」

PCIe対応Tesla P100は、標準のPCIeフォーム・ファクタで提供され、現在のGPUアクセラレーテッド・サーバと互換性があります。計算処理上の要求が最も高いAIやHPCデータセンター・アプリケーションの処理速度を高めるために最適化されています。1台のTesla P100搭載サーバは、AMBER分子動力学コードの実行時にCPUのみのサーバ・ノード50台分よりも優れたパフォーマンスを実現し³、VASP材料科学アプリケーションの実行時にCPUのみのサーバ・ノード32台分よりも高速です⁴。

PCIe対応Tesla P100アクセラレータは、年内に、スイスのルガーノにあるスイス国立スーパーコンピューティング・センターの欧州最速スーパーコンピュータPiz Daintシステムのアップグレード・バージョンに採用される予定です。

チューリッヒ工科大学計算物理学教授兼スイス国立スーパーコンピューティング・センターのディレクタであるトーマス・シュルテス（Thomas Schulthess）氏は、次のように述べています。「Tesla P100アクセラレータは、現代の最も重要な計算処理上の課題のいくつかに対処する、新たなレベルのパフォーマンスと効率性をもたらします。Piz Daintの4,500台のGPUアクセラレーテッド・ノードをTesla P100 GPUにアップグレードすることで、システムのパフォーマンスが2倍以上になることが期待されています。その結果、研究者は、宇宙論、材料科学、地震学、気候学など、幅広い分野で大きな成果を達成できるようになるでしょう。」

PCIe対応Tesla P100は、NVIDIA Teslaアクセラレーテッド・コンピューティング・プラットフォームに新たに加わりました。主な機能は以下のとおりです。

さまざまなHPCワークロードに対応する比類なきアプリケーション・パフォーマンス - それぞれ4.7テラフロップスと9.3テラフロップスの倍精度および単精度ピーク・パフォーマンスを実現する、1台のPascalベースのTesla P100ノードが、CPUのみの汎用サーバ32台分以上と同等のパフォーマンスをもたらします。
HBM2搭載CoWoSがもたらす前例のない効率 - Tesla P100は、プロセッサとデータを単一のパッケージに統合することで、前例のない計算効率を実現します。メモリ設計への革新的アプローチであるHBM2を搭載したCoWoS（Chip on Wafer on Substrate）により、NVIDIA Maxwell™アーキテクチャに比べ、3倍のメモリ帯域幅のパフォーマンス（720GB/秒）を達成できます。
ページ移送エンジンによる並列プログラミングの簡素化 - 開発者は、データの動きを管理することに気をとられず、パフォーマンスの向上に向けたチューニングに集中できます。また、仮想メモリ・ページングのサポートにより、GPU物理メモリ・サイズを超えてアプリケーションを拡張できるようになります。さらに、統合メモリ・テクノロジによって、ノード全体に対して1つのメモリ領域を確認するだけでよくなり、大幅に生産性が高まります。
他に例を見ないアプリケーション・サポート - 410のGPUアクセラレーテッド・アプリケーション（トップ10のHPCアプリケーションのうち9つを含む）で利用されるTeslaプラットフォームは、世界をリードするHPCコンピューティング・プラットフォームです。

PCIe対応Tesla P100の仕様

NVIDIA GPU BOOST™テクノロジによる4.7テラフロップスの倍精度パフォーマンス、9.3テラフロップスの単精度パフォーマンス、18.7テラフロップスの半精度パフォーマンス
PCIe Gen 3インターコネクトのサポート（32GB/秒の双方向帯域幅）
ページ移送エンジンと統合メモリによって強化されたプログラマビリティ
ECC保護による信頼性の向上
データセンターの最高のスループットと信頼性を実現するためのサーバ最適化
2つの構成オプション:
- 16 GBのCoWoS HBM2スタックド・メモリで720 GB/秒のメモリ帯域幅を実現
- 12 GBのCoWoS HBM2スタックド・メモリで540 GB/秒のメモリ帯域幅を実現

提供開始

PCIeベース・システム用NVIDIA Tesla P100 GPUアクセラレータの提供は、2016年第4四半期に開始する予定です。販売は、NVIDIAのリセラー・パートナーおよびサーバ・メーカ各社（Cray、Dell、Hewlett Packard Enterprise、IBM、SGIなど）を通じて行います。

情報源: https://portal.xsede.org/#/gallery
CPU サーバ：Dual socket Intel E5-2680v3 12コア、128 GB DDR4毎ノード、 FDR IB / GPUサーバ: 8x Tesla P100 for PCIe with Dual Socket Intel E5-2680v3
SDSU Cometスーパーコンピュータにおけるシミュレーション
VASP 5.4.1_05Feb16, Si-Huge データセット. 16, 32 ノードは、4-8ノードと同じスケールにより推定しています。

NVIDIAについての最新情報:
公式ブログNVIDIA blog, Facebook, Google+, Twitter、LinkedIn、InstagramNVIDIAに関する動画YouTube、画像Flickr。

NVIDIAについて
1993年以来、NVIDIA（NASDAQ: NVDA）は、ビジュアル・コンピューティングという芸術的な科学の世界をリードしてきました。ゲーミング、自動車、データセンターおよびプロフェショナル・ビジュアリゼーションの分野で特化したプラットフォームを提供し続けています。NVIDIAの製品は仮想現実、人工知能、自律走行車の開発においても最新の技術を提供しています。詳しい情報は、//nvidianews.nvidia.com/をご覧ください。

____________________________________

本プレスリリースに記載されている、内容は予測とは大幅に異なる結果が生じるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティーに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、当社製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザの嗜好および需要の変化、業界標準やインターフェースの変更、システム統合時に当社製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form10-Qの2016年1月31日を末日とする四半期レポートなど、米証券取引委員会（SEC）に提出されているNVIDIAの報告書に適宜記載されます。SECへの提出書類は写しがNVIDIAのウェブサイトに掲載されており、NVIDIAから無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務をNVIDIAは一切負いません。

© 2016 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIAロゴ、GeForce、GPU Boost、NVIDIA Maxwell、NVIDIA Pascal、NVIDIA OptiX、NVIDIA VRWorksおよび、PhysXまたはその他の国におけるNVIDIA Corporationの商標あるいは登録商標です。その他の企業名および製品名は、それぞれ各社の商標である可能性があります。機能や価格、供給状況、仕様は、予告なく変更される場合があります。