NVIDIA、大規模言語 AI モデルを全世界の企業にもたらす

NVIDIA NeMo Megatron フレームワーク、カスタマイズ可能な Megatron 530B 大規模言語モデル、マルチ GPU とマルチノードに対応した Triton Inference Server が、産業と科学を進歩させる言語ベース AI の開発と導入を推進

2021 年 11 月 9 日、カリフォルニア州サンタクララ — GTC — NVIDIA は本日、全世界の企業が大規模言語モデル（LLM）を開発および導入し、自社の領域に焦点を当てたチャットボット、パーソナルアシスタント、ならびに微妙な表現やニュアンスを前例のないレベルで理解できる AI アプリケーションを構築できるようにすることを発表しました。

NVIDIA は、数兆のパラメータを持つ言語モデルをトレーニングするためのNVIDIA NeMo Megatron フレームワーク、新しい領域や言語に合わせたトレーニングができるカスタマイズ可能な LLM である Megatron 530B、およびマルチ GPU かつマルチノードの分散推論機能を備えた NVIDIA Triton Inference Server™ を公開しました。

NVIDIA DGX™ システムと組み合わせることにより、これらのツールは大規模言語モデルの開発と導入を簡素化する、プロダクションレディなエンタープライズグレードのソリューションとなります。

NVIDIA のディープラーニング応用研究担当バイスプレジデントのブライアンカタンザーロ (Bryan Catanzaro) は、次のように述べています。「大規模言語モデルは柔軟で、高い能力を持っており、専門的な質問への回答、言語の翻訳、文書の把握と要約、ストーリーの執筆やコンピュータープログラムの生成といったことをすべて、特殊なトレーニングや教師なしでできることが証明されています。新しい言語および分野のための大規模言語モデルの構築は、最大級のスーパーコンピューティングアプリケーションと言えますが、現在では、これを実現するための性能を世界中の企業が手に入れられるようになっています」

NVIDIA NeMo Megatron と Megatron 530B による LLM 開発のスピードアップ
NVIDIA NeMo Megatron は、大規模なトランスフォーマー言語モデルのトレーニングを効率的に行うことを研究している NVIDIA の研究者が主導する、オープンソースのプロジェクトである NVIDIA Megatron から発展したものです。現在、Megatron 530B は世界最大のカスタマイズ可能な言語モデルとなっています。

NeMo Megatron フレームワークにより、企業は高度な自然言語処理モデルをトレーニングするという課題に対処できるようになります。NeMo Megatron フレームワークは、NVIDIA DGX SuperPOD™ の大規模なアクセラレーテッドコンピューティングインフラストラクチャ全体にわたって拡張できるように最適化されています。

NeMo Megatron フレームワークは、データの取り込み、選別、整理および整備を行うデータ処理ライブラリを通じて、複雑な LLM トレーニングを自動化します。また、データ、テンソルおよびパイプラインの並列化を行う先進テクノロジにより、大規模言語モデルのトレーニングを数千の GPU に効率的に分散させることができます。
企業は、NeMo Megatron フレームワークにより、新しい領域および言語に対応できるように、これをさらにトレーニングすることができます。

NVIDIA Triton Inference Server が、リアルタイムの LLM 推論を推進
本日別途発表された、最新の NVIDIA Triton Inference Serverのマルチ GPU、マルチノード機能により、複数の GPU およびノード間で LLM の推論ワークロードを拡張し、リアルタイムパフォーマンスを実現することができます。モデルは、単一の GPUや複数の GPU を搭載したサーバーでは利用できないほどのメモリが必要であり、推論はアプリケーションで利用するために迅速に処理されなければなりません。

Triton Inference Server により、Megatron 530B を 2 台の NVIDIA DGX システムで実行できるようになり、CPU サーバーでは 1 分以上かかる処理時間が 0.5 秒に短縮され、リアルタイムアプリケーション向けに LLM を導入することが可能となります。

世界中の企業が、カスタマイズされた大規模言語モデルを開発
NVIDIA DGX SuperPOD によって大規模言語モデルを構築しようとしているアーリーアダプターには、SiDi や JD Explore Academy、VinBrain などがあります。

ブラジル最大の AI 研究開発機関である SiDi は、同国の 2 億人のブラジルポルトガル語話者が使用できるようにするために、Samsung の仮想アシスタントを導入しています。

SiDi の CEO であるジョンイ (John Yi) 氏は、次のように話しています。「SiDi のチームは、AI 仮想アシスタントとチャットボットの開発に対して幅広い経験があります。これらの開発には、人間の言語のニュアンスが変化したときに対応および順応できるようにトレーニングされた、強力な AI 性能と専門的なソフトウェアが必要です。NVIDIA DGX SuperPOD は、当社のチームの先進的な取り組みに理想的であり、世界トップクラスの AI サービスをブラジルのポルトガル語話者に提供できるようになります」

大手サプライチェーン向けのテクノロジおよびサービスのプロバイダーである、JD.com の研究開発部門である JD Explore Academy は、NVIDIA DGX SuperPOD を活用して、スマートな顧客向けサービス、スマートリテール、スマートロジスティクス、IoT、ヘルスケアなどで使える NLP の開発を行っています。

ベトナムのヘルスケア向け AI の企業であるVinBrain は、DGX SuperPOD を使って、100 の病院の放射線科医と遠隔医療のための診断用言語モデルの開発と展開を行っており、このモデルは600 人以上の医療従事者が使用しています。

発売予定
企業は、本日別途発表されたNVIDIA LaunchPadを活用することで、キュレーテッドラボを通じて大規模言語モデルの開発と展開を無料で体験することができます。

また、大規模言語モデルをトレーニングする、NVIDIA NeMo Megatron アクセラレーテッドフレームワークのアーリーアクセスプログラムへの参加申請を行うことができます。

NVIDIA Triton は、フレームワーク、ツールキット、トレーニング済みモデルおよび Jupyter Notebook を含む、 GPU 最適化済み AI ソフトウェアのハブである NVIDIA NGC™ カタログより入手可能であり、オープンソースコードは Triton GitHub リポジトリより入手いただけます。

Tritonは、NVIDIAによって最適化、認証、サポートされているNVIDIA AI Enterpriseソフトウェアスイートにも含まれています。企業は、このソフトウェアスイートを使用して、オンプレミスのデータセンターやプライベートクラウドの主要なアクセラレーションサーバー上で言語モデルの推論処理を行うことができます。

NVIDIA DGX SuperPOD および NVIDIA DGX システムは、全世界の NVIDIA パートナーを通じて入手可能で、価格は要件を満たすお客様のご要望に応じて、これらパートナーから提示されます。

11 月 11 日までオンラインで開催される NVIDIA GTC に無料登録いただくことで、詳細を学ぶことができます。NVIDIA の創業者/CEO であるジェンスンフアンの基調講演は 11 月 9 日にストリーミングされ、リプレイでも視聴可能です。

NVIDIA について
1999 年における NVIDIA (NASDAQ表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューターグラフィックス、ハイパフォーマンスコンピューティング、そして人工知能 (AI) を再定義しました。NVIDIA のアクセラレーテッドコンピューティングと AI における先駆的な取り組みは、輸送、ヘルスケア、製造業などの数兆ドル規模の産業を再構築し、その他のさまざまな産業の拡大も加速させています。 https://nvidianews.nvidia.com/

NVIDIA MeMo Megatronフレームワークや NVIDIA Triton Inference Server、NVIDIA DGX SuperPODやNVIDIA DGX システムを含む NVIDIA の製品およびサービスの便益、影響、機能や性能、発売予定、新しい言語および分野のための大規模言語モデルの構築は、最大級のスーパーコンピューティングアプリケーションであること、そして現在はこれらの性能を世界中の企業が手に入れられるようになっていることなど、本プレスリリースにおける一定の記載は将来の見通しに関する記述であり、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、NVIDIA製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に NVIDIA 製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

© 2021 NVIDIA Corporation.All rights reserved. NVIDIA、NVIDIA ロゴ、DGX、NGC、NVIDIA DGX SuperPOD、および NVIDIA Triton Inference Server は米国およびその他の国々の NVIDIA Corporation (エヌビディアコーポレーション) の商標かつ/あるいは登録商標です。その他のすべての商標および登録商標はそれぞれの所有者に帰属します。機能、価格、供給、仕様は予告なく変更されることがあります。