This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

ユーザーエンゲージメントの強化を促進

ディープラーニング推論ワークロードにおけるスループットと応答性を向上させます

AI には、爆発的に増加し続けるデータに対応しながら、応答の速さを維持することが求められています。世界最速で最も効率的なデータセンター推論プラットフォームの NVIDIA TensorRT^™,が動作する NVIDIA^®Tesla^® GPU の力でさらなる壁を乗り越えましょう。Tesla はディープラーニングのあらゆるワークロードに対処し、最速のスループット、最高の効率性、最高の柔軟性を組み合わせた最適な推論ソリューションで AI に力を与えます。TensorRT は、Tesla GPU のパフォーマンスを解放し、ビデオストリーミング、音声認識、レコメンダーシステムなど、様々なアプリケーションをホストする NVIDIA DeepStream SDK および NVIDIA 推論サーバー製品の基礎を提供します。

技術的推論の概要をダウンロード

推論インフォグラフィックをダウンロード

PLASTER ホワイトペーパーをダウンロード

TensorRT の概要ビデオを見る

NVIDIA データセンター推論プラットフォーム

TESLA T4

NVIDIA® T4 GPU は、ハイパフォーマンスコンピューティング、ディープラーニングのトレーニングと推論、機械学習、データ分析、グラフィックスなど、さまざまなクラウドワークロードを加速します。NVIDIA の新しい Turing™ アーキテクチャを基盤とし、エネルギー効率に優れた 70 ワットの小型 PCIe フォームファクターに収納された T4 は、スケールアウトサーバーのスケールアウトコンピューティング環境向けに最適化されています。さらに、多精度の Turing Tensor コアと新しい RT コアを備え、NVIDIA GPU Cloud のコンテナー化された高速ソフトウェアスタックと組み合わせることで、T4 は規模に応じた革新的パフォーマンスを提供します。

deep-learning-ai-inference-platform-t4-background-2560-ud

TESLA T4

TESLA V100
汎用データセンター向け

Tesla V100 は GPU あたり 125 テラフロップスという推論性能を備えています。8 個の Tesla V100 を備えた 1 台のサーバーで 1 ペタフロップスの性能を発揮します。

Tesla V100 データシート PDF

TESLA P4
超高効率スケールアウトサーバー向け

Tesla P4 はスケールアウトサーバーを高速化し、CPU の 60 倍という驚異的なエネルギー効率性を提供します。

Tesla P4 データシート PDF

TESLA P40
推論スループットサーバー向け

Tesla P40 は優れた推論性能、INT8 精度、24GB の内蔵メモリで驚異的な能力を発揮します。

Tesla P40 データシート PDF

NVIDIA データセンターコンピューティングソフトウェア

NVIDIA TensorRT

NVIDIA TensorRT は高パフォーマンスのニューラルネットワーク推論アクセラレータで、レコメンダー、音声認識、機械翻訳などのアプリケーションを、CPU と比較して 100 倍加速することができます。TensorRT により、開発者はニューラルネットワークモデルの最適化、高レベルな精度向上、エンタープライズおよびハイパースケールデータセンターの実稼働環境でのモデル展開が可能になります。

DeepStream SDK

Tesla 用 NVIDIA DeepStream は、ディープラーニングをベースとしたスケーラブルなインテリジェントビデオ分析 (IVA) アプリケーション向け SDK で、スマートシティやハイパースケールデータセンターで利用可能です。また、推論用 NVIDIA TensorRT、コード変換用 Video Codec SDK、事前処理機能、データキュレーション API も利用可能で、Tesla GPU の性能を活用することができます。例えば、Tesla P4 GPU では、最大 30 個の HD ビデオストリームのデコードと分析をリアルタイムで同時に行うことができます。

NVIDIA 推論サーバー

NVIDIA 推論サーバーにより、GPU を活用した推論を Kubernetes に導入できます。これはコンテナー化された推論マイクロサービスで、アプリケーションがデータセンターの生産で AI モデルを使用することができるようになります。GPU 使用率を最大化する設計で、一般的な AI モデルやフレームワークをサポートしており、DevOps アーキテクチャへのシームレスな統合が可能です。

NVIDIA GPU 使用の Kubernetes

NVIDIA GPU 使用の Kubernetes により、企業はトレーニングと推論展開をマルチクラウドの GPU クラスターへシームレスに拡大できます。Kubernetes を利用することで、GPU を活用したディープラーニングや HPC (ハイパフォーマンスコンピューティング) アプリケーションをマルチクラウド GPU クラスターに簡単に展開できます。

特長と利点

50 倍のスループットにより、増加するワークロードに対応

NVIDIA Volta^™ を採用した Tesla V100 GPU により、データセンターは劇的に増加したスループットでディープラーニングのワークロードに対応し、大量に押し寄せるデータから情報を抽出できます。Tesla V100 を 1 つ備えたサーバーは、ディープラーニングの推論作業負荷において、CPU だけのサーバー 50 台に匹敵するため、低い購入コストでスループットを劇的に向上させることができます。

低電力スケールアウトサーバーのかつてない効率性

極めて効率性の高い Tesla P4 GPU は、そのスモールフォームファクターと 50/75 ワット (W) の電力設計で、高密度に最適化されたスケールアウトサーバーを高速化します。CPU と比較して 52 倍という驚異的なエネルギー効率性でディープラーニングの推論ワークロードに対応します。お客様は既存のインフラストラクチャで機能を拡張し、AI ベースのアプリケーションに対する需要の増加に対応できます。

新しい AI ベースのビデオサービス向けの専用デコードエンジン

Tesla P4 GPU は最大 39 件の HD ビデオストリームをリアルタイムで分析できます。専用のハードウェアで加速するデコードエンジンを備え、NVIDIA CUDA^® コアと並列実行され、推論します。ディープラーニングをパイプラインに統合することにより、お客様はビデオ検索やその他のビデオ関連サービスを促進するスマートで革新的な新しいレベルの機能を提供できます。

NVIDIA TensorRT と DeepStream SDK による高速展開

NVIDIA TensorRT は、高性能のニューラルネットワーク推論アクセラレータで、レコメンダーシステム、音声認識、機械翻訳などのディープラーニングアプリケーションの本稼働展開が可能です。TensorRT により、32 ビットまたは 16 ビットデータでトレーニング済みのニューラルネットを、Tesla P4 の低精度 INT8 演算や Tesla V100 の FP16 向けに最適化できます。 NVIDIA DeepStream SDK は Tesla GPU の性能を利用し、ビデオストリームのデコードと分析を同時に行います。

GPU 使用率を最大化し、一般的なフレームワークすべてをサポートする推論サーバー

NVIDIA 推論サーバーで、現在のソリューションの性能改善が簡単になり、GPU を最大限活用することができます。NVIDIA 推論サーバーは、すぐに利用可能なコンテナーで提供されるマイクロサービスです。TensorFlow、MXNet、Caffe2、MATLAB、NVIDIA TensorRT、ONNX 規格をサポートするフレームワークのどのモデルの組み合わせにも対応する、シンプルな REST (Representational State Transfer) API 経由で推論を実行できます。

パフォーマンス仕様

	Tesla T4: 世界最先端レベルの推論アクセラレータ	Tesla V100: 汎用性を備えたデータセンター GPU	Tesla P4:超高効率スケールアウトサーバー向け	Tesla P40:推論スループットサーバー向け
単精度演算性能 (FP32)	8.1 テラフロップス	14 テラフロップス (PCIe) 15.7 テラフロップス (SXM2)	5.5 テラフロップス	12 テラフロップス
半精度演算性能 (FP16)	65 FP16 テラフロップス	112 テラフロップス (PCIe) 125 テラフロップス (SXM2)	—	—
整数演算 (INT8)	130 INT8 TOPS	—	22 TOPS*	47 TOPS*
GPU メモリ	16GB	16 GB HBM2	8 GB	24 GB
メモリ帯域幅	320GB/s	900 GB/s	192 GB/s	346 GB/s
システムインターフェイス/フォームファクター	ロープロファイル PCI Express フォームファクター	デュアルスロット、フルハイト PCI Express フォームファクター SXM2/NVLink	ロープロファイル PCI Express フォームファクター	デュアルスロット、フルハイト PCI Express フォームファクター
電力	75 W	250 W (PCIe) 300 W (SXM2)	50 W/75 W	250 W
ハードウェアアクセラレーションを使用したビデオエンジン	1x デコードエンジン、2x エンコードエンジン	—	1x デコードエンジン、2x エンコードエンジン	1x デコードエンジン、2x エンコードエンジン

*ブーストクロック有効時の Tera-Operations per Second

お客様の事例

音声認識

TensorRT ソフトウェアを実行する NVIDIA Tesla GPU の精度を維持しつつ、音声認識アプリの反応時間を短縮します。

ブログを読む

画像およびビデオ処理

NVIDIA DeepStream SDK と Tesla GPU により、画像とビデオのワークロードでスループットの効率性を最大化します。

ブログを読む

レコメンダーシステム

NVIDIA GPU プラットフォームで動作する、ディープラーニングをベースにしたニューラル併用フィルタリングアプリで、レコメンダーの予測精度を向上します。

ブログを読む

他の成功事例を読む

あなたのディープラーニング推論ソリューションを今すぐ最適化

ディープラーニング推論向け Tesla V100、T4、P40 発売中。

ご購入はこちら

ユーザー エンゲージメントの強化を促進

ディープラーニング推論ワークロードにおけるスループットと応答性を向上させます

NVIDIA データ センター推論プラットフォーム

TESLA T4

TESLA T4

TESLA V100汎用データ センター向け

TESLA P4超高効率スケールアウト サーバー向け

TESLA P40推論スループット サーバー向け

NVIDIA データ センター コンピューティング ソフトウェア

NVIDIA TensorRT

DeepStream SDK

NVIDIA 推論サーバー

NVIDIA GPU 使用の Kubernetes

特長と利点

50 倍のスループットにより、増加するワークロードに対応

低電力スケールアウト サーバーのかつてない効率性

新しい AI ベースのビデオ サービス向けの専用デコード エンジン

NVIDIA TensorRT と DeepStream SDK による高速展開

GPU 使用率を最大化し、一般的なフレームワークすべてをサポートする推論サーバー

パフォーマンス仕様

お客様の事例

音声認識

画像およびビデオ処理

レコメンダー システム

あなたのディープラーニング推論ソリューションを今すぐ最適化

ユーザーエンゲージメントの強化を促進

NVIDIA データセンター推論プラットフォーム

TESLA V100
汎用データセンター向け

TESLA P4
超高効率スケールアウトサーバー向け

TESLA P40
推論スループットサーバー向け

NVIDIA データセンターコンピューティングソフトウェア

低電力スケールアウトサーバーのかつてない効率性

新しい AI ベースのビデオサービス向けの専用デコードエンジン

レコメンダーシステム