NVIDIA T4

柔軟な設計、画期的なパフォーマンス

次のレベルの推論の高速化へ

私たちが競い合いながら目指しているのは、顧客とのやりとり、提供する商品やサービスといったあらゆるものに AI が携わり、よりよいものへ変えていく未来です。その未来を実現するには、最新 AI の汎用性を存分に活かせるコンピューティング プラットフォームが必要です。そうすれば企業が顧客の新しいエクスペリエンスをあらためて考え直し、顧客の要求を満たし (あるいは要求を超え)、AI をベースとする製品やサービスを経済的に拡大できるようになるのです。

NVIDIA® T4 GPU は、ハイ パフォーマンス コンピューティング、ディープラーニングのトレーニングと推論、機械学習、データ分析、グラフィックスなど、さまざまなクラウド ワークロードを加速します。新しい NVIDIA Turing™ アーキテクチャを基盤とし、エネルギー効率に優れた 70 ワットの小型 PCIe フォーム ファクターに収納された T4 は、スケールアウト コンピューティング環境向けに最適化されており、多精度の Turing Tensor コアと新しい RT コアを備えています。NGC のコンテナー化された高速ソフトウェア スタックと組み合わせることで、T4 は規模に応じた革新的なパフォーマンスを提供します。

画期的なパフォーマンス

T4 は、革新的な Turing Tensor コア テクノロジと多精度コンピューティングが採用されており、さまざまなワークロードに対応します。FP32 から FP16、INT8、さらには INT4 の精度に対応する画期的な性能を備えた T4 は、CPU の最大 40 倍のパフォーマンスを発揮します。

Breakthrough Inference Performance

リアルタイムで最先端の推論

対話型 AI、レコメンダー システム、画像検索などのサービスのユーザー エンゲージメントには応答性が重要です。モデルの精度と複雑さが増すにつれ、正解を即座に提供するには飛躍的に膨大な計算能力が必要になります。T4 は、40 倍に向上した低レイテンシ スループットにより、より少数の GPU 対応サーバーでより多くのリクエストにリアルタイムで対応できます。

T4 推論性能

Resnet50

DeepSpeech2

GNMT

ビデオコード変換パフォーマンス

オンラインのビデオの数が飛躍的に増えるにつれて、ビデオを効率的に検索し、知見を引き出すソリューションの需要も同様に増えています。T4 は、旧世代 GPU の 2 倍のデコーディング パフォーマンスを実現する専用のハードウェア コード変換エンジンを使用して AI ビデオ アプリケーションのために画期的なパフォーマンスを提供します。T4 は最大 38 のフル HD ビデオ ストリームをデコードできるため、スケーラブルなディープラーニングをこのビデオ パイプラインに容易に統合でき、革新的かつスマートなビデオ サービスを実現します。

NVIDIA T4 仕様

 

パフォーマンス

Turing Tensorコア
320

NVIDIA CUDA® コア
2,560

Single Precision Performance (FP32)
8.1 TFLOPS

混合精度 (FP16/FP32)
65 FP16 TFLOPS

INT8 精度
130 INT8 TOPS

INT4 精度
260 INT4 TOPS

 
 

パフォーマンス

Gen3
x16 PCIe

 
 

メモリ

容量
16 GB GDDR6

帯域幅
320+ GB/秒

 
 

電力

70 watts

 

NVIDIA AI 推論プラットフォーム

世界最先端の推論プラットフォームの詳細