This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA T4

柔軟な設計、画期的なパフォーマンス

次のレベルの推論の高速化へ

私たちが競い合いながら目指しているのは、顧客とのやりとり、提供する商品やサービスといったあらゆるものに AI が携わり、よりよいものへ変えていく未来です。その未来を実現するには、最新 AI の汎用性を存分に活かせるコンピューティングプラットフォームが必要です。そうすれば企業が顧客の新しいエクスペリエンスをあらためて考え直し、顧客の要求を満たし (あるいは要求を超え)、AI をベースとする製品やサービスを経済的に拡大できるようになるのです。

NVIDIA^® T4 GPU は、ハイパフォーマンスコンピューティング、ディープラーニングのトレーニングと推論、機械学習、データ分析、グラフィックスなど、さまざまなクラウドワークロードを加速します。新しい NVIDIA Turing^™ アーキテクチャを基盤とし、エネルギー効率に優れた 70 ワットの小型 PCIe フォームファクターに収納された T4 は、主要なコンピューティング環境に最適化されており、多精度のTuring Tensor コアと新しい RT コアを備えています。NGC のコンテナー化された高速ソフトウェアスタックと組み合わせることで、T4 は規模に応じた革新的なパフォーマンスを提供します。

登録して推論の技術概要をダウンロード

推論インフォグラフィックをダウンロード

Turing GPU アーキテクチャをダウンロードする

新しいパートナーシップにより、ハイブリッドクラウドが進化し、新しいエンタープライズワークロードを強化します。

詳細を見る

画期的なパフォーマンス

T4 は、革新的な Turing Tensor コアテクノロジと多精度コンピューティングが採用されており、さまざまなワークロードに対応します。FP32 から FP16、INT8、さらには INT4 の精度に対応する画期的な性能を備えた T4 は、CPU の最大 40 倍のパフォーマンスを発揮します。

リアルタイムで最先端の推論

対話型 AI、レコメンダーシステム、画像検索などのサービスのユーザーエンゲージメントには応答性が重要です。モデルの精度と複雑さが増すにつれ、正解を即座に提供するには飛躍的に膨大な計算能力が必要になります。T4 は、最大 40 倍のスループットを実現するため、より多くのリクエストをリアルタイムで対応できます。

T4 推論性能

Resnet50

DeepSpeech2

GNMT

Chip-to-chip GPU-to-CPU speedups | 1 NVIDIA T4 GPU vs 1 Xeon Gold 6140 CPU

ビデオコード変換パフォーマンス

オンラインのビデオの数が飛躍的に増えるにつれて、ビデオを効率的に検索し、知見を引き出すソリューションの需要も同様に増えています。T4 は、旧世代 GPU の 2 倍のデコーディングパフォーマンスを実現する専用のハードウェアコード変換エンジンを使用して AI ビデオアプリケーションのために画期的なパフォーマンスを提供します。T4 は最大 38 のフル HD ビデオストリームをデコードできるため、スケーラブルなディープラーニングをこのビデオパイプラインに容易に統合でき、革新的かつスマートなビデオサービスを実現します。

NVIDIA T4 仕様

パフォーマンス

Turing Tensorコア
320

NVIDIA CUDA^® コア
2,560

Single Precision Performance (FP32)
8.1 TFLOPS

混合精度 (FP16/FP32)
65 FP16 TFLOPS

INT8 精度
130 INT8 TOPS

INT4 精度
260 INT4 TOPS

パフォーマンス

Gen3
x16 PCIe

メモリ

容量
16 GB GDDR6

帯域幅
320+ GB/秒

電力

70 watts

NVIDIA AI 推論プラットフォーム

世界最先端の推論プラットフォームの詳細

詳細を見る