NVIDIA T4

Flexibles Design, bahnbrechende Leistung

Die Beschleunigung der nächsten Generation ist jetzt verfügbar

Wir rasen in eine Zukunft, in der jede Kundeninteraktion, jedes Produkt und jedes Dienstangebot mit KI in Berührung kommt und dadurch verbessert wird. Wir erkennen, dass für die Zukunft eine Rechenplattform erforderlich ist, die die vollständige Bandbreite moderner KI beschleunigen kann. Dadurch können in Unternehmen eine neue Kundenerfahrung geprägt und auf neue Weise Kundenanforderungen erfüllt – und sogar übertroffen – sowie KI-basierte Produkte und Dienstleistungen kosteneffizient skaliert werden.

Die NVIDIA® T4-GPU beschleunigt diverse Cloudworkloads, darunter High-Performance-Computing, Deep-Learning-Training und -Inferenz, maschinelles Lernen, Datenanalysen und Grafik. T4 basiert auf der neuen NVIDIA Turing-Architektur, ist mit 70 Watt energieeffizient und bietet einen kleinen PCIe-Formfaktor. Sie ist für Mainstream-Computing-Umgebungen optimiert und beinhaltet multipräzise Turing Tensor-Cores sowie neue RT-Cores. In Kombination mit beschleunigter containerisierter Zusatzsoftware von NGC bietet T4 revolutionäre, skalierbare Leistung.

Virtuelle, rechenintensive Server-Workloads

Virtuelle, rechenintensive Server-Workloads

NVIDIA Virtual Compute Server (vCS) bietet die Möglichkeit, GPUs zu virtualisieren und rechenintensive Server-Workloads, einschließlich KI, Deep Learning und Data Science, zu beschleunigen. Damit können Automobilhersteller die neuesten Simulations- und Berechnungstechnologien einsetzen, um die kraftstoffsparendsten und ansprechendsten Entwürfe zu entwickeln, und Forscher sind in der Lage, die Funktion von Genen zu analysieren, um medizinische Behandlungen schneller zu entwickeln.

Eine neue Partnerschaft fördert die Hybrid Cloud, um moderne Unternehmens-Workloads zu bewältigen.

Überragende Leistung

Bei T4 wird die revolutionäre Technologie des Turing Tensor-Core mit Multipräzisions-Computing für diverse Workloads eingeführt. T4 bietet bahnbrechende Leistung von FP32- über FP16- und INT8- bis hin zu INT4-Precision und liefert bis zu 40-mal mehr Leistung als CPUs.

Bahnbrechende Inferenzleistung

Erfahren Sie, wie Sie Ihre KI-Modelle mit Mixed-Precision auf Tensor-Cores beschleunigen können.

Modernste Interferenz in Echtzeit

Eine hohe Reaktionsgeschwindigkeit ist die Voraussetzung dafür, dass Nutzer Funktionen wie Gesprächs-KI, Empfehlungssysteme und visuelle Suche akzeptieren. Da die Modelle an Genauigkeit und Komplexität zunehmen, erfordert die Bereitstellung der richtigen Antwort im Moment eine exponentiell größere Rechenleistung. T4 bietet einen bis zu 40-mal besseren Datendurchlauf, sodass mehr Anfragen in Echtzeit bearbeitet werden können.

T4-Inferenzleistung

Resnet50

DeepSpeech2

GNMT

Videotranskodierungsleistung

Mit dem exponentiell zunehmenden Volumen an Onlinevideos steigt auch die Nachfrage nach Lösungen zum effizienten Suchen und Erhalten von Einblicken in diesen Videos.Tesla T4 bietet überragende Leistung für KI-Videoanwendungen – mit dedizierten Engines für Hardwaretranskodierung. Diese bieten die doppelte Dekodierungsleistung im Vergleich zu Recheneinheiten vorheriger Generationen. T4 bietet einen bis zu 40-mal besseren Datendurchlauf, sodass mehr Anfragen in Echtzeit bearbeitet werden können.

Technische Daten zu NVIDIA T4

 

Leistung

Turing Tensor Cores
320

NVIDIA CUDA®-Recheneinheiten
2.560

Single-Precision-Leistung (FP32)
8,1 TFLOPS

Mixed-Precision (FP16/FP32)
65 FP16-TFLOPS

INT8-Precision
130 INT8-TOPS

INT4-Precision
260 INT4-TOPS

 
 

Konnektivität

Gen3
x16 PCIe

 
 

Arbeitsspeicher

Kapazität
16 GB GDDR6

Bandbreite
Über 320 GB/s

 
 

Leistung

70 Watt

 

NVIDIA KI-Inferenzplattform

Entdecken Sie die fortschrittlichste Inferenzplattform der Welt.