This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA T4

Flexibles Design, Bahnbrechende Leistung

Die Inferenzbeschleunigung der nächsten Generation ist jetzt verfügbar

Wir rasen in eine Zukunft, in der jede Kundeninteraktion, jedes Produkt und jedes Dienstangebot mit KI in Berührung kommt und dadurch verbessert wird. Wir erkennen, dass für die Zukunft eine Rechenplattform erforderlich ist, die die vollständige Bandbreite moderner KI beschleunigen kann. Dadurch können in Unternehmen eine neue Kundenerfahrung geprägt und auf neue Weise Kundenanforderungen erfüllt – und sogar übertroffen – sowie KI-basierte Produkte und Dienstleistungen kosteneffizient skaliert werden.

Die NVIDIA^® T4-GPU beschleunigt diverse Cloudworkloads, darunter High-Performance-Computing, Deep-Learning-Training und -Inferenz, maschinelles Lernen, Datenanalysen und Grafik. T4 basiert auf der neuen NVIDIA Turing^™-Architektur, ist mit 70 Watt energieeffizient und bietet einen kleinen PCIe-Formfaktor. Sie ist für Mainstream-Computing-Umgebungen optimiert und beinhaltet Turing Tensor-Multipräzisions-Recheneinheiten sowie neue RT-Recheneinheiten. In Kombination mit beschleunigter containerisierter Zusatzsoftware von NGC bietet T4 revolutionäre, skalierbare Leistung.

Datenblatt zu T4 Tensor-Recheneinheit herunterladen

T4-Produktübersicht herunterladen

Zum Herunterladen der technischen Inferenz-Übersicht registrieren

Inferenz-Infografik herunterladen

Lade die Turing GPU-Architektur herunter

Eine neue Partnerschaft fördert die Hybrid Cloud, um moderne Unternehmens-Workloads zu bewältigen.

Weitere Infos

ÜBerragende Leistung

Bei T4 wird die revolutionäre Technologie der Turing Tensor-Recheneinheiten mit Multipräzisions-Computing für diverse Workloads eingeführt. T4 bietet bahnbrechende Leistung von FP32- über FP16- und INT8- bis hin zu INT4-Precision und liefert bis zu 40-mal mehr Leistung als CPUs.

Modernste Inferenz In Echtzeit

Reaktionsschnelligkeit ist der Schlüssel zur Benutzerinteraktion bei Diensten wie Gesprächs-KI, Empfehlungssysteme und visuelle Suche. Da die Modelle an Genauigkeit und Komplexität zunehmen, erfordert die Bereitstellung der richtigen Antwort in Echtzeit eine exponentiell größere Rechenleistung. Tesla T4 bietet einen bis zu 40-mal höheren Durchsatz bei niedriger Latenz, sodass mehr Anfragen in Echtzeit bearbeitet werden können.

T4-inferenzleistung

Resnet50

DeepSpeech2

GNMT

Chip-zu-Chip-/GPU-zu-CPU-Beschleunigung | NVIDIA T4-GPU gegenüber Xeon Gold 6140-CPU

Videotranskodierungsleistung

Mit dem exponentiell zunehmenden Volumen an Onlinevideos steigt auch die Nachfrage nach Lösungen zum effizienten Suchen und Erhalten von Einblicken in diesen Videos.Tesla T4 bietet überragende Leistung für KI-Videoanwendungen – mit dedizierten Engines für Hardwaretranskodierung. Diese bieten die doppelte Dekodierungsleistung im Vergleich zu Recheneinheiten vorheriger Generationen. T4 bietet einen bis zu 40-mal besseren Datendurchlauf, sodass mehr Anfragen in Echtzeit bearbeitet werden können.

Technische Daten zu NVIDIA Tesla T4

Leistung

Turing Tensor-Recheneinheiten
320

NVIDIA CUDA^®-Recheneinheiten
2.560

Single-Precision-Leistung (FP32)
8.1 TFLOPS

Mixed-Precision (FP16/FP32)
65 FP16 TFLOPS

INT8-Precision
130 INT8 TOPS

INT4-Precision
260 INT4 TOPS

Konnektivität

3. Gen.
x 16 PCIe

Arbeitsspei

Kapazität
16 GB GDDR6

Bandbreite über
320+ GB/s

Stromversorgung

70 Watt

NVIDIA KI-Inferenzplattform

Entdecken Sie die fortschrittlichste Inferenzplattform der Welt.

Weitere Infos