Flexibles Design, Bahnbrechende Leistung
Wir rasen in eine Zukunft, in der jede Kundeninteraktion, jedes Produkt und jedes Dienstangebot mit KI in Berührung kommt und dadurch verbessert wird. Wir erkennen, dass für die Zukunft eine Rechenplattform erforderlich ist, die die vollständige Bandbreite moderner KI beschleunigen kann. Dadurch können in Unternehmen eine neue Kundenerfahrung geprägt und auf neue Weise Kundenanforderungen erfüllt – und sogar übertroffen – sowie KI-basierte Produkte und Dienstleistungen kosteneffizient skaliert werden.
Die NVIDIA® T4-GPU beschleunigt diverse Cloudworkloads, darunter High-Performance-Computing, Deep-Learning-Training und -Inferenz, maschinelles Lernen, Datenanalysen und Grafik. T4 basiert auf der neuen NVIDIA Turing™-Architektur, ist mit 70 Watt energieeffizient und bietet einen kleinen PCIe-Formfaktor. Sie ist für Mainstream-Computing-Umgebungen optimiert und beinhaltet Turing Tensor-Multipräzisions-Recheneinheiten sowie neue RT-Recheneinheiten. In Kombination mit beschleunigter containerisierter Zusatzsoftware von NGC bietet T4 revolutionäre, skalierbare Leistung.
Eine neue Partnerschaft fördert die Hybrid Cloud, um moderne Unternehmens-Workloads zu bewältigen.
Bei T4 wird die revolutionäre Technologie der Turing Tensor-Recheneinheiten mit Multipräzisions-Computing für diverse Workloads eingeführt. T4 bietet bahnbrechende Leistung von FP32- über FP16- und INT8- bis hin zu INT4-Precision und liefert bis zu 40-mal mehr Leistung als CPUs.
Reaktionsschnelligkeit ist der Schlüssel zur Benutzerinteraktion bei Diensten wie Gesprächs-KI, Empfehlungssysteme und visuelle Suche. Da die Modelle an Genauigkeit und Komplexität zunehmen, erfordert die Bereitstellung der richtigen Antwort in Echtzeit eine exponentiell größere Rechenleistung. Tesla T4 bietet einen bis zu 40-mal höheren Durchsatz bei niedriger Latenz, sodass mehr Anfragen in Echtzeit bearbeitet werden können.
Resnet50
DeepSpeech2
GNMT
Chip-zu-Chip-/GPU-zu-CPU-Beschleunigung | NVIDIA T4-GPU gegenüber Xeon Gold 6140-CPU
Mit dem exponentiell zunehmenden Volumen an Onlinevideos steigt auch die Nachfrage nach Lösungen zum effizienten Suchen und Erhalten von Einblicken in diesen Videos.Tesla T4 bietet überragende Leistung für KI-Videoanwendungen – mit dedizierten Engines für Hardwaretranskodierung. Diese bieten die doppelte Dekodierungsleistung im Vergleich zu Recheneinheiten vorheriger Generationen. T4 bietet einen bis zu 40-mal besseren Datendurchlauf, sodass mehr Anfragen in Echtzeit bearbeitet werden können.
Turing Tensor-Recheneinheiten 320
NVIDIA CUDA®-Recheneinheiten 2.560
Single-Precision-Leistung (FP32) 8.1 TFLOPS
Mixed-Precision (FP16/FP32) 65 FP16 TFLOPS
INT8-Precision 130 INT8 TOPS
INT4-Precision 260 INT4 TOPS
3. Gen. x 16 PCIe
Kapazität 16 GB GDDR6
Bandbreite über 320+ GB/s
70 Watt
Entdecken Sie die fortschrittlichste Inferenzplattform der Welt.