NVIDIA T4

CONCEPTION POLYVALENTE, PERFORMANCES DE POINTE

Capacités d’accélération sans précédent pour les workflows d’inférence IA

À l’avenir, toutes les interactions avec les clients, tous les produits et toutes les offres de services seront impactés et optimisés par l’IA. Pour faire de cette perspective une réalité, les entreprises doivent déployer une plateforme de calcul à même d’accélérer toutes la diversité des workflows IA modernes - de manière à proposer de nouvelles expériences utilisateur, traiter et surpasser les attentes de leurs clients ou bien faire évoluer leurs produits et leurs services tout en réduisant les coûts d’exploitation.

Le GPU NVIDIA® T4 accélère une grande variété de charges de travail dans le Cloud telles que le calcul haute performance, l’entraînement et l’inférence Deep Learning, le Machine Learning, l’analyse de données et le traitement graphique. Basé sur la nouvelle architecture NVIDIA Turing et reposant sur une configuration PCIe compacte à faible consommation (70 Watts), le NVIDIA T4 a été optimisé pour les serveurs de calcul grand public et a été conçu afin de fournir des capacités de calcul multi-précision sans précédent grâce à ses cœurs Turing Tensor et ses nouveaux cœurs RT. Combiné aux conteneurs logiciels accélérés de NVIDIA NGC, le T4 délivre des performances à l’échelle tout simplement révolutionnaires.

Les GPU Tesla T4 accélèrent les charges de travail des principaux serveurs d’entreprise au monde.

PERFORMANCES RÉVOLUTIONNAIRES

Tesla T4 s’appuie sur la technologie Turing révolutionnaire à coeurs Tensor pour offrir des performances de calcul multi-précision avec une grande variété de charges de travail. Grâce à des performances FP32, FP16, INT8 et INT4 sans précédent, cet accélérateur offre un rendement jusqu’à 40 fois plus élevé que les configurations basées sur le traitement CPU.

Performances d’inférence de pointe

INFÉRENCE ULTRA-RAPIDE EN TEMPS RÉEL

La réactivité joue un rôle essentiel dans l’adoption des services comme l’IA conversationnelle, les systèmes de recommandation ou les recherches visuelles. Plus les modèles numériques gagnent en précision et en complexité, plus les systèmes informatiques requièrent une puissance de calcul exponentielle. Tesla T4 offre un rendement jusqu’à 40 fois plus élevé avec un faible temps de latence, ce qui permet de traiter un plus grand nombre de requêtes en temps réel.

PERFORMANCES D’INFÉRENCE T4

Resnet50

DeepSpeech2

GNMT

Performances de transcodage vidéo

Alors que le volume de vidéos mises en ligne chaque jour augmente de manière exponentielle, la demande en matière de solutions pour rechercher et exporter des informations à partir de ces vidéos continue d’augmenter elle aussi. Grâce à ses moteurs de transcodage matériel dédiés - aux capacités de décodage deux fois plus importantes par rapport aux GPU de génération précédente - l’accélérateur Tesla T4 délivre des performances révolutionnaires pour les applications vidéo à base IA. Tesla T4 offre un rendement jusqu’à 40 fois plus élevé, ce qui permet de traiter un plus grand nombre de requêtes en temps réel.

NVIDIA Tesla T4 - Spécifications

 

Performances

Cœurs Turing Tensor
320

Cœurs NVIDIA CUDA®
2560

Performances en précision simple (FP32)
8,1 TFlops

Performances en précision mixte (FP16/FP32)
65 TFlops FP16

Précision INT8
130 TOPs INT8

Précision INT4
260 TOPs INT4

 
 

Interface d'interconnexion

Gen3
x16 PCIe

 
 

Mémoire

Capacité
16 Go GDDR6

Bande passante
320+ Go/s

 
 

Alimentation

70 Watts

 

Plateforme d’inférence IA de NVIDIA

Découvrez la plateforme d’inférence la plus avancée au monde.