GPU NVIDIA Tesla T4 à cœurs Tensor

Performances accélérées pour la plateforme TensorRT Hyperscale.

Capacités d’accélération sans précédent pour les workflows d’inférence IA

À l’avenir, toutes les interactions avec les clients, tous les produits et toutes les offres de services seront impactés et optimisés par l’IA. Pour faire de cette perspective une réalité, les entreprises doivent déployer une plateforme de calcul à même d’accélérer toutes la diversité des workflows IA modernes - de manière à proposer de nouvelles expériences utilisateur, traiter et surpasser les attentes de leurs clients ou bien faire évoluer leurs produits et leurs services tout en réduisant les coûts d’exploitation.

Le GPU NVIDIA® Tesla® T4 est l’accélérateur d’inférences le plus avancé au monde. Propulsé par des cœurs Tensor et l’architecture Turing, le T4 fournit des performances multi-précision révolutionnaires pour accélérer une grande variété d’applications IA modernes. Fort d’une configuration PCIe compacte à faible consommation (70 Watts), cet accélérateur a été optimisé pour les serveurs Scale-Out et conçu pour fournir des performances d’inférence de pointe en temps réel.

Performances d’inférence de pointe

Tesla T4 s’appuie sur la technologie Turing révolutionnaire à coeurs Tensor pour offrir des performances de calcul multi-précision aux workflows d’inférence IA. Grâce à des performances FP32, FP16, INT8 et INT4 sans précédent, cet accélérateur offre un rendement jusqu’à 40 fois plus élevé que les configurations basées sur le traitement CPU.

Performances d’inférence de pointe

INFÉRENCE ULTRA-RAPIDE EN TEMPS RÉEL

La réactivité joue un rôle essentiel dans l’adoption des services comme l’IA conversationnelle, les systèmes de recommandation ou les recherches visuelles. Plus les modèles numériques gagnent en précision et en complexité, plus les systèmes informatiques requièrent une puissance de calcul exponentielle. Tesla T4 offre un rendement jusqu’à 40 fois plus élevé avec un faible temps de latence, ce qui permet de traiter un plus grand nombre de requêtes en temps réel.

PERFORMANCES D’INFÉRENCE T4

Resnet50

DeepSpeech2

GNMT

Performances de transcodage vidéo

Alors que le volume de vidéos mises en ligne chaque jour augmente de manière exponentielle, la demande en matière de solutions pour rechercher et exporter des informations à partir de ces vidéos continue d’augmenter elle aussi. Grâce à ses moteurs de transcodage matériel dédiés - aux capacités de décodage deux fois plus importantes par rapport aux GPU de génération précédente - l’accélérateur Tesla T4 délivre des performances révolutionnaires pour les applications vidéo à base IA. Tesla T4 peut décoder jusqu’à 38 flux vidéo en Full HD, ce qui facilite l’intégration d’algorithmes de Deep Learning évolutifs au sein des pipelines de traitement vidéo afin de proposer des services toujours plus innovants et intelligents.

NVIDIA Tesla T4 - Spécifications

 

Performances

Cœurs Turing Tensor
320

Cœurs NVIDIA CUDA®
2560

Performances en précision simple (FP32)
8,1 TFlops

Performances en précision mixte (FP16/FP32)
65 TFlops FP16

Précision INT8
130 TOPs INT8

Précision INT4
260 TOPs INT4

 
 

Interface d'interconnexion

Gen3
x16 PCIe

 
 

Mémoire

Capacité
16 Go GDDR6

Bande passante
320+ Go/s

 
 

Alimentation

70 Watts

 

Plateforme d’inférence IA de NVIDIA

Découvrez la plateforme d’inférence la plus avancée au monde.