Conception Polyvalente, Performances De Pointe
À l’avenir, toutes les interactions avec les clients, tous les produits et toutes les offres de services seront impactés et optimisés par l’IA. Pour faire de cette perspective une réalité, les entreprises doivent déployer une plateforme de calcul à même d’accélérer toutes la diversité des workflows IA modernes - de manière à proposer de nouvelles expériences utilisateur, traiter et surpasser les attentes de leurs clients ou bien faire évoluer leurs produits et leurs services tout en réduisant les coûts d’exploitation.
Le GPU NVIDIA® T4 accélère une grande variété de charges de travail dans le Cloud telles que le calcul haute performance, l’entraînement et l’inférence Deep Learning, le Machine Learning, l’analyse de données et le traitement graphique. Basé sur la nouvelle architecture NVIDIA Turing™ et reposant sur une configuration PCIe compacte à faible consommation (70 Watts), le NVIDIA T4 a été optimisé pour les serveurs de calcul grand public et a été conçu afin de fournir des capacités de calcul multi-précision sans précédent grâce à ses cœurs Turing Tensor et ses nouveaux cœurs RT. Combiné aux conteneurs logiciels accélérés de NVIDIA NGC, le T4 délivre des performances à l’échelle tout simplement révolutionnaires.
Un nouveau partenariat fait avancer le Cloud hybride pour optimiser les charges de travail modernes en entreprise.
Tesla T4 s’appuie sur la technologie Turing révolutionnaire à coeurs Tensor pour offrir des performances de calcul multi-précision avec une grande variété de charges de travail. Grâce à des performances FP32, FP16, INT8 et INT4 sans précédent, cet accélérateur offre un rendement jusqu’à 40 fois plus élevé que les configurations basées sur le traitement CPU.
La réactivité joue un rôle essentiel dans l’adoption des services comme l’IA conversationnelle, les systèmes de recommandation ou les recherches visuelles. Plus les modèles numériques gagnent en précision et en complexité, plus les systèmes informatiques requièrent une puissance de calcul exponentielle. Tesla T4 offre un rendement jusqu’à 40 fois plus élevé avec un faible temps de latence, ce qui permet de traiter un plus grand nombre de requêtes en temps réel.
Resnet50
DeepSpeech2
GNMT
Accélération Chip-to-chip GPU-to-CPU | GPU NVIDIA T4 vs CPU Xeon Gold 6140
Alors que le volume de vidéos mises en ligne chaque jour augmente de manière exponentielle, la demande en matière de solutions pour rechercher et exporter des informations à partir de ces vidéos continue d’augmenter elle aussi. Grâce à ses moteurs de transcodage matériel dédiés - aux capacités de décodage deux fois plus importantes par rapport aux GPU de génération précédente - l’accélérateur Tesla T4 délivre des performances révolutionnaires pour les applications vidéo à base IA. Tesla T4 offre un rendement jusqu’à 40 fois plus élevé, ce qui permet de traiter un plus grand nombre de requêtes en temps réel.
Cœurs Turing Tensor 320
Cœurs NVIDIA CUDA® 2560
Performances en précision simple (FP32) 8,1 TFlops
Performances en précision mixte (FP16/FP32) 65 TFlops FP16
Précision INT8 130 TOPs INT8
Précision INT4 260 TOPs INT4
Gen3 x16 PCIe
Capacité 16 Go GDDR6
Bande passante 320+ Go/s
70 Watts
Découvrez la plateforme d’inférence la plus avancée au monde.