GPU NVIDIA Tesla T4 Tensor Core

Alimentare la piattaforma di inferenza hyperscale TensorRT.

La nuova era di accelerazione dell'inferenza è arrivata

Stiamo correndo verso un futuro in cui ogni interazione dei clienti, ogni prodotto e ogni offerta di servizio saranno toccati e migliorati dall'intelligenza artificiale. Questo futuro richiede una piattaforma di elaborazione che possa accelerare l'intero panorama di applicazioni IA moderne, permettendo alle imprese di creare nuove esperienze clienti, reinventare il modo in cui rispondono e superano le loro aspettative e scalare in modo efficiente ed economico i prodotti e i servizi basati su IA.

La GPU NVIDIA® Tesla® T4 è l'acceleratore di inferenza più avanzato del mondo. Basato su Tensor Core NVIDIA Turing, la T4 introduce prestazioni di inferenza a multi precisione rivoluzionarie per accelerare il panorama eterogeneo di applicazioni moderne con intelligenza artificiale. Inserito in un fattore di forma ridotto PCIe a risparmio energetico da 70 watt, la T4 è ottimizzata per scalare i server ed è progettata appositamente per garantire inferenza all'avanguardia in tempo reale.

Prestazioni di inferenza all'avanguardia

Tesla T4 introduce la rivoluzionaria tecnologia Turing Tensor Core con elaborazione multi-precisione per inferenza con IA. Alimentando prestazioni straordinarie con precisioni FP32 a FP16 fino a INT8, e precisioni INT4, la T4 offre prestazioni fino a 40 volte superiori rispetto alle CPU.

Prestazioni di inferenza all'avanguardia

INFERENZA ALL'AVANGUARDIA IN TEMPO REALE

La reattività è fondamentale nel coinvolgimento degli utenti per servizi come IA conversazionale, sistemi di generazione di consigli e ricerca per immagini. Con l'aumentare della precisione e della complessità dei modelli, fornire la risposta giusta ora richiede una capacità di elaborazione esponenzialmente maggiore. Tesla T4 offre una produttività a bassa latenza fino a 40 volte superiore, in modo da poter gestire più richieste in tempo reale.

PRESTAZIONI DI INFERENZA DELLA T4

Resnet50

DeepSpeech2

GNMT

Prestazioni di transcodifica video

Con la crescita esponenziale del volume di video online, cresce anche la domanda di soluzioni per la ricerca efficiente di informazioni dai video. Tesla T4 garantisce prestazioni all'avanguardia per applicazioni video IA, con engine di transcodifica hardware che raddoppiano le prestazioni di decodifica rispetto alle GPU di precedente generazione. La T4 è in grado di decodificare fino a 38 video in streaming in full-HD, facilitando l'integrazione del deep learning scalabile nella coda per offrire video più intelligenti e innovativi.

Specifiche NVIDIA Tesla T4

 

Prestazioni

Tensor Core Turing
320

Core NVIDIA CUDA®
2.560

Prestazioni in precisione singola (FP32)
8.1 TFLOPS

Precisione mista (FP16/FP32)
65 FP16 TFLOPS

Precisione INT8
130 INT8 TOPS

Precisione INT4
260 INT4 TOPS

 
 

Interconnessione

PCIe Gen3
x16

 
 

Memoria

Capacità
16 GB GDDR6

Banda
320+ GB/s

 
 

Alimentazione

70 watt

 

Piattaforma di inferenza IA NVIDIA

Esplora la piattaforma di inferenza più avanzata del mondo.