NVIDIA T4

DESIGN FLESSIBILE, PRESTAZIONI ALL'AVANGUARDIA

La nuova era di accelerazione dell'inferenza è arrivata

Stiamo correndo verso un futuro in cui ogni interazione dei clienti, ogni prodotto e ogni offerta di servizio saranno toccati e migliorati dall'intelligenza artificiale. Questo futuro richiede una piattaforma di elaborazione che possa accelerare l'intero panorama di applicazioni IA moderne, permettendo alle imprese di creare nuove esperienze clienti, reinventare il modo in cui rispondono e superano le loro aspettative e scalare in modo efficiente ed economico i prodotti e i servizi basati su IA.

La GPU NVIDIA® T4 accelera carichi di lavoro cloud diversificati, tra cui HPC, training e inferenza su deep learning, machine learning, analisi dei dati e grafica. Basata sulla nuova architettura NVIDIA Turing() e inclusa in un fattore di forma PCIe piccolo ad alta efficienza energetica 70 watt, la T4 è ottimizzata per ambienti di elaborazione scale-out ed è dotata di Tensor Core Turing Tensor multi-precisione e dei nuovi Core RT. Abbinata con stack software containerizzati e accelerati dal NGC, la T4 offre prestazioni scalabili e rivoluzionarie.

PRESTAZIONI ALL'AVANGUARDIA

La T4 introduce la rivoluzionaria tecnologia Turing Tensor Core con elaborazione in multi-precisione per gestire carichi di lavoro diversificati. Alimentando prestazioni straordinarie con precisioni FP32 a FP16 fino a INT8, e precisioni INT4, la T4 offre prestazioni fino a 40 volte superiori rispetto alle CPU.

Prestazioni di inferenza all'avanguardia

INFERENZA ALL'AVANGUARDIA IN TEMPO REALE

La reattività è fondamentale nel coinvolgimento degli utenti per servizi come IA conversazionale, sistemi di generazione di consigli e ricerca per immagini. Con l'aumentare della precisione e della complessità dei modelli, fornire la risposta giusta ora richiede una capacità di elaborazione esponenzialmente maggiore. Tesla T4 offre una produttività a bassa latenza fino a 40 volte superiore, in modo da poter gestire più richieste in tempo reale.

PRESTAZIONI DI INFERENZA DELLA T4

Resnet50

DeepSpeech2

GNMT

Prestazioni di transcodifica video

Con la crescita esponenziale del volume di video online, cresce anche la domanda di soluzioni per la ricerca efficiente di informazioni dai video. Tesla T4 garantisce prestazioni all'avanguardia per applicazioni video IA, con engine di transcodifica hardware che raddoppiano le prestazioni di decodifica rispetto alle GPU di precedente generazione. La T4 è in grado di decodificare fino a 38 video in streaming in full-HD, facilitando l'integrazione del deep learning scalabile nella coda per offrire video più intelligenti e innovativi.

Specifiche NVIDIA Tesla T4

 

Prestazioni

Tensor Core Turing
320

Core NVIDIA CUDA®
2.560

Prestazioni in precisione singola (FP32)
8.1 TFLOPS

Precisione mista (FP16/FP32)
65 FP16 TFLOPS

Precisione INT8
130 INT8 TOPS

Precisione INT4
260 INT4 TOPS

 
 

Interconnessione

PCIe Gen3
x16

 
 

Memoria

Capacità
16 GB GDDR6

Banda
320+ GB/s

 
 

Alimentazione

70 watt

 

Piattaforma di inferenza IA NVIDIA

Esplora la piattaforma di inferenza più avanzata del mondo.