NVIDIA T4

Design flessibile, prestazioni all'avanguardia

La nuova era dell'accelerazione è arrivata

Stiamo correndo verso un futuro in cui ogni interazione dei clienti, ogni prodotto e ogni offerta di servizio saranno toccati e migliorati dall'intelligenza artificiale. Questo futuro richiede una piattaforma di elaborazione che possa accelerare l'intero panorama di applicazioni IA moderne, permettendo alle imprese di creare nuove esperienze clienti, reinventare il modo in cui rispondono e superano le loro aspettative e scalare in modo efficiente ed economico i prodotti e i servizi basati su IA.

La GPU NVIDIA® T4 accelera carichi di lavoro cloud diversificati, tra cui HPC, training e inferenza su deep learning, machine learning, analisi dei dati e grafica. Basata sulla nuova architettura NVIDIA Turing e inclusa in un fattore di forma PCIe piccolo ad alta efficienza energetica a 70 watt, la T4 è ottimizzata per ambienti di elaborazione mainstream ed è dotata di Tensor Core Turing multi-precisione e dei nuovi Core RT. Abbinata con stack software containerizzati e accelerati dal NGC, la T4 offre prestazioni scalabili e rivoluzionarie.

Carichi di lavoro server virtuali a elevati requisiti di elaborazione

Carichi di lavoro server virtuali a elevati requisiti di elaborazione

NVIDIA Virtual Compute Server (vCS) offre la possibilità di virtualizzare GPU e accelerare i carichi di lavoro server a elevati requisiti di calcolo, tra cui IA, deep learning e scienza dei dati. In questo modo, le aziende automobilistiche possono utilizzare le più recenti tecnologie di simulazione e calcolo per creare progetti più eleganti ed efficienti in termini di consumo di carburante, mentre i ricercatori possono analizzare il comportamento dei geni per sviluppare trattamenti più rapidamente.

Una nuova partnership sta potenziando il cloud ibrido per alimentare i carichi di lavoro aziendali moderni.

Prestazioni all'avanguardia

La T4 introduce la rivoluzionaria tecnologia Turing Tensor Core con elaborazione in multi-precisione per gestire carichi di lavoro diversificati. Alimentando prestazioni straordinarie con precisioni FP32 a FP16 fino a INT8, e precisioni INT4, la T4 offre prestazioni fino a 40 volte superiori rispetto alle CPU.

Prestazioni di inferenza all'avanguardia

Scopri come accelerare i modelli IA con precisione mista su Tensor Core

Inferenza all'avanguardia in tempo reale

La reattività è fondamentale nel coinvolgimento degli utenti per servizi come IA conversazionale, sistemi di generazione di consigli e ricerca per immagini. Con l'aumentare della precisione e della complessità dei modelli, fornire la risposta giusta ora richiede una capacità di elaborazione esponenzialmente maggiore. T4 aumenta la produttività fino a 40 volte per servire più richieste in tempo reale.

Prestazioni di inferenza della T4

Resnet50

DeepSpeech2

GNMT

Prestazioni di transcodifica video

Con la crescita esponenziale del volume di video online, cresce anche la domanda di soluzioni per la ricerca efficiente di informazioni dai video. Tesla T4 garantisce prestazioni all'avanguardia per applicazioni video IA, con engine di transcodifica hardware che raddoppiano le prestazioni di decodifica rispetto alle GPU di precedente generazione. T4 aumenta la produttività fino a 40 volte per servire più richieste in tempo reale.

Specifiche NVIDIA T4

 

Prestazioni

Tensor Core Turing
320

NVIDIA CUDA® Core
2.560

Prestazioni in precisione singola (FP32)
8.1 TFLOPS

Precisione mista (FP16/FP32)
65 FP16 TFLOPS

Precisione INT8
130 INT8 TOPS

Precisione INT4
260 INT4 TOPS

 
 

Interconnessione

Gen3
PCIe x16

 
 

Memoria

CAPACITÀ 
GDDR6 da 16 GB

Larghezza di banda
320+ GB/s

 
 

Alimentazione

70 watt

 

Piattaforma di inferenza IA NVIDIA

Esplora la piattaforma di inferenza più avanzata del mondo.