This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

GPU NVIDIA A30 Tensor Core

Accelerazione di calcolo versatile per i server aziendali tradizionali.

Scopri di più

Inferenza con IA e calcolo mainstream per ogni azienda

Porta le prestazioni accelerate in ogni carico di lavoro aziendale con la GPU NVIDIA A30 Tensor Core. Con i Tensor Core dell'architettura NVIDIA Ampere e Multi-Instance GPU (MIC), offre accelerazioni in modo sicuro su diversi carichi di lavoro, tra cui l'inferenza con IA su larga scala e le applicazioni HPC. Combinando una larghezza di banda di memoria veloce e un basso consumo energetico in un fattore di forma PCIe, ottimale per i server mainstream, la A30 consente di creare un data center elastico e offre il massimo valore per le aziende.

Vedi la scheda tecnica di NVIDIA A30 (PDF 708 KB)

Vedi la sintesi del prodotto della A30 PCIe (PDF 539 KB)

La soluzione per data center per l'IT moderno

L'architettura NVIDIA Ampere fa parte della piattaforma unificata NVIDIA EGX™, che integra elementi fondamentali tra hardware, rete, software, librerie, applicazioni e modelli IA ottimizzati dal catalogo NVIDIA NGC™. Come piattaforma IA e HPC completa più potente per data center, consente ai ricercatori di fornire risultati in tempo reale e distribuire rapidamente soluzioni nell'ambiente di produzione in modo scalabile.

Training su Deep Learning

Training con IA: velocità effettiva fino a 3 volte superiore rispetto alla v100 e 6 volte superiore rispetto alla T4

Pre-training BERT Large (normalizzato)

NVIDIA A30 Tensor Core con Tensor Float (TF32)

ERT-Large Pre-Training (9/10 epochs) Phase 1 and (1/10 epochs) Phase 2, Sequence Length for Phase 1 = 128 and Phase 2 = 512, dataset = real, NGC™ container = 21.03,

8x GPU: T4 (FP32, BS=8, 2) | V100 PCIE 16GB (FP32, BS=8, 2) | A30 (TF32, BS=8, 2) | A100 PCIE 40GB (TF32, BS=54, 8) | Le dimensioni batch indicate si riferiscono rispettivamente alla fase 1 e alla fase 2

Il training di modelli con IA per sfide di livello superiore come l'IA conversazionale richiede un'enorme potenza di calcolo e scalabilità.

I Tensor Core nella NVIDIA A30 con precisione Tensor Float (TF32) offrono prestazioni 10 volte superiori rispetto alla NVIDIA T4, senza alcuna alterazione del codice, e un ulteriore incremento pari a 2 volte con precisione mista e FP16, garantendo un aumento della produttività pari a 20 volte. Con NVIDIA^® NVLink^®, PCIe Gen4, networking NVIDIA Mellanox^® e l'SDK NVIDIA Magnum IO™, è possibile scalare a migliaia di GPU.

I Tensor Core e MIG consentono di utilizzare la A30 per i carichi di lavoro in modo dinamico durante il giorno. Può essere utilizzata per l'inferenza nel picco di produzione, mentre parte della GPU può essere riutilizzata per ri-addestrare rapidamente quegli stessi modelli durante le ore non di punta.

NVIDIA stabilisce vari record di prestazioni nel MLPerf, il benchmark di settore per il training con IA.

Scopri di più sull'architettura NVIDIA Ampere per il training

Inferenza su deep learning

La A30 introduce straordinarie funzionalità per ottimizzare i carichi di lavoro di inferenza. Accelera una gamma completa di precisioni, dalla FP64 alla TF32 e INT4. Supportando fino a quattro MIG per GPU, A30 consente a più reti di operare contemporaneamente in partizioni hardware sicure con qualità del servizio garantita (QoS). Inoltre, il supporto per la densità strutturale offre prestazioni fino a 2 volte superiori oltre ad altri guadagni in termini di prestazioni in inferenza della A30.

Sui modelli di intelligenza artificiale conversazionale all'avanguardia, la A30 accelera la velocità effettiva di inferenza in tempo reale 3 volte di più rispetto alla GPU NVIDIA V100 Tensor Core di generazione precedente.

Nella classificazione delle immagini in tempo reale (che <richiede una latenza di 7 ms), la A30 accelera la velocità effettiva 7 volte rispetto alla NVIDIA T4.

Le prestazioni IA leader di mercato di NVIDIA sono state dimostrate nel benchmark MLPerf Inference. Con NVIDIA Triton™ Inference Server, che distribuisce l'IA facilmente su larga scala, la A30 porta le prestazioni più all'avanguardia in ogni impresa.

Scopri di più sull'architettura NVIDIA Ampere per l'inferenza

Inferenza con AI: velocità effettiva fino a 3 volte superiore rispetto alla V100 nell'IA conversazionale in tempo reale

BERT Large Inference (normalizzato)
Velocità effettiva per latenza <10 ms

NVIDIA^® TensorRT^®, Precision = INT8, Sequence Length = 384, Container NGC 20.12, Latenza<10ms, Dataset = Synthetic 1x GPU: A100 PCIe 40GB (BS=8) | A30 (BS=4) | V100 SXM2 16GB (BS=1) | T4 (BS=1)

Inferenza con AI: velocità effettiva più di 3 volte superiore rispetto alla T4 nella classificazione delle immagini

Inferenza RN50 v1.5 (normalizzato)
Velocità effettiva per latenza <7 ms

TensorRT, Container NGC 20.12, Latenza <7ms, Dataset=Synthetic, 1x GPU: T4 (BS=31, INT8) | V100 (BS=43, Mixed precision) | A30 (BS=96, INT8) | A100 (BS=174, INT8)

Calcolo ad alte prestazioni

HPE: velocità effettiva fino a 1,1 volte superiore rispetto alla V100 e 8 volte superiore rispetto alla T4

LAMMPS (Normalizzato)

NVIDIA A30 è dotato di doppia precisione (FP64)

Set di dati: ReaxFF/C, FP64 | 4 GPU: T4, V100 PCIE 16 GB, A30

Per arrivare a scoperte all'avanguardia, gli scienziati cercano di capire meglio il mondo che ci circonda.

La NVIDIA A30 include l'architettura NVIDIA Ampere Tensor Cores a FP64 che offre il più grande passo avanti nelle prestazioni HPC dall'introduzione delle GPU. Con 24 gigabyte (GB) di memoria GPU e una larghezza di banda di 933 gigabyte al secondo (GB/s), i ricercatori possono risolvere rapidamente calcoli a doppia precisione. Le applicazioni HPC possono inoltre sfruttare la precisione TF32 per ottenere un throughput superiore per operazioni di moltiplicazione a matrici intense a precisione singola.

La combinazione di Tensor Core FP64 e MIG consente agli istituti di ricerca di partizionare in modo sicuro la GPU per consentire a più ricercatori di accedere alle risorse di calcolo con QoS garantita e il massimo utilizzo della GPU. Le aziende che distribuiscono l'IA possono utilizzare le funzionalità di inferenza della A30 durante i periodi di picco della domanda, quindi riutilizzare gli stessi server di calcolo per i carichi di lavoro di training con IA e HPC durante i periodi più leggeri.

Scopri di più sull'architettura NVIDIA Ampere per HPC

Analisi di dati ad alte prestazioni

Gli esperti di dati devono poter analizzare, visualizzare e convertire enormi set di dati in informazioni. Tuttavia, le soluzioni scale-out spesso si trasformano in una palude poiché i set di dati sono disseminati su più server.

I server accelerati con A30 offrono la necessaria potenza di calcolo, oltre a un'enorme memoria HBM2, con una banda superiore a 933 GB/sec, e scalabilità con NVLink, per affrontare questi carichi di lavoro. Insieme a InfiniBand, NVIDIA Magnum IO e la suite RAPIDS™ di librerie open-source, tra cui RAPIDS Accelerator per Apache Spark, la piattaforma per data center NVIDIA è in grado di accelerare questi enormi carichi di lavoro a livelli senza precedenti in termini di prestazioni ed efficienza.

Scopri di più sull'analisi dei dati

Analisi di dati ad alte prestazioni

Scopri di più sull'analisi dei dati ›

Scopri di più sull'analisi dei dati

Utilizzo a livello di impresa

La A30 con MIG massimizza l'utilizzo dell'infrastruttura GPU accelerata. Con MIG, una GPU A30 può essere partizionata in ben quattro istanze indipendenti, consentendo a più utenti di accedere all'accelerazione con GPU.

MIG funziona con Kubernetes, container e virtualizzazione server basata su hypervisor. MIG consente ai gestori dell'infrastruttura di offrire una GPU di dimensioni adeguate con qualità del servizio garantita (QoS) per ogni processo, estendendo la portata delle risorse di elaborazione accelerate a tutti gli utenti.

Scopri di più su MIG

NVIDIA AI Enterprise

NVIDIA AI Enterprise, una suite cloud-native end-to-end di software di intelligenza artificiale e analisi dei dati, è certificata per l'esecuzione su A30 in un'infrastruttura virtuale basata su hypervisor con VMware vSphere. Ciò consente la gestione e il ridimensionamento dei carichi di lavoro di intelligenza artificiale in un ambiente cloud ibrido.

Scopri di più su NVIDIA AI Enterprise

NVIDIA-Certified Systems mainstream

Gli NVIDIA-Certified Systems™ con NVIDIA A30, riuniscono accelerazione di calcolo e rete NVIDIA sicura ad alta velocità nei server del data center aziendale, e sono costruiti e venduti dai partner OEM di NVIDIA. Questo programma consente ai clienti di identificare, acquisire e distribuire sistemi per applicazioni di intelligenza artificiale moderne tradizionali e diversificate dal catalogo NGC NVIDIA su un'unica infrastruttura ad alte prestazioni, economica e scalabile.

Scopri di più sugli NVIDIA-Certified Systems

Specifiche della GPU A30 Tensor Core

FP64	5,2 TeraFLOPS
FP64 Tensor Core	10,3 TeraFLOPS
FP32	10,3 TeraFLOPS
TF32 Tensor Core	82 teraFLOPS \| 165 teraFLOPS*
BFLOAT16 Tensor Core	165 teraFLOPS \| 330 teraFLOPS*
FP16 Tensor Core	165 teraFLOPS \| 330 teraFLOPS*
INT8 Tensor Core	330 TOPS \| 661 TOPS*
INT4 Tensor Core	661 TOPS \| 1321 TOPS*
Motori multimediali	1 OFA (optical flow accelerator) 1 decodificatore JPEG (NVJPEG) 4 decodificatori video (NVDEC)
Memoria della GPU	24 GB HBM2
Banda di memoria GPU	933GB/s
Interconnessione	PCIe Gen4: 64 GB/s NVLINK di terza generazione: 200 GB/s**
Form Factor	Doppio slot, full-height, full-length (FHFL)
TDP (Thermal Design Power)	165 W
Multi-Instance GPU (MIG)	4 istanze GPU a 6 GB ciascuna 2 istanze GPU a 12 GB ciascuna 1 istanza GPU a 24 GB
Supporto software Virtual GPU (vGPU)	NVIDIA AI Enterprise NVIDIA Virtual Compute Server

* Con densità
** Bridge NVLink per un massimo di due GPU

Vedi gli ultimi dati del benchmark MLPerf

VEDI I RISULTATI

Dentro l'architettura NVIDIA Ampere

Esplora le tecnologie all'avanguardia dell'architettura NVIDIA Ampere.

Scopri di più