Piattaforma NVIDIA HGX

Potenziare l'IA e il calcolo ad alte prestazioni per ogni data center.

Panoramica
CPU NVIDIA Vera
Networking
Specifiche

Panoramica
CPU NVIDIA Vera
Networking
Specifiche

Panoramica

Potenziare l'intelligenza artificiale (IA) e il calcolo ad alte prestazioni (HPC) per ogni data center

La piattaforma NVIDIA HGX™ mette insieme tutta la potenza delle GPU NVIDIA, delle CPU NVIDIA Vera, di NVIDIA NVLink™ e della rete NVIDIA, oltre a stack software IA e di calcolo ad alte prestazioni (HPC) completamente ottimizzati per garantire le massime prestazioni applicative e accelerare i tempi di ricerca di dati e soluzioni per qualsiasi data center.

NVIDIA HGX Rubin NVL8 integra otto GPU NVIDIA Rubin con interconnessioni NVLink ad alta velocità di sesta generazione, offrendo un throughput di token factory fino a 10 volte superiore rispetto a HGX B200 ed eguagliando le sue prestazioni di addestramento con un numero di GPU 4 volte inferiore. I sistemi HGX basati su NVIDIA Rubin sono progettati per l'IA agentica, l'analisi dei dati e i carichi di lavoro HPC più esigenti. NVIDIA HGX Rubin NVL8 può essere abbinato alle CPU NVIDIA Vera, configurate come HGX Vera Rubin NVL8, o alle schede di base delle CPU basate su x86.

NVIDIA Vera Rubin entra in piena produzione per alimentare le fabbriche di IA agentica in tutto il mondo

NVIDIA Vera Rubin è entrata in piena produzione, con i principali produttori di server di Taiwan e i leader globali della supply chain che producono e spediscono sistemi basati su Vera Rubin su larga scala, alimentando i laboratori IA, i fornitori di cloud e gli hyperscaler per creare l'intelligenza di domani.

Leggi il comunicato stampa

Accelerare la nuova generazione di IA per agenti

Aumenta il throughput delle fabbriche di token con HGX Rubin NVL8

Fornire modelli di IA agentica e ragionamento su larga scala richiede un throughput di inferenza estremo. Con innovazioni architettoniche, tra cui 400 PFLOPS di calcolo NVFP4, 3 volte più larghezza di banda di memoria a 176 TB/s e 2 volte più larghezza di banda NVLink Switch a 28,8 TB/s per la comunicazione inter-GPU ad alto throughput, HGX Rubin NVL8 offre un throughput di token factory 10 volte superiore rispetto a HGX B200. Questo salto di prestazioni consente alle fabbriche IA di servire più utenti, massimizzare le entrate dai token e ridurre il costo per token.

Prestazioni previste soggette a modifica. Modello Kimi K2-Thinking con FTL<=500ms, ISL=4K, OSL=4K. HGX Rubin NVL8 con Sparse NVFP4, HGX B200 con Dense NVFP4

Prestazioni previste soggette a modifica. Numero di GPU basate su DeepSeek-R1 pre-addestrato su token da 15T con lunghezza di sequenza 4K.

Addestra modelli IA di nuova generazione con un numero di GPU 4 volte inferiore

HGX Rubin NVL8 porta il pre-addestramento mixture-of-experts rivoluzionario nel fattore di forma dei server a 8 GPU, addestrando modelli di IA agentica di nuova generazione con un numero di GPU 4 volte inferiore, grazie a innovazioni architettoniche che includono FLOPS di addestramento NVFP4 4 volte superiori, una capacità di memoria HBM ad alta velocità 1,6 volte superiore e una larghezza di banda NVLink 2 volte superiore rispetto a HGX B200. Questo salto nell'efficienza dell'addestramento consente alle organizzazioni di addestrare più modelli all'interno della stessa infrastruttura, ridurre i costi di sviluppo dei modelli e massimizzare il ritorno sull'investimento nell'infrastruttura IA.

CPU NVIDIA Vera

NVIDIA Vera è la CPU per l'era dell'IA, progettata appositamente per l'IA agentica, l'apprendimento per rinforzo e l'elaborazione dei dati su larga scala. I core NVIDIA Olympus, la memoria LPDDR5X ad alta larghezza di banda e NVIDIA Scalable Coherency Fabric offrono un'esecuzione della CPU rapida ed efficiente insieme al calcolo accelerato, aiutando le fabbriche IA a eseguire più agenti, valutazioni e pipeline di dati.

Scopri di più

Accelerare HGX con NVIDIA Networking

Le fabbriche IA e i centri di supercomputing si estendono su migliaia di GPU come un singolo motore di calcolo distribuito. Per mantenere gli acceleratori completamente utilizzati, i carichi di lavoro IA e scientifici richiedono una latenza deterministica, un throughput senza perdite, tempi di iterazione stabili e la capacità di scalare non solo all'interno di un data center, ma su più siti.

Il networking NVIDIA offre il fabric completo che rende tutto ciò possibile, combinando la scalabilità NVIDIA NVLink, la scalabilità NVIDIA Quantum InfiniBand e Spectrum-X™ Ethernet, la scalabilità Spectrum-XGS Ethernet multi-data center, la DPU NVIDIA® BlueField® e DOCA™ per i servizi infrastrutturali e le piattaforme di fotonica in silicio di nuova generazione, che consentono ai data center IA più esigenti al mondo.

Specifiche di NVIDIA HGX

NVIDIA HGX è disponibile in una singola scheda di base con otto NVIDIA Rubin, NVIDIA Blackwell o NVIDIA Blackwell Ultra SXMs. Le GPU Rubin possono essere abbinate a una CPU NVIDIA Vera o a una baseboard basata su x86. Queste potenti combinazioni di hardware e software pongono le basi per prestazioni di IA e supercomputing senza precedenti.

NVIDIA Rubin NVL8
NVIDIA Blackwell

Specifiche del sistema	NVIDIA HGX Vera Rubin NVL8<sup>1</sup>	NVIDIA HGX Rubin NVL8<sup>1</sup>
Configurazione	8x NVIDIA Rubin SXM con CPU Vera a singolo socket	8x NVIDIA Rubin SXM
CPU \| Numero di core	CPU NVIDIA Vera \| 88 core NVIDIA Olympus personalizzati (compatibili con Arm®) con multithreading spaziale (SMT)	x86 CPU<sup>4</sup>
Memoria CPU \| Larghezza di banda	LPDDR5X da 1,5 TB \| 1,2 TB/s	x86 CPU<sup>4</sup>
Inferenza NVFP4	400 PFLOPS
Addestramento NVFP4<sup>2</sup>	280 PFLOPS
Addestramento FP8/FP6<sup>2</sup>	140 PFLOPS
INT8<sup>2</sup>	2 POPS
FP16/BF16<sup>2</sup>	32 PFLOPS
TF32<sup>2</sup>	16 PFLOPS
FP32	1,040 TFLOPS
FP64	265 TFLOPS
FP32 SGEMM<sup>3</sup>	3,200 TFLOPS
FP64 DGEMM<sup>3</sup>	1,600 TFLOPS
Memoria GPU \| Larghezza di banda	HBM4 da 2,3 TB \| 176 TB/s
Larghezza di banda degli switch NVLink	28,8 TB/s
NVIDIA NVLink	Sesta generazione
Larghezza di banda di rete	1,6 TB/s

Specifiche delle singole GPU	NVIDIA Rubin GPU<sup>1</sup>
Specifiche delle singole GPU	50 PFLOPS
Inferenza NVFP4	35 PFLOPS
Addestramento NVFP4<sup>2</sup>	17.5 PFLOPS
Addestramento FP8/FP6<sup>2</sup>	250 TOPS
INT8<sup>2</sup>	4 PFLOPS
FP16/BF16<sup>2</sup>	2 PFLOPS
TF32<sup>2</sup>	130 TFLOPS
FP32	33 TFLOPS
FP64	400 TFLOPS
FP32 SGEMM<sup>3</sup>	200 TFLOPS
FP64 DGEMM<sup>3</sup>	3,6 TB/s
Larghezza di banda NVLink	Sesta generazione
NVIDIA NVLink	288 GB HBM4 \| 22 TB/s

1. Informazioni preliminari. Tutti i valori sono indicativi e soggetti a modifiche. Le specifiche di inferenza NVFP4 sono di tipo sparso.
2. Specifica densa.
3. Prestazioni di picco con algoritmi di emulazione basati su Tensor Core.
4. Le specifiche di CPU e memoria sono definite dalle offerte degli OEM.

Leggi la scheda tecnica di NVIDIA Vera Rubin

	HGX B300<sup>4</sup>	HGX B200<sup>4</sup>
Fattore di forma	8x NVIDIA Blackwell Ultra SXM	8x NVIDIA Blackwell SXM
FP4 Tensor Core<sup>1</sup>	144 PFLOPS \| 108 PFLOPS	144 PFLOPS \| 72 PFLOPS
FP8/FP6 Tensor Core<sup>2</sup>	72 PFLOPS	72 PFLOPS
INT8 Tensor Core<sup>2</sup>	3 POPS	72 POPS
FP16/BF16 Tensor Core<sup>2</sup>	36 PFLOPS	36 PFLOPS
TF32 Tensor Core<sup>2</sup>	18 PFLOPS	18 PFLOPS
FP32	600 TFLOPS	600 TFLOPS
FP64/FP64 Tensor Core	10 TFLOPS	296 TFLOPS
Memoria totale	2.1 TB	1.4 TB
NVIDIA NVLink	Quinta generazione	Quinta generazione
NVIDIA NVLink Switch™	NVLink 5 Switch	NVLink 5 Switch
Banda GPU-GPU NVSwitch	1.8 TB/s	1.8 TB/s
Banda NVLink totale	14.4 TB/s	14.4 TB/s
Networking Bandwidth	1.6 TB/s	0.8 TB/s
Attention Performance<sup>3</sup>	2x	1x

1. Specifica in Sparse | Dense
2. Specifica in Sparse. Dense corrisponde alla metà della matrice spec mostrata.
3. rispetto a NVIDIA Blackwell.
4. HGX B300 e HGX B200 sono ora in spedizione.

	HGX B300	HGX B200
Form Factor	8x NVIDIA Blackwell Ultra SXM	8x NVIDIA Blackwell SXM
FP4 Tensor Core<sup>1</sup>	144 PFLOPS \| 108 PFLOPS	144 PFLOPS \| 72 PFLOPS
FP8/FP6 Tensor Core<sup>2</sup>	72 PFLOPS	72 PFLOPS
INT8 Tensor Core<sup>2</sup>	3 POPS	72 POPS
FP16/BF16 Tensor Core<sup>2</sup>	36 PFLOPS	36 PFLOPS
TF32 Tensor Core<sup>2</sup>	18 PFLOPS	18 PFLOPS
FP32	600 TFLOPS	600 TFLOPS
FP64/FP64 Tensor Core	10 TFLOPS	296 TFLOPS
Total Memory	2.1 TB	1.4 TB
NVIDIA NVLink	Fifth generation	Fifth generation
NVIDIA NVLink Switch™	NVLink 5 Switch	NVLink 5 Switch
NVLink GPU-to-GPU Bandwidth	1.8 TB/s	1.8 TB/s
Total NVLink Bandwidth	14.4 TB/s	14.4 TB/s
Networking Bandwidth	1.6 TB/s	0.8 TB/s
Attention Performance<sup>3</sup>	2x	1x

Leggi la scheda tecnica di NVIDIA Blackwell Ultra

Leggi la scheda tecnica di NVIDIA Blackwell

Scopri di più sulla piattaforma NVIDIA Vera Rubin.

Scopri di più