La piattaforma NVIDIA HGX™ riunisce tutta la potenza delle GPU NVIDIA, NVIDIA NVLink™, la rete NVIDIA e gli stack software di IA e calcolo ad alte prestazioni (HPC) completamente ottimizzati per fornire le massime prestazioni applicative e ottenere le informazioni nel minor tempo possibile in ogni data center.
NVIDIA HGX Rubin NVL8 integra otto GPU NVIDIA Rubin con le interconnessioni NVLink ad alta velocità di sesta generazione e offre un livello di NVFP4 FLOPS 5,5 volte superiore rispetto a HGX B200 per proiettare i data center nella nuova era del computing accelerato e dell'IA generativa.
Le fabbriche IA e i centri di supercomputing si estendono su migliaia di GPU come un singolo motore di calcolo distribuito. Per mantenere gli acceleratori completamente utilizzati, i carichi di lavoro IA e scientifici richiedono una latenza deterministica, un throughput senza perdite, tempi di iterazione stabili e la capacità di scalare non solo all'interno di un data center, ma su più siti.
Il networking NVIDIA offre il fabric completo che rende tutto ciò possibile, combinando la scalabilità NVIDIA NVLink, la scalabilità NVIDIA Quantum InfiniBand e Spectrum-X™ Ethernet, la scalabilità Spectrum-XGS Ethernet multi-data center, la DPU NVIDIA® BlueField® e DOCA™ per i servizi infrastrutturali e le piattaforme di fotonica in silicio di nuova generazione, che consentono ai data center IA più esigenti al mondo.
NVIDIA HGX è disponibile in una singola scheda di base con otto NVIDIA Rubin, NVIDIA Blackwell o NVIDIA Blackwell Ultra SXMs. Queste potenti combinazioni di hardware e software gettano le basi per prestazioni di supercalcolo IA senza precedenti.
| HGX Rubin NVL8* | |
|---|---|
| Fattore di forma | 8x NVIDIA Rubin SXM |
| Inferenza NVFP4 | 400 PFLOPS |
| Formazione su NVFP4 | 280 PFLOPS |
| FP8/FP6 Training | 140 PF |
| INT8 Tensor Core<sup>1</sup> | 2 PFLOPS |
| FP16/BF16 Tensor Core<sup>1</sup> | 32 PFLOPS |
| TF32 Tensor Core<sup>1</sup> | 16 PFLOPS |
| FP32 | 1040 TFLOPS |
| FP64/FP64 Tensor Core | 264 TFLOPS |
| FP32 SGEMM | FP64 DGEMMCore<sup>2</sup> | 3200 TF | 1600 TF |
| Memoria totale | 2.3 TB |
| NVIDIA NVLink | Sesta generazione |
| NVIDIA NVLink Switch | Switch NVLink 6 |
| Larghezza di banda NVLink GPU-GPU | 3.6 TB/s |
| Larghezza di banda totale degli switch NVLink | 28.8 TB/s |
| Larghezza di banda di rete | 1.6 TB/s |
* Specifica preliminare, soggetta a modifiche
1. Specifica in Dense.
2. Prestazioni di picco con algoritmi di emulazione basati su tensor core.
| HGX B300 | HGX B200 | |
|---|---|---|
| Fattore di forma | 8x NVIDIA Blackwell Ultra SXM | 8x NVIDIA Blackwell SXM |
| FP4 Tensor Core<sup>1</sup> | 144 PFLOPS | 108 PFLOPS | 144 PFLOPS | 72 PFLOPS |
| FP8/FP6 Tensor Core<sup>2</sup> | 72 PFLOPS | 72 PFLOPS |
| INT8 Tensor Core<sup>2</sup> | 3 POPS | 72 POPS |
| FP16/BF16 Tensor Core<sup>2</sup> | 36 PFLOPS | 36 PFLOPS |
| TF32 Tensor Core<sup>2</sup> | 18 PFLOPS | 18 PFLOPS |
| FP32 | 600 TFLOPS | 600 TFLOPS |
| FP64/FP64 Tensor Core | 10 TFLOPS | 296 TFLOPS |
| Memoria totale | 2.1 TB | 1.4 TB |
| NVIDIA NVLink | Quinta generazione | Quinta generazione |
| NVIDIA NVLink Switch™ | NVLink 5 Switch | NVLink 5 Switch |
| Banda GPU-GPU NVSwitch | 1.8 TB/s | 1.8 TB/s |
| Banda NVLink totale | 14.4 TB/s | 14.4 TB/s |
| Networking Bandwidth | 1.6 TB/s | 0.8 TB/s |
| Attention Performance<sup>3</sup> | 2x | 1x |
1. Specifica in Sparse | Dense
2. Specifica in Sparse. Dense corrisponde alla metà della matrice spec mostrata.
3. rispetto a NVIDIA Blackwell.
Scopri di più sulla piattaforma NVIDIA Rubin.