Panoramica
I modelli di IA per agenti e di ragionamento stanno ridefinendo i limiti del calcolo. Ma per sfruttare appieno queste innovazioni, le aziende hanno bisogno di un'infrastruttura in grado di ragionare internamente e passare rapidamente informazioni tra modelli e agenti. L'infrastruttura deve gestire in modo efficiente in termini di costi la comunicazione, il coordinamento, il movimento della memoria e la latenza durante l'addestramento, il post-addestramento e l'inferenza.
NVIDIA DGX™ Rubin NVL8 offre un modello per il successo nell'era dell'IA per agenti. Basata sull'architettura NVIDIA Rubin, DGX Rubin NVL8 è una soluzione di infrastruttura chiavi in mano appositamente progettata per accelerare qualsiasi carico di lavoro IA e fornire intelligenza su larga scala.
Funzionalità
Alimentati da otto GPU NVIDIA Rubin, i sistemi DGX Rubin NVL8 offrono 400 petaFLOPS di prestazioni di inferenza e 160 terabyte per secondo (TB/s) di memoria ad alta larghezza di banda (HBM), garantendo il trasporto dei dati nell'infrastruttura il più rapidamente possibile. DGX Rubin NVL8 sfrutta NVIDIA NVLink™ di sesta generazione per garantire una comunicazione peer-to-peer fluida per un parallelismo massiccio per i modelli.
DGX Rubin NVL8 migliora notevolmente la redditività economica ottimizzando le prestazioni per tutto il ciclo di vita dell'IA. È dotato di un motore multi-agente specializzato per il ragionamento dei flussi di lavoro e un motore di apprendimento per rinforzo dedicato che ottimizza il movimento della memoria nell'hardware, offrendo un apprendimento per rinforzo fino a 3 volte più veloce rispetto ai sistemi basati su NVIDIA Blackwell.
NVIDIA Mission Control™ accelera ogni aspetto delle operazioni, dalla configurazione di DGX Rubin NVL8 all'integrazione con le strutture alla gestione di cluster e carichi di lavoro. Grazie a un software intelligente e integrato, le aziende ottengono il controllo sugli eventi di raffreddamento e alimentazione per ridefinire la resilienza dell'infrastruttura.
Creata da zero per l'IA aziendale, la piattaforma NVIDIA DGX, con NVIDIA DGX SuperPOD, combina i migliori software, infrastrutture e competenze NVIDIA in una soluzione di sviluppo IA moderna e unificata.
Specifiche
| GPU | 8 GPU NVIDIA Rubin |
| Memoria GPU totale | Larghezza di banda | 2,3 TB | 160 TB/s |
| Prestazioni | NVFP4 Inference: 400 PF NVFP4 Training: 280 PF FP8/FP6 Training: 140 PF |
| CPU | 2x processori Intel® Xeon® 6776P |
| Sistema NVIDIA NVLink Switch | 4X |
| Larghezza di banda NVIDIA NVLink | 28,8 TB/s Larghezza di banda totale |
| Consumo energetico del sistema | ~24 kW |
| Networking | 8 porte OSFP che servono 8 VPI NVIDIA® ConnectX®-9 a porta singola
|
| Software | NVIDIA DGX OS, Ubuntu, Red Hat Enterprise Linux, Rocky |
|
Specifiche soggette a modifiche. |
|
Offerte
Parla con un esperto NVIDIA di NVIDIA DGX Rubin NVL8.
Scopri perché NVIDIA DGX è lo standard collaudato su cui si basa l'IA aziendale.
Sblocca tutto il potenziale dell'IA con opzioni di distribuzione flessibili, da soluzioni on-premises a soluzioni in hosting.