Piattaforma NVIDIA Vera Rubin

Piattaforma NVIDIA Vera Rubin

Infrastruttura IA per l'era degli agenti.

Panoramica

Verso l'era dell'IA agentica

La piattaforma NVIDIA Vera Rubin è progettata per l'era dell'IA agentica e del ragionamento, concepita per padroneggiare la risoluzione di problemi multifase e flussi di lavoro massicci con contesti lunghi su vasta scala. Vera Rubin è un sistema POD multi-rack che riunisce cinque sistemi a livello di rack progettati appositamente in un unico supercomputer IA enorme e coerente. Eliminando i colli di bottiglia critici nella comunicazione e nel movimento della memoria, la piattaforma potenzia l'inferenza, offrendo più token per watt e un costo per token inferiore rispetto all'architettura NVIDIA Blackwell.

NVIDIA Vera Rubin entra in piena produzione per alimentare le fabbriche di IA agentica in tutto il mondo

NVIDIA Vera Rubin è entrata in piena produzione, con i principali produttori di server di Taiwan e i leader globali della supply chain che producono e spediscono sistemi basati su Vera Rubin su larga scala, alimentando i laboratori IA, i fornitori di cloud e gli hyperscaler per creare l'intelligenza di domani.

NVIDIA Vera Rubin apre la nuova frontiera dell'IA

La piattaforma NVIDIA Vera Rubin include sette nuovi chip in piena produzione per scalare le fabbriche IA più grandi al mondo.

Guarda all'interno della piattaforma Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica le tecnologie all'avanguardia di NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX™-9 e DPU BlueField™-4. Aumenta l'intelligenza in una piattaforma a livello di rack di terza generazione con lo switch NVIDIA NVLink™ 6 e si espande con NVIDIA Quantum-X800 InfiniBand e Spectrum-X™ Ethernet per alimentare la rivoluzione industriale dell'IA su larga scala.

Vera Rubin NVL72 è dotato di un nuovo Transformer Engine con compressione adattiva per aumentare le prestazioni di inferenza NVFP4, NVIDIA Confidential Computing di terza generazione che estende la sicurezza all'intera piattaforma a livello di rack e un motore RAS di seconda generazione che offre resilienza a livello di rack.

CPU NVIDIA Vera

Il rack CPU NVIDIA Vera offre un'infrastruttura CPU densa e raffreddata a liquido progettata appositamente per l'apprendimento per rinforzo e l'IA agentica su larga scala. Basato sull'architettura di riferimento modulare NVIDIA MGX™ ogni rack integra 256 CPU NVIDIA Vera e supporta più di 22.500 ambienti sandbox simultanei, offrendo alle fabbriche IA una capacità CPU scalabile e ad alta efficienza energetica per le chiamate di strumenti, la valutazione, l'elaborazione dei dati e l'orchestrazione.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX è l'acceleratore di inferenza per NVIDIA Vera Rubin, progettato per soddisfare le esigenze di bassa latenza e contesti ampi dei sistemi agentici. Combinando le GPU Rubin per la memoria ad alta larghezza di banda (HBM) e le LPU per la memoria statica ad accesso casuale (SRAM), NVIDIA Vera Rubin con LPX offre una nuova classe di prestazioni di inferenza per modelli da mille miliardi di parametri e contesti da un milione di token.

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX è una base modulare per soluzioni di storage native IA su scala rack. Integrando NVIDIA Vera Rubin, il processore di storage BlueField-4 STX, la rete Spectrum-X e il software NVIDIA AI, ottimizza l'intero ciclo di vita dei dati, dall'analisi dei dati all'addestramento dei modelli e ai flussi di lavoro completi di IA agentica su larga scala.

NVIDIA Spectrum-6 SPX Ethernet

Spectrum-6 SPX Ethernet è progettato per accelerare la rete nelle fabbriche IA. Configurabile con switch NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, offre connettività rack-to-rack a bassa latenza e ad alto throughput su larga scala.

Esplora i prodotti NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72 fornisce alle aziende una soluzione di infrastruttura IA chiavi in mano e pronta alla distribuzione basata sulla piattaforma NVIDIA Vera Rubin. È progettato appositamente per la distribuzione su larga scala per accelerare i modelli IA più complessi.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 è un sistema IA raffreddato a liquido basato su otto GPU NVIDIA Rubin e NVLink di sesta generazione. È progettato appositamente per accelerare l'addestramento, l'inferenza e il post-addestramento per ogni carico di lavoro IA.

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 integra otto GPU NVIDIA Rubin con le interconnessioni NVLink ad alta velocità di sesta generazione per portare i data center nella nuova era del calcolo accelerato e dell'IA generativa. NVIDIA HGX Rubin NVL8 può essere usato in combinazione con le CPU NVIDIA Vera o con le schede di base per CPU basate su x86.

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4 sblocca la ricerca scientifica automatizzata e l'IA agentica attraverso un bridge che collega quattro GPU NVIDIA Rubin a due CPU NVIDIA Vera su NVLink-C2C. Compatibile con i server NVIDIA MGX raffreddati a liquido, offre prestazioni fino a 4 volte superiori per le simulazioni scientifiche, 6 volte superiori per la formazione IA-for-Science e 8 volte superiori per l'inferenza rispetto a Hopper.

Dentro alla piattaforma NVIDIA Vera Rubin

Leggi questo approfondimento tecnico per scoprire come NVIDIA Vera Rubin considera il data center come unità di calcolo, e non il chip, stabilendo una nuova base per produrre intelligenza su larga scala in modo efficiente, sicuro e prevedibile.