Infrastruttura IA per l'era degli agenti.
Panoramica
La piattaforma NVIDIA Vera Rubin è progettata per l'era dell'IA agentica e del ragionamento, concepita per padroneggiare la risoluzione di problemi multifase e flussi di lavoro massicci con contesti lunghi su vasta scala. Vera Rubin è un sistema POD multi-rack che riunisce cinque sistemi a livello di rack progettati appositamente in un unico supercomputer IA enorme e coerente. Eliminando i colli di bottiglia critici nella comunicazione e nel movimento della memoria, la piattaforma potenzia l'inferenza, offrendo più token per watt e un costo per token inferiore rispetto all'architettura NVIDIA Blackwell.
NVIDIA Vera Rubin NVL72 unifica le tecnologie all'avanguardia di NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX™-9 e DPU BlueField™-4. Aumenta l'intelligenza in una piattaforma a livello di rack di terza generazione con lo switch NVIDIA NVLink™ 6 e si espande con NVIDIA Quantum-X800 InfiniBand e Spectrum-X™ Ethernet per alimentare la rivoluzione industriale dell'IA su larga scala.
Vera Rubin NVL72 è dotato di un nuovo Transformer Engine con compressione adattiva per aumentare le prestazioni di inferenza NVFP4, NVIDIA Confidential Computing di terza generazione che estende la sicurezza all'intera piattaforma a livello di rack e un motore RAS di seconda generazione che offre resilienza a livello di rack.
Il rack CPU NVIDIA Vera offre un'infrastruttura CPU densa e raffreddata a liquido progettata appositamente per l'apprendimento per rinforzo e l'IA agentica su larga scala. Basato sull'architettura di riferimento modulare NVIDIA MGX™ ogni rack integra 256 CPU NVIDIA Vera e supporta più di 22.500 ambienti sandbox simultanei, offrendo alle fabbriche IA una capacità CPU scalabile e ad alta efficienza energetica per le chiamate di strumenti, la valutazione, l'elaborazione dei dati e l'orchestrazione.
NVIDIA Groq 3 LPX è l'acceleratore di inferenza per NVIDIA Vera Rubin, progettato per soddisfare le esigenze di bassa latenza e contesti ampi dei sistemi agentici. Combinando le GPU Rubin per la memoria ad alta larghezza di banda (HBM) e le LPU per la memoria statica ad accesso casuale (SRAM), NVIDIA Vera Rubin con LPX offre una nuova classe di prestazioni di inferenza per modelli da mille miliardi di parametri e contesti da un milione di token.
NVIDIA Vera BlueField-4 STX è una base modulare per soluzioni di storage native IA su scala rack. Integrando NVIDIA Vera Rubin, il processore di storage BlueField-4 STX, la rete Spectrum-X e il software NVIDIA AI, ottimizza l'intero ciclo di vita dei dati, dall'analisi dei dati all'addestramento dei modelli e ai flussi di lavoro completi di IA agentica su larga scala.
Spectrum-6 SPX Ethernet è progettato per accelerare la rete nelle fabbriche IA. Configurabile con switch NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, offre connettività rack-to-rack a bassa latenza e ad alto throughput su larga scala.
Leggi questo approfondimento tecnico per scoprire come NVIDIA Vera Rubin considera il data center come unità di calcolo, e non il chip, stabilendo una nuova base per produrre intelligenza su larga scala in modo efficiente, sicuro e prevedibile.