Piattaforma NVIDIA Vera Rubin

Piattaforma NVIDIA Vera Rubin

Dare forma alla nuova generazione dell'IA.

Panoramica

Verso l'era dell'IA agentica

La piattaforma NVIDIA Vera Rubin è progettata per l'era dell'IA e del ragionamento agentici, ingegnerizzata per padroneggiare la risoluzione di problemi multifase e workflow massicci a lungo contesto su vasta scala. Eliminando i colli di bottiglia critici nella comunicazione e nel movimento della memoria, la piattaforma potenzia l'inferenza per offrire più token per watt e un costo per token inferiore rispetto alla generazione dell'architettura NVIDIA Blackwell.

NVIDIA dà il via alla nuova generazione di IA con Rubin

Presentazione della piattaforma NVIDIA Vera Rubin. Sette nuovi chip, un incredibile supercomputer IA.

NVIDIA Vera Rubin apre la nuova frontiera dell'IA

La piattaforma NVIDIA Vera Rubin include sette nuovi chip in piena produzione per scalare le fabbriche IA più grandi al mondo.

Guarda all'interno delle innovazioni tecnologiche

Transformer Engine

La GPU Rubin è dotata di un nuovo Transformer Engine (TE) con compressione adattiva accelerata da hardware per aumentare le prestazioni NVFP4, preservando l'accuratezza. Ciò consente fino a 50 petaFLOPS di inferenza NVFP4. Completamente compatibile con NVIDIA Blackwell, il Transformer Engine garantisce aggiornamenti in tutta facilità e consente ai codici precedentemente ottimizzati di passare senza problemi alla piattaforma Vera Rubin.

Confidential Computing di terza generazione

La terza generazione di NVIDIA Confidential Computing espande la sicurezza a livello di rack con NVIDIA Vera Rubin NVL72. Questa piattaforma crea un ambiente di esecuzione unificato e affidabile su tutte le 36 CPU NVIDIA Vera e le 72 GPU NVIDIA Rubin, con il fabric NVIDIA NVLink™ a fare da collegamento. La piattaforma mantiene la sicurezza dei dati nei domini di CPU, GPU e NVLink. Grazie a servizi di attestazione per la prova crittografica di conformità, è in grado di combinare una scalabilità massiccia con una protezione senza compromessi al fine di proteggere i modelli proprietari, i dati dell'addestramento e i carichi di lavoro di inferenza più grandi al mondo.

NVLink di sesta generazione e Switch NVLink

NVLink di sesta generazione rapprensenta un grande passo avanti per il fabric di interconnessione GPU ad alta velocità di NVIDIA, che unifica 72 GPU NVIDIA Rubin in un unico dominio di prestazioni. Raddoppiando le prestazioni di NVIDIA Blackwell, Rubin GPU offre 3,6 terabyte al secondo (TB/s) di larghezza di banda per le GPU e 260 TB/s di connettività a bassa latenza per facilitare una comunicazione più rapida. In combinazione con NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™, che riduce la congestione di rete fino al 50% per le operazioni collettive, questa interconnessione di nuova generazione accelera l'addestramento e l'inferenza per i modelli più grandi del mondo, su larga scala e senza compromessi.

Motore RAS (Reliability, Availability, Serviceability) di seconda generazione

La piattaforma NVIDIA Vera Rubin offre resilienza su larga scala con funzionalità di affidabilità avanzate. Le GPU NVIDIA Rubin hanno un motore RAS dedicato di seconda generazione per la manutenzione proattiva e i controlli dello stato in tempo reale senza tempi di inattività, Le CPU NVIDIA Vera aggiungono una maggiore manutenibilità grazie ai moduli di memoria small-outline compression-attached memory modules (SOCAMM) LPDDR5X e ai test in-system per i core della CPU. Il rack presenta design di vassoi modulari e senza cavi per un assemblaggio e una manutenzione 18 volte più veloci rispetto a NVIDIA Blackwell, oltre a una resilienza intelligente e a un routing NVLink software-defined a garantire il funzionamento continuo e ridurre i costi di manutenzione.

CPU NVIDIA Vera

La CPU NVIDIA Vera è progettata per il movimento di dati e il ragionamento agentico nei sistemi accelerati, con supporto completo per il calcolo riservato. Si abbina perfettamente alle GPU NVIDIA ed è anche in grado di operare in modo indipendente per carichi di lavoro di analisi, cloud, orchestrazione, storage e calcolo ad alte prestazioni (HPC). Vera combina 88 core NVIDIA, fino a 1,2 TB/s di larghezza di banda di memoria LPDDR5X e NVIDIA Scalable Coherency Fabric, per fornire prestazioni prevedibili e a risparmio energetico per carichi di lavoro ad alta intensità di dati e memoria con piena compatibilità con Arm®. La connettività NVIDIA NVLink-C2C integrata consente un accesso coerente alla memoria CPU-GPU ad alta larghezza di banda per massimizzare l'utilizzo e l'efficienza del sistema.

Esplora i prodotti NVIDIA Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, schede NVIDIA ConnectX®-9 SuperNIC™ e DPU NVIDIA BlueField®-4, e si affianca ai rack NVIDIA LPX in un data center per un'inferenza rapida e a bassa latenza. Consente di aumentare l'intelligenza in una piattaforma a livello di rack con NVLink di sesta generazione e NVLink switch ed è espandibile tramite NVIDIA Quantum-X800 InfiniBand e NVIDIA Spectrum-X™ Ethernet per alimentare la rivoluzione industriale IA su larga scala.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX è l'acceleratore di inferenza per NVIDIA Vera Rubin, progettato per soddisfare le esigenze di bassa latenza e contesto di grandi dimensioni dei sistemi agentici. Vera Rubin e LPX uniscono le prestazioni estreme delle GPU e delle LPU NVIDIA Rubin attraverso un'architettura co-progettata. LPX è dotato di 256 LPU con SRAM da 128 GB, larghezza di banda di memoria da 40 PB/s e larghezza di banda scale-up da 640 TB/s per rack.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 offre alle aziende una soluzione di infrastruttura IA chiavi in mano e pronta all'uso basata sulla piattaforma NVIDIA Vera Rubin. È progettata appositamente per essere distribuita su larga scala per accelerare i modelli IA più complessi.

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 integra otto GPU NVIDIA Rubin con le interconnessioni NVLink ad alta velocità di sesta generazione per portare i data center nella nuova era del calcolo accelerato e dell'IA generativa.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 è un sistema IA raffreddato a liquido basato su otto GPU NVIDIA Rubin e NVLink di sesta generazione. È progettato appositamente per accelerare l'addestramento, l'inferenza e il post-addestramento per ogni carico di lavoro IA.

Dentro alla piattaforma NVIDIA Vera Rubin

Leggi questo approfondimento tecnico per scoprire come NVIDIA Vera Rubin considera il data center come unità di calcolo, e non il chip, stabilendo una nuova base per produrre intelligenza su larga scala in modo efficiente, sicuro e prevedibile.