Piattaforma NVIDIA Rubin

Piattaforma NVIDIA Rubin

Dare forma alla nuova generazione dell'IA.

Panoramica

Verso l'era dell'IA agentica

La piattaforma NVIDIA Rubin è progettata per l'era dell'IA e del ragionamento agentici, per gestire la risoluzione di problemi multifase e flussi di lavoro massicci e a lungo contesto. Eliminando i colli di bottiglia critici nella comunicazione e nel movimento della memoria, la piattaforma Rubin potenzia l'inferenza, offrendo più token per watt e riducendo i costi per token rispetto alla generazione NVIDIA Blackwell.

NVIDIA dà il via alla nuova generazione dell'IA con Rubin: sei nuovi chip e un incredibile supercomputer

La piattaforma all'avanguardia scala l'adozione mainstream, riducendo i costi per token con cinque innovazioni per il ragionamento e i modelli di IA per agenti.

Guarda all'interno delle innovazioni tecnologiche

Transformer Engine

La piattaforma Rubin è dotata di un nuovo Transformer Engine con compressione adattiva accelerata da hardware per aumentare le prestazioni NVFP4 senza compromettere la precisione, offrendo fino a 50 petaFLOPS di inferenza NVFP4. Completamente compatibile con NVIDIA Blackwell, Transformer Engine garantisce aggiornamenti in tutta facilità, consentendo un facile passaggio dei codici precedentemente ottimizzati alla piattaforma Rubin.

Confidential Computing di terza generazione

La terza generazione di NVIDIA Confidential Computing espande la sicurezza a livello di rack con NVIDIA Vera Rubin NVL72. Questa piattaforma crea un ambiente di esecuzione unificato e affidabile su tutte le 36 CPU NVIDIA Vera e le 72 GPU NVIDIA Rubin, con il fabric NVIDIA NVLink™ a fare da collegamento. La piattaforma mantiene la sicurezza dei dati nei domini di CPU, GPU e NVLink. Grazie a servizi di attestazione per la prova crittografica di conformità, è in grado di combinare una scalabilità massiccia con una protezione senza compromessi al fine di proteggere i modelli proprietari, i dati dell'addestramento e i carichi di lavoro di inferenza più grandi al mondo.

NVLink di sesta generazione e Switch NVLink

NVLink di sesta generazione rapprensenta un grande passo avanti per il fabric di interconnessione GPU ad alta velocità di NVIDIA, che unifica 72 GPU NVIDIA Rubin in un unico dominio di prestazioni. Raddoppiando le prestazioni di NVIDIA Blackwell, Rubin offre 3,6 terabyte al secondo (TB/s) di larghezza di banda per le GPU e 260 TB/s di connettività a bassa latenza per facilitare una comunicazione più rapida. In combinazione con NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™, che riduce la congestione di rete fino al 50% per le operazioni collettive, questa interconnessione di nuova generazione accelera l'addestramento e l'inferenza per i modelli più grandi del mondo, su larga scala e senza compromessi.

Motore RAS (Reliability, Availability, Serviceability) di seconda generazione

La piattaforma NVIDIA Rubin offre resilienza su larga scala con funzionalità di affidabilità avanzate. Le GPU NVIDIA Rubin sono dotate di un motore RAS dedicato di seconda generazione per la manutenzione proattiva e i controlli dello stato in tempo reale senza tempi di inattività, mentre le CPU NVIDIA Vera offrono una maggiore manutenibilità con SOCAMM LPDDR5X e i test nel sistema per i core CPU. Il rack presenta design di vassoi modulari e senza cavi per un assemblaggio e una manutenzione 18 volte più veloci rispetto a NVIDIA Blackwell, oltre a una resilienza intelligente e a un routing NVLink software-defined a garantire il funzionamento continuo e ridurre i costi di manutenzione.

CPU NVIDIA Vera

La CPU NVIDIA Vera è progettata per il movimento di dati e il ragionamento agentico nei sistemi accelerati, con supporto completo per il calcolo riservato. Si abbina perfettamente alle GPU NVIDIA ed è anche in grado di operare in modo indipendente per carichi di lavoro di analisi, cloud, orchestrazione, storage e calcolo ad alte prestazioni (HPC). Vera combina 88 core progettati da NVIDIA, fino a 1,2 TB/s di larghezza di banda di memoria LPDDR5X e NVIDIA Scalable Coherency Fabric per fornire prestazioni prevedibili e a risparmio energetico per carichi di lavoro ad alta intensità di dati e di memoria con piena compatibilità con Arm®. La connettività NVLink-C2C integrata consente un accesso coerente alla memoria CPU-GPU ad alta larghezza di banda per massimizzare l'utilizzo e l'efficienza del sistema.

Esplora i prodotti NVIDIA Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 riunisce 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, SuperNIC NVIDIA ConnectX®-9 e DPU NVIDIA BlueField®-4. Consente di aumentare l'intelligenza in una piattaforma a livello di rack con NVLink di sesta generazione e NVLink switch ed è espandibile tramite NVIDIA Quantum-X800 InfiniBand e NVIDIA Spectrum-X™ Ethernet per alimentare la rivoluzione industriale IA su larga scala.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 offre alle aziende una soluzione di infrastruttura IA chiavi in mano e pronta all'uso basata su una piattaforma NVIDIA Rubin, progettata appositamente per essere distribuita su larga scala per accelerare i modelli IA più complessi.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 è un sistema IA raffreddato a liquido alimentato da otto GPU NVIDIA Rubin e NVLink di sesta generazione, progettato appositamente per accelerare l'addestramento, l'inferenza e il post-addestramento per ogni carico di lavoro IA.

Dentro la piattaforma NVIDIA Rubin: sei nuovi chip, un supercomputer IA

Leggi questo approfondimento tecnico per scoprire come NVIDIA Vera Rubin considera il data center, e non il chip, come unità di calcolo, stabilendo una nuova base per produrre intelligenza su larga scala in modo efficiente, sicuro e prevedibile.