Bastidor único NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72

Construyendo la próxima frontera de la IA

Descripción

Seis nuevos chips, un superordenador de IA

NVIDIA Vera Rubin NVL72 integra las tecnologías de vanguardia de NVIDIA: 72 unidades GPU Rubin, 36 CPU Vera, varias SuperNIC ConnectX®-9 y unidades DPU BlueField®-4. Realiza un escalamiento de la inteligencia en una plataforma a escala de bastidor con el conmutador NVIDIA NVLink™ 6 y un escalamiento horizontal con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para propulsar la revolución industrial de la IA a escala.

Basada en el diseño de bastidor NVIDIA MGX™ NVL72 de tercera generación, Vera Rubin NVL72 ofrece una transición fluida desde las generaciones anteriores. Proporciona entrenamiento de IA con una cuarta parte de las GPU e inferencia de IA a un coste por millón de tokens siete veces menor en comparación con NVIDIA Blackwell. Con diseños de bandejas modulares sin cables y soporte de más de 80 partners del ecosistema MGX, el superordenador de IA a escala de bastidor proporciona un rendimiento de clase mundial con una implementación rápida.

NVIDIA inicia la próxima generación de IA con Rubin: seis nuevos chips, un increíble superordenador de IA

La plataforma de última generación aumenta la escala de la adopción general, lo cual recorta el coste por token con cinco avances para los modelos de IA de razonamiento y de agentes.

Dentro de la plataforma NVIDIA Rubin: seis nuevos chips, un superordenador de IA

Al estar diseñada mediante un diseño conjunto extremo, NVIDIA Vera Rubin trata el centro de datos, no el chip, como la unidad de computación, lo que establece una nueva base para generar inteligencia a escala de forma eficiente, segura y predecible.

Rendimiento

Aumento enorme de eficiencia en el entrenamiento y la inferencia de IA

Aumentar la eficiencia del entrenamiento

NVIDIA Rubin entrena modelos de mezcla de expertos (MoE) con una cuarta parte de las GPU en la arquitectura NVIDIA Blackwell.

El rendimiento previsto está sujeto a cambios. Número de GPU basado en un modelo de mezcla de expertos (MoE) de 10 000 billones entrenado en 100 000 billones de tókenes en un periodo fijo de 1 mes.

El rendimiento de inferencia de LLM está sujeto a cambios. Coste por 1 millón de tokens basado en un modelo Kimi-K2-Thinking que utiliza 32K/8K ISL/OSL y compara Blackwell GB200 NVL72 y Rubin NVL72.

Reducción de costes de inferencia

NVIDIA Rubin tiene una décima parte del coste por millón de tokens en comparación con NVIDIA Blackwell para una IA altamente interactiva y de razonamiento profundo basada en agentes.

Avances tecnológicos

Dentro del superordenador de IA

GPU NVIDIA Rubin

Rubin GPU con HBM4 y Transformer Engine de tercera generación diseñadas para la próxima generación de IA.

CPU NVIDIA Vera

Las CPU Vera están diseñadas específicamente para el movimiento de datos y el razonamiento de agentes, lo que proporciona computación de alto ancho de banda y eficiencia energética con rendimiento determinista.

NVIDIA NVLink 6 Switch

Los conmutadores NVLink 6 cuentan con 3,6 terabytes por segundo (TB/s) de ancho de banda de todo a todo y escalable por GPU, lo que permite comunicaciones de alta velocidad de GPU a GPU para la IA.

NVIDIA ConnectX-9 SuperNIC

Las SuperNIC ConnectX‑9 proporcionan 1,6 terabits por segundo (Tb/s) de ancho de banda por GPU, con acceso remoto directo a memoria (RDMA) programable para redes directas de GPU de baja latencia y a escala masiva.

DPU NVIDIA BlueField-4

Las DPU BlueField-4 aceleran el procesamiento de datos en almacenamiento, redes, ciberseguridad y escalado elástico en fábricas de IA.

NVIDIA Spectrum-X Ethernet con óptica coempaquetada

Los conmutadores de escalado horizontal Spectrum‑X Ethernet con fotónica de silicio integrada ofrecen una eficiencia energética cinco veces mayor, una resiliencia de red 10 veces mayor y hasta 5 veces más tiempo de actividad que las redes tradicionales con transceptores enchufables.

Especificaciones¹

Especificaciones de NVIDIA Vera Rubin NVL72

  NVIDIA Vera Rubin NVL72 Superchip NVIDIA Vera Rubin GPU NVIDIA Rubin
Configuración 72 GPU NVIDIA Rubin | 36 CPU NVIDIA Vera 2 GPU Rubin | 1 CPU Vera 1 GPU Rubin
Inferencia NVFP4 3600 PFLOPS 100 PFLOPS 50 PFLOPS
Entrenamiento NVFP4 2520 PFLOPS 70 PFLOPS 35 PFLOPS
Entrenamiento FP8/FP6 1260 PFLOPS 35 PFLOPS 17,5 PFLOPS
INT8² denso 18 POPS 0,5 POPS 0,25 POPS
FP16/BF16² denso 288 PFLOPS 8 PETAFLOPS 4 PETAFLOPS
TF32² denso 144 PFLOPS 4 PETAFLOPS 2 PFLOPS
FP32 9360 TERAFLOPS 260 TERAFLOPS 130 TERAFLOPS
FP64 2400 TERAFLOPS 67 TFLOPS 33 TERAFLOPS
FP32 SGEMM³ 28 800 TERAFLOPS 800 TERAFLOPS 400 TERAFLOPS
FP64 DGEMM³ 14 400 TERAFLOPS 400 TERAFLOPS 200 TERAFLOPS
Memoria de la GPU | Ancho de banda 20,7 TB HBM4 | 1580 TB/s 576 GB HBM4 | 44 TB/s 288 GB HBM4 | 22 TB/s
Ancho de banda de NVLink 260 TB/s 7,2 TB/s 3,6 TB/s
Ancho de banda de NVLink-C2C 65 TB/s 1,8 TB/s -
Cantidad de núcleos de CPU 3168 núcleos NVIDIA Olympus personalizados (compatible con Arm) 88 núcleos NVIDIA Olympus personalizados (compatible con Arm) -
Memoria de la CPU 54 TB LPDDR5X 1,5 TB LPDDR5X -
Total de chips NVIDIA + HBM4 1296 30 12

1. Información preliminar, todos los valores están actualizados y sujetos a cambios
2. Especificación densa
3. Rendimiento máximo utilizando algoritmos de emulación basados en Tensor Core

Empezar

Manténgase al día sobre las noticias de NVIDIA

Suscríbase para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.