Bastidor único NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72

Construyendo la próxima frontera de la IA.

Descripción

Siete nuevos chips, un superordenador de IA

NVIDIA Vera Rubin NVL72 unifica las tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX®-9 y DPU BlueField®-4. Aumente la inteligencia en una plataforma a escala de bastidor con el conmutador NVIDIA NVLink 6 y se escala con NVIDIA Quantum-X800 InfiniBand y Spectrum-X Ethernet para impulsar la revolución industrial de la IA a escala. Cuando se implementa con los bastidores NVIDIA Groq 3 LPX, Vera Rubin NVL72 proporciona un nuevo nivel de rendimiento en inferencia para modelos con un billón de parámetros y un contexto con millones de tókenes.

Vera Rubin NVL72 se basa en el diseño de bastidor NVIDIA MGX™ NVL72 de tercera generación, lo que ofrece una transición fluida desde las generaciones anteriores. Proporciona entrenamiento de IA con una cuarta parte de las GPU e inferencia de IA a una décima parte del coste por millón de tokens en comparación con NVIDIA Blackwell. Con diseños de bandejas modulares sin cables y soporte de más de 80 partners del ecosistema MGX, el superordenador de IA a escala de bastidor proporciona un rendimiento de clase mundial con una implementación rápida.

NVIDIA inicia la próxima generación de IA con Rubin

La plataforma de vanguardia aumenta la escala de la adopción general, lo cual recorta el coste por token con cinco avances para los modelos de IA de razonamiento y de agentes.

NVIDIA Vera Rubin derriba la frontera de la IA de agentes

La plataforma NVIDIA Vera Rubin ofrece siete nuevos chips, ya en producción completa, para escalar las fábricas de IA más grandes del mundo.

Rendimiento

Aumento enorme de eficiencia en el entrenamiento y la inferencia de IA

Aumentar la eficiencia del entrenamiento

NVIDIA Rubin entrena modelos de mezcla de expertos (MoE) con una cuarta parte de las GPU en la arquitectura NVIDIA Blackwell.

El rendimiento previsto está sujeto a cambios. Número de GPU basado en un modelo de mezcla de expertos (MoE) de 10 000 billones entrenado en 100 000 billones de tókenes en un periodo fijo de 1 mes.

El rendimiento de inferencia de LLM está sujeto a cambios. Costo por 1 millón de tokens basado en el modelo Kimi-K2-Thinking que utiliza 32K/8K ISL/OSL y compara Blackwell NVL72 y Rubin NVL72.

Reducción de costes de inferencia

NVIDIA Rubin tiene una décima parte del coste por millón de tokens en comparación con NVIDIA Blackwell para una IA altamente interactiva y de razonamiento profundo basada en agentes.

Avances tecnológicos

Dentro del superordenador de IA

GPU NVIDIA Rubin

Rubin GPU con HBM4 y Transformer Engine de tercera generación diseñadas para la próxima generación de IA.

CPU NVIDIA Vera

Las CPU Vera están diseñadas específicamente para el movimiento de datos y el razonamiento de agentes, lo que proporciona computación de alto ancho de banda y eficiencia energética con rendimiento determinista.

NVIDIA NVLink 6 Switch

Los conmutadores NVLink 6 cuentan con 3,6 terabytes por segundo (TB/s) de ancho de banda de todo a todo y escalable por GPU, lo que permite comunicaciones de alta velocidad de GPU a GPU para la IA.

NVIDIA ConnectX-9 SuperNIC

Las SuperNIC ConnectX‑9 proporcionan 1,6 terabits por segundo (Tb/s) de ancho de banda por GPU, con acceso remoto directo a memoria (RDMA) programable para redes directas de GPU de baja latencia y a escala masiva.

DPU NVIDIA BlueField-4

Las DPU BlueField-4 aceleran el procesamiento de datos en almacenamiento, redes, ciberseguridad y escalado elástico en fábricas de IA.

NVIDIA Spectrum-X Ethernet con óptica coempaquetada

Los conmutadores de escalado horizontal Spectrum‑X Ethernet con fotónica de silicio integrada ofrecen una eficiencia energética cinco veces mayor, una resiliencia de red 10 veces mayor y hasta 5 veces más tiempo de actividad que las redes tradicionales con transceptores enchufables.

LPU NVIDIA Groq 3

Este es el acelerador de inferencia para NVIDIA Vera Rubin NVL72, diseñado para satisfacer las exigencias de baja latencia y gran contexto de los sistemas de agentes. El bastidor de NVIDIA Groq 3 LPX cuenta con 256 LPU con 128 GB de SRAM, 40 PB/s de ancho de banda de memoria y 640 TB/s de ancho de banda de escalado vertical por bastidor. Está diseñada conjuntamente con Vera Rubin NVL72 para ofrecer un rendimiento de inferencia por vatio 35 veces superior y una oportunidad de ingresos hasta 10 veces superior para modelos de billones de parámetros en comparación con Blackwell.

Especificaciones¹

Especificaciones de NVIDIA Vera Rubin NVL72

  NVIDIA Vera Rubin NVL72 Superchip NVIDIA Vera Rubin GPU NVIDIA Rubin
Configuración 72 GPU NVIDIA Rubin | 36 CPU NVIDIA Vera 2 GPU Rubin | 1 CPU Vera 1 GPU Rubin
Inferencia NVFP4 3600 PFLOPS 100 PFLOPS 50 PFLOPS
Entrenamiento NVFP4² 2520 PFLOPS 70 PFLOPS 35 PFLOPS
Entrenamiento FP8/FP6² 1260 PFLOPS 35 PFLOPS 17,5 PFLOPS
INT8² denso 18 POPS 0,5 POPS 0,25 POPS
FP16/BF16² denso 288 PFLOPS 8 PETAFLOPS 4 PETAFLOPS
TF32² denso 144 PFLOPS 4 PETAFLOPS 2 PFLOPS
FP32 9360 TERAFLOPS 260 TERAFLOPS 130 TERAFLOPS
FP64 2400 TERAFLOPS 67 TFLOPS 33 TERAFLOPS
FP32 SGEMM³ 28 800 TERAFLOPS 800 TERAFLOPS 400 TERAFLOPS
FP64 DGEMM³ 14 400 TERAFLOPS 400 TERAFLOPS 200 TERAFLOPS
Memoria de la GPU | Ancho de banda 20,7 TB HBM4 | 1580 TB/s 576 GB HBM4 | 44 TB/s 288 GB HBM4 | 22 TB/s
Ancho de banda de NVLink 260 TB/s 7,2 TB/s 3,6 TB/s
Ancho de banda de NVLink-C2C 65 TB/s 1,8 TB/s -
Cantidad de núcleos de CPU 3168 núcleos NVIDIA Olympus personalizados (compatible con Arm) 88 núcleos NVIDIA Olympus personalizados (compatible con Arm) -
Memoria de la CPU 54 TB LPDDR5X 1,5 TB LPDDR5X -
Total de chips NVIDIA + HBM4 1296 30 12

1. Información preliminar, todos los valores están actualizados y sujetos a cambios
2. Especificación densa
3. Rendimiento máximo utilizando algoritmos de emulación basados en Tensor Core

Empezar

Manténgase al día sobre las noticias de NVIDIA

Suscríbase para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.