NVIDIA Vera Rubin NVL72

Construyendo la próxima frontera de la IA.

Descripción

Siete nuevos chips, un superordenador de IA

NVIDIA Vera Rubin NVL72 unifica las tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX®-9 y DPU BlueField®-4. Aumente la inteligencia en una plataforma a escala de bastidor con el conmutador NVIDIA NVLink 6 y se escala con NVIDIA Quantum-X800 InfiniBand y Spectrum-X Ethernet para impulsar la revolución industrial de la IA a escala. Cuando se implementa con los bastidores NVIDIA Groq 3 LPX, Vera Rubin NVL72 proporciona un nuevo nivel de rendimiento en inferencia para modelos con un billón de parámetros y un contexto con millones de tókenes.

Vera Rubin NVL72 se basa en el diseño de bastidor NVIDIA MGX™ NVL72 de tercera generación, lo que ofrece una transición fluida desde las generaciones anteriores. Proporciona entrenamiento de IA con una cuarta parte de las GPU e inferencia de IA a una décima parte del coste por millón de tokens en comparación con NVIDIA Blackwell. Con diseños de bandejas modulares sin cables y soporte de más de 80 partners del ecosistema MGX, el superordenador de IA a escala de bastidor proporciona un rendimiento de clase mundial con una implementación rápida.

NVIDIA inicia la próxima generación de IA con Rubin

La plataforma de vanguardia aumenta la escala de la adopción general, lo cual recorta el coste por token con cinco avances para los modelos de IA de razonamiento y de agentes.

Leer la nota de prensa

NVIDIA Vera Rubin derriba la frontera de la IA de agentes

La plataforma NVIDIA Vera Rubin ofrece siete nuevos chips, ya en producción completa, para escalar las fábricas de IA más grandes del mundo.

Leer la nota de prensa

Rendimiento

Aumento enorme de eficiencia en el entrenamiento y la inferencia de IA

Aumentar la eficiencia del entrenamiento

NVIDIA Rubin entrena modelos de mezcla de expertos (MoE) con una cuarta parte de las GPU en la arquitectura NVIDIA Blackwell.

El rendimiento previsto está sujeto a cambios. Número de GPU basado en un modelo de mezcla de expertos (MoE) de 10 000 billones entrenado en 100 000 billones de tókenes en un periodo fijo de 1 mes.

El rendimiento de inferencia de LLM está sujeto a cambios. Costo por 1 millón de tokens basado en el modelo Kimi-K2-Thinking que utiliza 32K/8K ISL/OSL y compara Blackwell NVL72 y Rubin NVL72.

Reducción de costes de inferencia

NVIDIA Rubin tiene una décima parte del coste por millón de tokens en comparación con NVIDIA Blackwell para una IA altamente interactiva y de razonamiento profundo basada en agentes.

Avances tecnológicos

Dentro del superordenador de IA

GPU NVIDIA Rubin

Rubin GPU con HBM4 y Transformer Engine de tercera generación diseñadas para la próxima generación de IA.

Más información

CPU NVIDIA Vera

Las CPU Vera están diseñadas específicamente para el movimiento de datos y el razonamiento de agentes, lo que proporciona computación de alto ancho de banda y eficiencia energética con rendimiento determinista.

Más información

NVIDIA NVLink 6 Switch

Los conmutadores NVLink 6 cuentan con 3,6 terabytes por segundo (TB/s) de ancho de banda de todo a todo y escalable por GPU, lo que permite comunicaciones de alta velocidad de GPU a GPU para la IA.

Más información

NVIDIA ConnectX-9 SuperNIC

Las SuperNIC ConnectX‑9 proporcionan 1,6 terabits por segundo (Tb/s) de ancho de banda por GPU, con acceso remoto directo a memoria (RDMA) programable para redes directas de GPU de baja latencia y a escala masiva.

Más información

DPU NVIDIA BlueField-4

Las DPU BlueField-4 aceleran el procesamiento de datos en almacenamiento, redes, ciberseguridad y escalado elástico en fábricas de IA.

Más información

NVIDIA Spectrum-X Ethernet con óptica coempaquetada

Los conmutadores de escalado horizontal Spectrum‑X Ethernet con fotónica de silicio integrada ofrecen una eficiencia energética cinco veces mayor, una resiliencia de red 10 veces mayor y hasta 5 veces más tiempo de actividad que las redes tradicionales con transceptores enchufables.

Más información

LPU NVIDIA Groq 3

Este es el acelerador de inferencia para NVIDIA Vera Rubin NVL72, diseñado para satisfacer las exigencias de baja latencia y gran contexto de los sistemas de agentes. El bastidor de NVIDIA Groq 3 LPX cuenta con 256 LPU con 128 GB de SRAM, 40 PB/s de ancho de banda de memoria y 640 TB/s de ancho de banda de escalado vertical por bastidor. Está diseñada conjuntamente con Vera Rubin NVL72 para ofrecer un rendimiento de inferencia por vatio 35 veces superior y una oportunidad de ingresos hasta 10 veces superior para modelos de billones de parámetros en comparación con Blackwell.

Más información

Especificaciones¹

Especificaciones de NVIDIA Vera Rubin NVL72

	NVIDIA Vera Rubin NVL72	Superchip NVIDIA Vera Rubin	GPU NVIDIA Rubin
Configuración	72 GPU NVIDIA Rubin \| 36 CPU NVIDIA Vera	2 GPU Rubin \| 1 CPU Vera	1 GPU Rubin
Inferencia NVFP4	3600 PFLOPS	100 PFLOPS	50 PFLOPS
Entrenamiento NVFP4²	2520 PFLOPS	70 PFLOPS	35 PFLOPS
Entrenamiento FP8/FP6²	1260 PFLOPS	35 PFLOPS	17,5 PFLOPS
INT8² denso	18 POPS	0,5 POPS	0,25 POPS
FP16/BF16² denso	288 PFLOPS	8 PETAFLOPS	4 PETAFLOPS
TF32² denso	144 PFLOPS	4 PETAFLOPS	2 PFLOPS
FP32	9360 TERAFLOPS	260 TERAFLOPS	130 TERAFLOPS
FP64	2400 TERAFLOPS	67 TFLOPS	33 TERAFLOPS
FP32 SGEMM³	28 800 TERAFLOPS	800 TERAFLOPS	400 TERAFLOPS
FP64 DGEMM³	14 400 TERAFLOPS	400 TERAFLOPS	200 TERAFLOPS
Memoria de la GPU \| Ancho de banda	20,7 TB HBM4 \| 1580 TB/s	576 GB HBM4 \| 44 TB/s	288 GB HBM4 \| 22 TB/s
Ancho de banda de NVLink	260 TB/s	7,2 TB/s	3,6 TB/s
Ancho de banda de NVLink-C2C	65 TB/s	1,8 TB/s	-
Cantidad de núcleos de CPU	3168 núcleos NVIDIA Olympus personalizados (compatible con Arm)	88 núcleos NVIDIA Olympus personalizados (compatible con Arm)	-
Memoria de la CPU	54 TB LPDDR5X	1,5 TB LPDDR5X	-
Total de chips NVIDIA + HBM4	1296	30	12

1. Información preliminar, todos los valores están actualizados y sujetos a cambios
2. Especificación densa
3. Rendimiento máximo utilizando algoritmos de emulación basados en Tensor Core

Empezar

Manténgase al día sobre las noticias de NVIDIA

Suscríbase para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.

Manténgase al corriente