Infraestructura de IA para la era de los agentes.
Descripción General
La plataforma NVIDIA Rubin ha sido desarrollada para la era de la IA agéntica y el razonamiento, diseñada para dominar la resolución de problemas de varios pasos y los flujos de trabajo masivos de contexto largo a escala. Vera Rubin es un sistema a escala de POD de múltiples bastidores que reúne cinco sistemas a escala de bastidor diseñados específicamente para el propósito en una supercomputadora de IA masiva y coherente. Al eliminar cuellos de botella críticos en la comunicación y el movimiento de memoria, la plataforma potencia la inferencia, lo que ofrece más tokens por vatio y un menor costo por token en comparación con la arquitectura NVIDIA Blackwell.
NVIDIA Vera Rubin NVL72 unifica tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX™-9 y DPU BlueField™-4. Escala verticalmente la inteligencia en una plataforma a escala de bastidor de tercera generación con el switch NVIDIA NVLink™ 6 y escala horizontalmente con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA a escala.
Vera Rubin NVL72 cuenta con un nuevo motor Transformer con compresión adaptativa para aumentar el desempeño de inferencia de NVFP4, Computación Confidencial de NVIDIA de tercera generación que extiende la seguridad en toda la plataforma a escala de bastidor y un motor RAS de segunda generación que ofrece resiliencia a escala de bastidor.
El bastidor de CPU NVIDIA Vera ofrece una infraestructura de CPU densa y refrigerada por líquido diseñada específicamente para el aprendizaje por refuerzo y la IA agéntica a escala. Cada bastidor, basado en la arquitectura de referencia modular de NVIDIA MGX, integra 256 CPU NVIDIA Vera y admite más de 22,500 entornos de sandbox simultáneos, lo que brinda a las fábricas de IA una capacidad de CPU escalable y de bajo consumo energético para llamadas a herramientas, evaluación, procesamiento de datos y orquestación.
NVIDIA Groq 3 LPX es el acelerador de inferencia para NVIDIA Vera Rubin, diseñado para cumplir con las demandas de baja latencia y contexto grande de los sistemas agénticos. Al combinar las GPU Rubin para memoria de alto ancho de banda (HBM) y LPU para memoria estática de acceso aleatorio (SRAM), NVIDIA Vera Rubin con LPX ofrece una nueva clase de desempeño de inferencia para modelos de billones de parámetros y contextos de millones de token.
NVIDIA Vera BlueField-4 STX es una base modular para soluciones de almacenamiento nativas de IA a escala de bastidor. Al integrar NVIDIA Vera Rubin, el procesador de almacenamiento BlueField-4 STX, las redes Spectrum-X y el software de IA de NVIDIA, optimiza todo el ciclo de vida de los datos, desde el análisis de datos hasta el entrenamiento de modelos y los workflows de IA agéntica completos a escala.
Spectrum-6 SPX Ethernet está diseñado para acelerar las redes en todas las fábricas de IA. Se puede configurar con los switches NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, ofrece conectividad de bastidor a bastidor de baja latencia y alto rendimiento a escala.
NVIDIA Vera Rubin, desarrollada por medio de un diseño conjunto extremo, trata al centro de datos, no al chip, como la unidad de computación, lo que establece una nueva base para producir inteligencia de manera eficiente, segura y predecible a escala.