Plataforma NVIDIA Vera Rubin

Plataforma NVIDIA Vera Rubin

Infraestructura de IA para la era de los agentes.

Descripción

Impulsamos la era de la IA de agentes

La plataforma NVIDIA Vera Rubin está diseñada para la era de la IA agentiva y el razonamiento, desarrollada para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Vera Rubin es un sistema de varios bastidores a escala de POD que reúne cinco sistemas a escala de bastidor diseñados específicamente en un único superordenador de IA masivo y coherente. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de la memoria, la plataforma acelera la inferencia, lo que proporciona más tókenes por vatio y un menor coste por token en comparación con la arquitectura NVIDIA Blackwell.

NVIDIA Vera Rubin entra en producción completa para impulsar las fábricas de IA de agentes en todo el mundo

NVIDIA Vera Rubin está entrando en producción completa, con los principales fabricantes de servidores de Taiwán y líderes globales de la cadena de suministro fabricando a escala y suministrando sistemas basados en Vera Rubin, impulsando a laboratorios de IA, proveedores de nube e hiperescaladores para crear la inteligencia del mañana.

NVIDIA Vera Rubin abre la próxima frontera de la IA

La plataforma NVIDIA Vera Rubin incluye siete nuevos chips en producción completa para escalar las fábricas de IA más grandes del mundo.

Eche un vistazo al interior de la plataforma Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica las tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, ConnectX™-9 SuperNIC™s y BlueField™-4 DPU. Aumenta la inteligencia en una plataforma a escala de bastidor de tercera generación con el conmutador NVIDIA NVLink™ 6 y se escala con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA a escala.

Vera Rubin NVL72 cuenta con un nuevo motor transformador con compresión adaptativa para aumentar el rendimiento de inferencia de NVFP4, computación confidencial de NVIDIA de tercera generación que amplía la seguridad en toda la plataforma a escala de bastidor y un motor RAS de segunda generación que ofrece resiliencia a escala de bastidor.

CPU NVIDIA Vera

El bastidor de CPU NVIDIA Vera proporciona una infraestructura de CPU densa y con refrigeración por líquido que ha sido diseñada específicamente para el aprendizaje por refuerzo y la IA de agentes a escala. Cada bastidor, basado en la arquitectura de referencia modular NVIDIA MGX™, integra 256 CPU NVIDIA Vera y admite más de 22 500 entornos sandbox concurrentes, lo que proporciona a las fábricas de IA capacidad de CPU escalable y con eficiencia energética para llamadas a herramientas, evaluaciones, procesamiento de datos y orquestación.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX es el acelerador de inferencia de NVIDIA Vera Rubin, diseñado para satisfacer las exigencias de baja latencia y gran contexto de los sistemas de agentes. Al combinar las GPU Rubin para la memoria de gran ancho de banda (HBM) y las LPU para la memoria estática de acceso aleatorio (SRAM), NVIDIA Vera Rubin con LPX ofrece una nueva clase de rendimiento de inferencia para modelos de billones de parámetros y contextos de millones de tókenes.

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX es una base modular para soluciones de almacenamiento nativas de IA a escala de bastidor. Al integrar NVIDIA Vera Rubin, el procesador de almacenamiento BlueField-4 STX, las redes Spectrum-X y el software de IA de NVIDIA, se optimiza todo el ciclo de vida de los datos, desde el análisis de datos hasta el entrenamiento de modelos y los flujos de trabajo de IA de agentes completos a escala.

NVIDIA Spectrum-6 SPX Ethernet

Spectrum-6 SPX Ethernet está diseñado para acelerar las redes en todas las fábricas de IA. Se puede configurar con conmutadores NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, y proporciona conectividad de bastidor a bastidor con baja latencia y alto rendimiento a escala.

Explore los productos de NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72 proporciona a las empresas una solución de infraestructura de IA llave en mano y lista para implementar, basada en la plataforma NVIDIA Vera Rubin. Está diseñada específicamente para la implementación a escala con el fin de acelerar los modelos de IA más complejos.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 es un sistema de IA con refrigeración por líquido impulsado por ocho GPU NVIDIA Rubin y NVLink de sexta generación. Está diseñado específicamente para acelerar el entrenamiento, la inferencia y el posentrenamiento para cada carga de trabajo de IA.

NVIDIA HGX Rubin NVL8

El sistema NVIDIA HGX™ Rubin NVL8 incorpora ocho GPU NVIDIA Rubin con interconexiones NVLink de alta velocidad de sexta generación para propulsar el centro de datos hacia una nueva era de computación acelerada y de la IA generativa.. NVIDIA HGX Rubin NVL8 se puede combinar con CPU NVIDIA Vera o placas base de CPU basadas en x86.

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4 desbloquea descubrimientos científicos automatizados y la IA de agentes a través de un puente que conecta cuatro GPU NVIDIA Rubin con dos CPU NVIDIA Vera a través de NVLink-C2C. Compatible con los servidores NVIDIA MGX con refrigeración líquida, ofrece hasta 4 veces más rendimiento para simulaciones científicas, 6 veces más para el entrenamiento de IA para ciencia y 8 veces más para la inferencia en comparación con Hopper.

Dentro de la plataforma NVIDIA Vera Rubin

Lea esta inmersión técnica en profundidad para saber cómo NVIDIA Vera Rubin trata el centro de datos como la unidad de computación, no el chip, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.