Plataforma NVIDIA Vera Rubin

Infraestructura de IA para la era de los agentes.

Descripción General
Avances Tecnológicos
Productos
Dentro de Vera Rubin

Descripción General
Avances Tecnológicos
Productos
Dentro de Vera Rubin

Descripción General

Impulsando la Era de la IA Agéntica

La plataforma NVIDIA Rubin ha sido desarrollada para la era de la IA agéntica y el razonamiento, diseñada para dominar la resolución de problemas de varios pasos y los flujos de trabajo masivos de contexto largo a escala. Vera Rubin es un sistema a escala de POD de múltiples bastidores que reúne cinco sistemas a escala de bastidor diseñados específicamente para el propósito en una supercomputadora de IA masiva y coherente. Al eliminar cuellos de botella críticos en la comunicación y el movimiento de memoria, la plataforma potencia la inferencia, lo que ofrece más tokens por vatio y un menor costo por token en comparación con la arquitectura NVIDIA Blackwell.

NVIDIA Vera Rubin Entra en Fase de Producción Plena para Impulsar las Fábricas de IA Basada en Agentes en Todo el Mundo

NVIDIA Vera Rubin está entrando en fase de producción plena, con los principales fabricantes de servidores de Taiwán y líderes de la cadena de suministro global realizando la manufactura a escala y enviando sistemas basados en Vera Rubin, lo que impulsa a los laboratorios de IA, los proveedores de nube y los hiperescaladores para desarrollar la inteligencia del mañana.

Lea el Comunicado de Prensa

NVIDIA Vera Rubin Abre la Frontera de la IA de Agentes

La plataforma NVIDIA Vera Rubin incluye siete chips nuevos en plena producción para escalar las fábricas de IA más grandes del mundo.

Lea el Comunicado de Prensa

Mire dentro de la plataforma Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX™-9 y DPU BlueField™-4. Escala verticalmente la inteligencia en una plataforma a escala de bastidor de tercera generación con el switch NVIDIA NVLink™ 6 y escala horizontalmente con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA a escala.

Vera Rubin NVL72 cuenta con un nuevo motor Transformer con compresión adaptativa para aumentar el desempeño de inferencia de NVFP4, Computación Confidencial de NVIDIA de tercera generación que extiende la seguridad en toda la plataforma a escala de bastidor y un motor RAS de segunda generación que ofrece resiliencia a escala de bastidor.

Más Información Sobre NVIDIA Vera Rubin NVL72

CPU NVIDIA Vera

El bastidor de CPU NVIDIA Vera ofrece una infraestructura de CPU densa y refrigerada por líquido diseñada específicamente para el aprendizaje por refuerzo y la IA agéntica a escala. Cada bastidor, basado en la arquitectura de referencia modular de NVIDIA MGX, integra 256 CPU NVIDIA Vera y admite más de 22,500 entornos de sandbox simultáneos, lo que brinda a las fábricas de IA una capacidad de CPU escalable y de bajo consumo energético para llamadas a herramientas, evaluación, procesamiento de datos y orquestación.

Más Información Sobre las CPU NVIDIA Vera

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX es el acelerador de inferencia para NVIDIA Vera Rubin, diseñado para cumplir con las demandas de baja latencia y contexto grande de los sistemas agénticos. Al combinar las GPU Rubin para memoria de alto ancho de banda (HBM) y LPU para memoria estática de acceso aleatorio (SRAM), NVIDIA Vera Rubin con LPX ofrece una nueva clase de desempeño de inferencia para modelos de billones de parámetros y contextos de millones de token.

Más Información Sobre NVIDIA Groq 3 LPX

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX es una base modular para soluciones de almacenamiento nativas de IA a escala de bastidor. Al integrar NVIDIA Vera Rubin, el procesador de almacenamiento BlueField-4 STX, las redes Spectrum-X y el software de IA de NVIDIA, optimiza todo el ciclo de vida de los datos, desde el análisis de datos hasta el entrenamiento de modelos y los workflows de IA agéntica completos a escala.

Más Información Sobre NVIDIA Vera BlueField-4 STX

NVIDIA Spectrum-6 SPX Ethernet

Spectrum-6 SPX Ethernet está diseñado para acelerar las redes en todas las fábricas de IA. Se puede configurar con los switches NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, ofrece conectividad de bastidor a bastidor de baja latencia y alto rendimiento a escala.

Más Información Sobre NVIDIA Spectrum-X Ethernet Photonics

Explore los Productos NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72 proporciona a las empresas una solución de infraestructura de IA lista para implementar y lista para usar basada en la plataforma NVIDIA Vera Rubin. Está diseñada específicamente para la implementación a escala para acelerar los modelos de IA más complejos.

Más información

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 es un sistema de IA refrigerado por líquido que funciona con ocho GPU NVIDIA Rubin y NVLink de sexta generación. Está diseñado específicamente para acelerar el entrenamiento, la inferencia y el posentrenamiento para cada carga de trabajo de IA.

Más información

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 integra ocho GPU NVIDIA Rubin con interconexiones NVLink de alta velocidad de sexta generación para impulsar el data center hacia una nueva era de la computación acelerada y la IA generativa. NVIDIA HGX Rubin NVL8 se puede combinar con las CPU NVIDIA Vera o con placas base de CPU basadas en x86.

Más información

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4 habilita el descubrimiento científico automatizado y la IA agéntica a través de un puente que conecta cuatro GPU NVIDIA Rubin a dos CPU NVIDIA Vera a través de NVLink-C2C. Es compatible con los servidores NVIDIA MGX refrigerados por líquido, ofrece un desempeño hasta 4 veces mayor para simulaciones científicas, 6 veces para el entrenamiento de IA para ciencia y 8 veces para la inferencia en comparación con Hopper.

Más información

Dentro de la Plataforma NVIDIA Vera Rubin

NVIDIA Vera Rubin, desarrollada por medio de un diseño conjunto extremo, trata al centro de datos, no al chip, como la unidad de computación, lo que establece una nueva base para producir inteligencia de manera eficiente, segura y predecible a escala.

Lea el Blog sobre Tecnología