Plataforma NVIDIA Vera Rubin

Plataforma NVIDIA Vera Rubin

Moldeando la próxima generación de IA.

Descripción

Impulsamos la era de la IA de agentes

La plataforma NVIDIA Vera Rubin está diseñada para la era de la IA agentiva y el razonamiento, concebida para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de memoria, la plataforma potencia la inferencia para ofrecer más tókenes por vatio y un menor coste por tóken, en comparación con la generación de la arquitectura NVIDIA Blackwell.

NVIDIA inicia la próxima generación de IA con Rubin

Presentamos la plataforma NVIDIA Vera Rubin. Siete nuevos chips, un increíble superordenador de IA.

NVIDIA Vera Rubin abre la próxima frontera de la IA

La plataforma NVIDIA Vera Rubin incluye siete nuevos chips en producción completa para escalar las fábricas de IA más grandes del mundo.

Echa un vistazo al interior de los avances tecnológicos

Motor transformador

La GPU Rubin cuenta con un nuevo motor Transformer (TE) con compresión adaptativa acelerada por hardware para aumentar el rendimiento de NVFP4, al tiempo que preserva la precisión. Esto permite hasta 50 petaFLOPS de inferencia NVFP4. Totalmente compatible con NVIDIA Blackwell, el motor Transformer garantiza actualizaciones fluidas, por lo que los códigos optimizados previamente pasan sin esfuerzo a la plataforma Vera Rubin.

Computación confidencial de tercera generación

La tercera generación de computación confidencial de NVIDIA amplía la seguridad a escala de bastidor completo con NVIDIA Vera Rubin NVL72. Esta plataforma crea un entorno de ejecución de confianza unificado en las 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin y el tejido NVIDIA NVLink™ que las conecta a la perfección. La plataforma mantiene la seguridad de los datos en CPU, GPU y dominios NVLink. Con servicios de certificación para pruebas criptográficas de cumplimiento, combina una escala masiva con una protección sin concesiones, todo ello para proteger los modelos propietarios, los datos de entrenamiento y las cargas de trabajo de inferencia más grandes del mundo.

NVLink y NVLink Switch de sexta generación

NVLink de sexta generación supone un gran avance para el tejido de interconexión de GPU de alta velocidad de NVIDIA, que unifica 72 GPU NVIDIA Rubin en un único dominio de rendimiento. Al duplicar el rendimiento de NVIDIA Blackwell, Rubin GPU proporciona 3,6 terabytes por segundo (TB/s) de ancho de banda por GPU y 260 TB/s de conectividad con baja latencia para facilitar una comunicación más rápida. Combinada con NVIDIA® Scalable Hierarchical Aggregation y Reduction Protocol (SHARP)™, que reduce la congestión de red hasta en un 50 % para operaciones colectivas, esta interconexión de próxima generación acelera el entrenamiento y la inferencia para los modelos más grandes del mundo, a escala y sin concesiones.

Motor de fiabilidad, disponibilidad y capacidad de mantenimiento (RAS) de segunda generación

La plataforma NVIDIA Vera Rubin ofrece resiliencia a escala de bastidor con características de fiabilidad avanzadas. Las GPU NVIDIA Rubin cuentan con un motor RAS dedicado de segunda generación para el mantenimiento proactivo y comprobaciones del estado en tiempo real sin tiempo de inactividad, Las CPU NVIDIA Vera añaden una facilidad de mantenimiento mejorada con módulos de memoria conectados por compresión de contorno pequeño (SOCAMM) LPDDR5X y pruebas en el sistema para los núcleos de la CPU. El bastidor presenta diseños de bandejas modulares y sin cables para lograr un montaje y una capacidad de mantenimiento 18 veces más rápidos que NVIDIA Blackwell, combinados con resiliencia inteligente y enrutamiento NVLink definido por software, lo que garantiza un funcionamiento continuo y reduce los gastos generales de mantenimiento.

CPU NVIDIA Vera

La CPU NVIDIA Vera está diseñada para el movimiento de datos y el razonamiento de agentes en sistemas acelerados, con compatibilidad total con computación confidencial. Se combina perfectamente con las GPU NVIDIA o funciona de forma independiente para cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC). Vera combina 88 núcleos diseñados por NVIDIA, hasta 1,2 TB/s de ancho de banda de memoria LPDDR5X y tejido de coherencia escalable de NVIDIA para proporcionar un rendimiento predecible con eficiencia energética para cargas de trabajo de uso intensivo de datos y de memoria, con compatibilidad total con Arm®. La conectividad NVIDIA NVLink-C2C integrada permite un acceso coherente a la memoria CPU-GPU de alto ancho de banda para maximizar la utilización y la eficiencia del sistema.

Explore los productos NVIDIA Vera Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, tarjetas SuperNIC NVIDIA ConnectX®-9 y DPU NVIDIA BlueField®-4, y se instala junto a los bastidores NVIDIA LPX en un centro de datos para obtener una inferencia rápida y de baja latencia. Aumenta la inteligencia en una plataforma a escala de rack con NVLink de sexta generación y el conmutador NVLink, y se expande con NVIDIA Quantum-X800 InfiniBand y NVIDIA Spectrum-X™ Ethernet, para impulsar la revolución industrial de la IA a escala.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX es el acelerador de inferencia de NVIDIA Vera Rubin, diseñado para satisfacer las exigencias de baja latencia y gran contexto de los sistemas de agentes. Vera Rubin y LPX unen el rendimiento extremo de las GPU y las LPU NVIDIA Rubin a través de una arquitectura diseñada conjuntamente. LPX cuenta con 256 LPU con 128 GB de SRAM, 40 PB/s de ancho de banda de memoria y 640 TB/s de ancho de banda de escalado vertical por bastidor.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 proporciona a las empresas una solución de infraestructura de IA lista para usar e implementar, basada en la plataforma NVIDIA Vera Rubin. Está diseñada específicamente para implementarse a escala a fin de acelerar los modelos de IA más complejos.

NVIDIA HGX Rubin NVL8

El sistema NVIDIA HGX™ Rubin NVL8 incorpora ocho GPU NVIDIA Rubin con interconexiones NVLink de alta velocidad de sexta generación para propulsar el centro de datos hacia una nueva era de computación acelerada y de la IA generativa.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 es un sistema de IA con refrigeración por líquido impulsado por ocho GPU NVIDIA Rubin y NVLink de sexta generación. Está diseñado específicamente para acelerar el entrenamiento, la inferencia y el posentrenamiento de cada carga de trabajo de IA.

Dentro de la plataforma NVIDIA Vera Rubin

Lea esta inmersión técnica en profundidad para saber cómo NVIDIA Vera Rubin trata el centro de datos como la unidad de computación, no el chip, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.