Plataforma NVIDIA Rubin

Moldeando la próxima generación de IA.

Descripción
Avances tecnológicos
Productos
Dentro de Vera Rubin

Descripción
Avances tecnológicos
Productos
Dentro de Vera Rubin

Descripción

Impulsamos la era de la IA de agentes

La plataforma NVIDIA Rubin está diseñada para la era de la IA agentiva y el razonamiento, desarrollada para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de la memoria, la plataforma Rubin acelera la inferencia, lo que ofrece más tokens por vatio y reduce el coste por token en comparación con la generación NVIDIA Blackwell.

NVIDIA inicia la próxima generación de IA con Rubin: seis nuevos chips, un increíble superordenador de IA

La plataforma de vanguardia aumenta la escala de la adopción general, lo cual recorta el coste por token con cinco avances para los modelos de IA de razonamiento y de agentes.

Leer la nota de prensa

Echa un vistazo al interior de los avances tecnológicos

Motor transformador

La plataforma Rubin cuenta con un nuevo motor transformador con compresión adaptativa acelerada por hardware para aumentar el rendimiento de NVFP4 al tiempo que preserva la precisión y permite hasta 50 petaFLOPS de inferencia NVFP4. Totalmente compatible con NVIDIA Blackwell, el motor Transformer garantiza actualizaciones fluidas, por lo que los códigos optimizados previamente pasan sin esfuerzo a la plataforma Rubin.

Computación confidencial de tercera generación

La tercera generación de computación confidencial de NVIDIA amplía la seguridad a escala de bastidor completo con NVIDIA Vera Rubin NVL72. Esta plataforma crea un entorno de ejecución de confianza unificado en las 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin y el tejido NVIDIA NVLink™ que las conecta a la perfección. La plataforma mantiene la seguridad de los datos en CPU, GPU y dominios NVLink. Con servicios de certificación para pruebas criptográficas de cumplimiento, combina una escala masiva con una protección sin concesiones, todo ello para proteger los modelos propietarios, los datos de entrenamiento y las cargas de trabajo de inferencia más grandes del mundo.

Más información sobre la computación confidencial de NVIDIA

NVLink y NVLink Switch de sexta generación

NVLink de sexta generación supone un gran avance para el tejido de interconexión de GPU de alta velocidad de NVIDIA, que unifica 72 GPU NVIDIA Rubin en un único dominio de rendimiento. Al duplicar el rendimiento de NVIDIA Blackwell, Rubin proporciona 3,6 terabytes por segundo (TB/s) de ancho de banda por GPU y 260 TB/s de conectividad con baja latencia para facilitar una comunicación más rápida. Combinada con NVIDIA® Scalable Hierarchical Aggregation y Reduction Protocol (SHARP)™, que reduce la congestión de red hasta en un 50 % para operaciones colectivas, esta interconexión de próxima generación acelera el entrenamiento y la inferencia para los modelos más grandes del mundo, a escala y sin concesiones.

Más información sobre NVIDIA NVLink y NVLink Switch

Motor de fiabilidad, disponibilidad y capacidad de mantenimiento (RAS) de segunda generación

La plataforma NVIDIA Rubin ofrece resiliencia a escala de bastidor con características de fiabilidad avanzadas. Las GPU NVIDIA Rubin cuentan con un motor RAS exclusivo de segunda generación para realizar un mantenimiento proactivo y comprobaciones del estado en tiempo real y sin tiempos de inactividad, mientras que las CPU NVIDIA Vera añaden una capacidad de mantenimiento mejorada con SOCAMM LPDDR5X y pruebas en el sistema para los núcleos de la CPU. El bastidor presenta diseños de bandejas modulares y sin cables para lograr un montaje y una capacidad de mantenimiento 18 veces más rápidos que NVIDIA Blackwell, combinados con resiliencia inteligente y enrutamiento NVLink definido por software, lo que garantiza un funcionamiento continuo y reduce los gastos generales de mantenimiento.

CPU NVIDIA Vera

La CPU NVIDIA Vera está diseñada para el movimiento de datos y el razonamiento de agentes en sistemas acelerados, con compatibilidad total con computación confidencial. Se combina perfectamente con las GPU NVIDIA o funciona de forma independiente para cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC). Vera combina 88 núcleos diseñados por NVIDIA, hasta 1,2 TB/s de ancho de banda de memoria LPDDR5X y tejido de coherencia escalable de NVIDIA para ofrecer un rendimiento predecible y eficiente en energía para cargas de trabajo de uso intensivo de datos y memoria con compatibilidad total con Arm®. La conectividad NVLink-C2C integrada permite un acceso coherente a la memoria CPU-GPU de alto ancho de banda para maximizar la utilización y la eficiencia del sistema.

Más información sobre NVIDIA Vera

Explore los productos NVIDIA Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, SuperNIC® NVIDIA ConnectX®-9 y DPU NVIDIA BlueField®-4. Aumenta la inteligencia en una plataforma a escala de rack con NVLink de sexta generación y el conmutador NVLink, y se expande con NVIDIA Quantum-X800 InfiniBand y NVIDIA Spectrum-X™ Ethernet, para impulsar la revolución industrial de la IA a escala.

Más información

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 proporciona a las empresas una solución de infraestructura de IA lista para implementar, basada en la plataforma NVIDIA Rubin y diseñada específicamente para implementarse a escala con el fin de acelerar los modelos de IA más complejos.

Más información

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 es un sistema de IA con refrigeración por líquido impulsado por ocho GPU NVIDIA Rubin y NVLink de sexta generación que está diseñado específicamente para acelerar el entrenamiento, la inferencia y el posentrenamiento para cada carga de trabajo de IA.

Más información

Dentro de la plataforma NVIDIA Rubin: seis nuevos chips, un superordenador de IA

Lea esta inmersión técnica en profundidad para descubrir cómo NVIDIA Vera Rubin trata el centro de datos, no el chip, como la unidad de computación, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.

Leer el blog de tecnología