Moldeando la próxima generación de IA.
Descripción
La plataforma NVIDIA Rubin está diseñada para la era de la IA agentiva y el razonamiento, desarrollada para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de la memoria, la plataforma Rubin acelera la inferencia, lo que ofrece más tokens por vatio y reduce el coste por token en comparación con la generación NVIDIA Blackwell.
La plataforma Rubin cuenta con un nuevo motor transformador con compresión adaptativa acelerada por hardware para aumentar el rendimiento de NVFP4 al tiempo que preserva la precisión y permite hasta 50 petaFLOPS de inferencia NVFP4. Totalmente compatible con NVIDIA Blackwell, el motor Transformer garantiza actualizaciones fluidas, por lo que los códigos optimizados previamente pasan sin esfuerzo a la plataforma Rubin.
La tercera generación de computación confidencial de NVIDIA amplía la seguridad a escala de bastidor completo con NVIDIA Vera Rubin NVL72. Esta plataforma crea un entorno de ejecución de confianza unificado en las 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin y el tejido NVIDIA NVLink™ que las conecta a la perfección. La plataforma mantiene la seguridad de los datos en CPU, GPU y dominios NVLink. Con servicios de certificación para pruebas criptográficas de cumplimiento, combina una escala masiva con una protección sin concesiones, todo ello para proteger los modelos propietarios, los datos de entrenamiento y las cargas de trabajo de inferencia más grandes del mundo.
NVLink de sexta generación supone un gran avance para el tejido de interconexión de GPU de alta velocidad de NVIDIA, que unifica 72 GPU NVIDIA Rubin en un único dominio de rendimiento. Al duplicar el rendimiento de NVIDIA Blackwell, Rubin proporciona 3,6 terabytes por segundo (TB/s) de ancho de banda por GPU y 260 TB/s de conectividad con baja latencia para facilitar una comunicación más rápida. Combinada con NVIDIA® Scalable Hierarchical Aggregation y Reduction Protocol (SHARP)™, que reduce la congestión de red hasta en un 50 % para operaciones colectivas, esta interconexión de próxima generación acelera el entrenamiento y la inferencia para los modelos más grandes del mundo, a escala y sin concesiones.
La plataforma NVIDIA Rubin ofrece resiliencia a escala de bastidor con características de fiabilidad avanzadas. Las GPU NVIDIA Rubin cuentan con un motor RAS exclusivo de segunda generación para realizar un mantenimiento proactivo y comprobaciones del estado en tiempo real y sin tiempos de inactividad, mientras que las CPU NVIDIA Vera añaden una capacidad de mantenimiento mejorada con SOCAMM LPDDR5X y pruebas en el sistema para los núcleos de la CPU. El bastidor presenta diseños de bandejas modulares y sin cables para lograr un montaje y una capacidad de mantenimiento 18 veces más rápidos que NVIDIA Blackwell, combinados con resiliencia inteligente y enrutamiento NVLink definido por software, lo que garantiza un funcionamiento continuo y reduce los gastos generales de mantenimiento.
La CPU NVIDIA Vera está diseñada para el movimiento de datos y el razonamiento de agentes en sistemas acelerados, con compatibilidad total con computación confidencial. Se combina perfectamente con las GPU NVIDIA o funciona de forma independiente para cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC). Vera combina 88 núcleos diseñados por NVIDIA, hasta 1,2 TB/s de ancho de banda de memoria LPDDR5X y tejido de coherencia escalable de NVIDIA para ofrecer un rendimiento predecible y eficiente en energía para cargas de trabajo de uso intensivo de datos y memoria con compatibilidad total con Arm®. La conectividad NVLink-C2C integrada permite un acceso coherente a la memoria CPU-GPU de alto ancho de banda para maximizar la utilización y la eficiencia del sistema.
Lea esta inmersión técnica en profundidad para descubrir cómo NVIDIA Vera Rubin trata el centro de datos, no el chip, como la unidad de computación, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.