Moldeando la próxima generación de IA.
Descripción
La plataforma NVIDIA Vera Rubin está diseñada para la era de la IA agentiva y el razonamiento, concebida para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de memoria, la plataforma potencia la inferencia para ofrecer más tókenes por vatio y un menor coste por tóken, en comparación con la generación de la arquitectura NVIDIA Blackwell.
La GPU Rubin cuenta con un nuevo motor Transformer (TE) con compresión adaptativa acelerada por hardware para aumentar el rendimiento de NVFP4, al tiempo que preserva la precisión. Esto permite hasta 50 petaFLOPS de inferencia NVFP4. Totalmente compatible con NVIDIA Blackwell, el motor Transformer garantiza actualizaciones fluidas, por lo que los códigos optimizados previamente pasan sin esfuerzo a la plataforma Vera Rubin.
La tercera generación de computación confidencial de NVIDIA amplía la seguridad a escala de bastidor completo con NVIDIA Vera Rubin NVL72. Esta plataforma crea un entorno de ejecución de confianza unificado en las 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin y el tejido NVIDIA NVLink™ que las conecta a la perfección. La plataforma mantiene la seguridad de los datos en CPU, GPU y dominios NVLink. Con servicios de certificación para pruebas criptográficas de cumplimiento, combina una escala masiva con una protección sin concesiones, todo ello para proteger los modelos propietarios, los datos de entrenamiento y las cargas de trabajo de inferencia más grandes del mundo.
NVLink de sexta generación supone un gran avance para el tejido de interconexión de GPU de alta velocidad de NVIDIA, que unifica 72 GPU NVIDIA Rubin en un único dominio de rendimiento. Al duplicar el rendimiento de NVIDIA Blackwell, Rubin GPU proporciona 3,6 terabytes por segundo (TB/s) de ancho de banda por GPU y 260 TB/s de conectividad con baja latencia para facilitar una comunicación más rápida. Combinada con NVIDIA® Scalable Hierarchical Aggregation y Reduction Protocol (SHARP)™, que reduce la congestión de red hasta en un 50 % para operaciones colectivas, esta interconexión de próxima generación acelera el entrenamiento y la inferencia para los modelos más grandes del mundo, a escala y sin concesiones.
La plataforma NVIDIA Vera Rubin ofrece resiliencia a escala de bastidor con características de fiabilidad avanzadas. Las GPU NVIDIA Rubin cuentan con un motor RAS dedicado de segunda generación para el mantenimiento proactivo y comprobaciones del estado en tiempo real sin tiempo de inactividad, Las CPU NVIDIA Vera añaden una facilidad de mantenimiento mejorada con módulos de memoria conectados por compresión de contorno pequeño (SOCAMM) LPDDR5X y pruebas en el sistema para los núcleos de la CPU. El bastidor presenta diseños de bandejas modulares y sin cables para lograr un montaje y una capacidad de mantenimiento 18 veces más rápidos que NVIDIA Blackwell, combinados con resiliencia inteligente y enrutamiento NVLink definido por software, lo que garantiza un funcionamiento continuo y reduce los gastos generales de mantenimiento.
La CPU NVIDIA Vera está diseñada para el movimiento de datos y el razonamiento de agentes en sistemas acelerados, con compatibilidad total con computación confidencial. Se combina perfectamente con las GPU NVIDIA o funciona de forma independiente para cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC). Vera combina 88 núcleos diseñados por NVIDIA, hasta 1,2 TB/s de ancho de banda de memoria LPDDR5X y tejido de coherencia escalable de NVIDIA para proporcionar un rendimiento predecible con eficiencia energética para cargas de trabajo de uso intensivo de datos y de memoria, con compatibilidad total con Arm®. La conectividad NVIDIA NVLink-C2C integrada permite un acceso coherente a la memoria CPU-GPU de alto ancho de banda para maximizar la utilización y la eficiencia del sistema.
Lea esta inmersión técnica en profundidad para saber cómo NVIDIA Vera Rubin trata el centro de datos como la unidad de computación, no el chip, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.