Plataforma NVIDIA Rubin

Plataforma NVIDIA Rubin

Moldeamos la era del razonamiento de agentes.

Descripción

Impulsamos la era de la IA de agentes

NVIDIA Rubin está diseñada para la era de la IA de agentes y los modelos de razonamiento, ya que aborda la resolución de problemas en varios pasos y los flujos de trabajo de contexto largo a escala. Al eliminar los cuellos de botella en la comunicación, la coordinación y el movimiento de la memoria, NVIDIA Rubin proporciona una escalabilidad y una eficiencia sin igual, lo que permite a los agentes autónomos razonar, actuar e innovar a escala.

Dentro de NVIDIA Vera Rubin NVL72: la arquitectura de plataforma que impulsa la próxima ola de fábricas de IA

Al estar diseñada mediante un diseño conjunto extremo, NVIDIA Vera Rubin trata el centro de datos, no el chip, como la unidad de computación, lo que establece una nueva base para generar inteligencia a escala de forma eficiente, segura y predecible.

Echa un vistazo al interior de los avances tecnológicos

Motor transformador de tercera generación

El motor transformador de tercera generación traslada drásticamente las fronteras del rendimiento de la IA, ya que proporciona un rendimiento de inferencia en fase de contexto el doble de rápido para arquitecturas de modelos de vanguardia, como los modelos de mezcla de expertos (MoE). Esto se consigue con su unidad de aceleración adaptativa (AAU), que organiza la ejecución de forma inteligente seleccionando de forma dinámica las rutas de computación óptimas y activando instrucciones especializadas. Estas optimizaciones mejoran las operaciones de atención, lo que permite un mayor rendimiento, un menor coste por token y una eficiencia escalable para las cargas de trabajo de IA generativa de próxima generación.

Computación confidencial de tercera generación

La tercera generación de computación confidencial de NVIDIA incluye la CPU NVIDIA Vera, lo que amplía la seguridad a escala de bastidor completo con NVIDIA Vera Rubin NVL72. Esta plataforma crea un entorno de ejecución de confianza unificado en 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin y el tejido NVIDIA NVLink™ de 260 terabytes por segundo (TB/s) que las conecta a la perfección. Protege todo el ciclo de vida de la IA, desde preentrenamiento y posentrenamiento hasta inferencia, al tiempo que mantiene los modelos, los datos y las indicaciones patentados aislados de los proveedores de la nube y otros inquilinos. Al contar con servicios de certificación para pruebas criptográficas de cumplimiento y rendimiento casi sin cifrar habilitados por NVLink-C2C, NVL72 combina una escala masiva con una protección sin fisuras, lo que convierte la privacidad en una ventaja de rendimiento.

NVLink y NVLink Switch de sexta generación

NVLink de sexta generación supone un gran avance para el tejido de interconexión de GPU de alta velocidad de NVIDIA, que unifica 72 GPU NVIDIA Rubin en un único dominio de rendimiento. Proporciona 3,6 TB/s de ancho de banda por GPU y 260 TB/s de conectividad (el doble de NVIDIA Blackwell) con una latencia baja para facilitar una comunicación más rápida. Esta interconexión de próxima generación, combinada con el protocolo escalable de reducción y agregación jerárquica de NVIDIA® para obtener una eficiencia excepcional en el ancho de banda, acelera el entrenamiento y la inferencia a escala y sin compromisos para los modelos más grandes del mundo.

Motor de fiabilidad, disponibilidad y capacidad de mantenimiento (RAS) de segunda generación

NVIDIA Vera Rubin NVL72 proporciona resiliencia a escala de bastidor con prestaciones de fiabilidad avanzadas. Las GPU NVIDIA Rubin cuentan con un motor RAS exclusivo de segunda generación para realizar un mantenimiento proactivo y comprobaciones del estado en tiempo real y sin tiempos de inactividad, mientras que las CPU NVIDIA Vera añaden una capacidad de mantenimiento mejorada con SOCAMM LPDDR5X y pruebas en el sistema para los núcleos de la CPU. El diseño modular sin cables del bastidor, combinado con una conmutación por error inteligente y el enrutamiento NVLink definido por software, garantiza un funcionamiento continuo y reduce los gastos de mantenimiento.

CPU NVIDIA Vera

La CPU NVIDIA Vera está diseñada para el movimiento de datos y el razonamiento de agentes en sistemas acelerados. Se combina perfectamente con las GPU NVIDIA o funciona de forma independiente para cargas de trabajo de análisis, nube, orquestación, almacenamiento y computación de alto rendimiento (HPC). Al contar con 88 núcleos de alto rendimiento diseñados por NVIDIA, un ancho de banda de memoria LPDDR5X de hasta 1,2 TB/s y NVIDIA Scalable Coherency Fabric, NVIDIA Vera proporciona un rendimiento predecible y de bajo consumo de energía para cargas de trabajo de uso intensivo de datos y memoria. La conectividad NVLink-C2C integrada permite un acceso coherente a la memoria CPU-GPU de alto ancho de banda, lo que maximiza la utilización del sistema, la eficiencia y el retorno de la inversión.

Explore los productos NVIDIA Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifica 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, 144 SuperNIC NVIDIA ConnectX®-9 y 18 DPU NVIDIA BlueField®-4. Aumenta la inteligencia en una plataforma coherente a escala de bastidor con NVLink 6 y se escala con NVIDIA Quantum-X800 InfiniBand y NVIDIA Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA a escala.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 proporciona a las empresas una solución de infraestructura de IA lista para usar e implementar. Además, está basada en la arquitectura NVIDIA Vera Rubin y diseñada específicamente para implementarse a escala con el fin de acelerar los modelos de IA más complejos.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 es un sistema de IA con refrigeración por líquido impulsado por ocho GPU NVIDIA Rubin y NVLink de sexta generación que está diseñado específicamente para acelerar el entrenamiento, la inferencia y el posentrenamiento para cada carga de trabajo de IA.

Dentro de NVIDIA Vera Rubin NVL72: la arquitectura de plataforma que impulsa la próxima ola de fábricas de IA

Al estar diseñada mediante un diseño conjunto extremo, NVIDIA Vera Rubin trata el centro de datos, no el chip, como la unidad de computación, lo que establece una nueva base para generar inteligencia a escala de forma eficiente, segura y predecible.