Infraestructura de IA para la era de los agentes.
Descripción
La plataforma NVIDIA Vera Rubin está diseñada para la era de la IA agentiva y el razonamiento, desarrollada para dominar la resolución de problemas en múltiples pasos y los flujos de trabajo extensos y complejos a gran escala. Vera Rubin es un sistema de varios bastidores a escala de POD que reúne cinco sistemas a escala de bastidor diseñados específicamente en un único superordenador de IA masivo y coherente. Al eliminar los cuellos de botella críticos en la comunicación y el movimiento de la memoria, la plataforma acelera la inferencia, lo que proporciona más tókenes por vatio y un menor coste por token en comparación con la arquitectura NVIDIA Blackwell.
NVIDIA Vera Rubin NVL72 unifica las tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, ConnectX™-9 SuperNIC™s y BlueField™-4 DPU. Aumenta la inteligencia en una plataforma a escala de bastidor de tercera generación con el conmutador NVIDIA NVLink™ 6 y se escala con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA a escala.
Vera Rubin NVL72 cuenta con un nuevo motor transformador con compresión adaptativa para aumentar el rendimiento de inferencia de NVFP4, computación confidencial de NVIDIA de tercera generación que amplía la seguridad en toda la plataforma a escala de bastidor y un motor RAS de segunda generación que ofrece resiliencia a escala de bastidor.
El bastidor de CPU NVIDIA Vera proporciona una infraestructura de CPU densa y con refrigeración por líquido que ha sido diseñada específicamente para el aprendizaje por refuerzo y la IA de agentes a escala. Cada bastidor, basado en la arquitectura de referencia modular NVIDIA MGX™, integra 256 CPU NVIDIA Vera y admite más de 22 500 entornos sandbox concurrentes, lo que proporciona a las fábricas de IA capacidad de CPU escalable y con eficiencia energética para llamadas a herramientas, evaluaciones, procesamiento de datos y orquestación.
NVIDIA Groq 3 LPX es el acelerador de inferencia de NVIDIA Vera Rubin, diseñado para satisfacer las exigencias de baja latencia y gran contexto de los sistemas de agentes. Al combinar las GPU Rubin para la memoria de gran ancho de banda (HBM) y las LPU para la memoria estática de acceso aleatorio (SRAM), NVIDIA Vera Rubin con LPX ofrece una nueva clase de rendimiento de inferencia para modelos de billones de parámetros y contextos de millones de tókenes.
NVIDIA Vera BlueField-4 STX es una base modular para soluciones de almacenamiento nativas de IA a escala de bastidor. Al integrar NVIDIA Vera Rubin, el procesador de almacenamiento BlueField-4 STX, las redes Spectrum-X y el software de IA de NVIDIA, se optimiza todo el ciclo de vida de los datos, desde el análisis de datos hasta el entrenamiento de modelos y los flujos de trabajo de IA de agentes completos a escala.
Spectrum-6 SPX Ethernet está diseñado para acelerar las redes en todas las fábricas de IA. Se puede configurar con conmutadores NVIDIA Spectrum-X™ Ethernet o NVIDIA Quantum-X800 InfiniBand, y proporciona conectividad de bastidor a bastidor con baja latencia y alto rendimiento a escala.
Lea esta inmersión técnica en profundidad para saber cómo NVIDIA Vera Rubin trata el centro de datos como la unidad de computación, no el chip, estableciendo una nueva base para producir inteligencia a escala de forma eficiente, segura y predecible.