La CPU para la era de la IA.
Descripción
NVIDIA Vera está diseñada para el trabajo de CPU que sustenta la IA de agentes y el aprendizaje de refuerzo (RL), incluida la ejecución de código, el uso de herramientas, el sandboxing, el análisis, las canalizaciones de datos y la orquestación más allá del modelo. Al ser tanto una CPU host para sistemas acelerados y una CPU independiente para cargas de trabajo de fábricas de IA, Vera mantiene la alimentaciaón de las GPU, la capacidad de respuesta de los agentes y el movimiento de los bucles de entrenamiento. Con núcleos NVIDIA Olympus rápidos y energéticamente eficientes y memoria LPDDR5X de alto ancho de banda, Vera proporciona un rendimiento en entornos sandbox hasta un 80 % más rápido que la infraestructura de CPU tradicional, lo que ayuda a las fábricas de IA a generar más tokens por dólar».
El bastidor de CPU NVIDIA Vera impulsa el aprendizaje de refuerzo y la IA de agentes a escala de fábrica de IA. Basado en NVIDIA MGX™, integra hasta 256 CPU Vera para ejecutar más de 22 500 entornos simultáneos.
Aspectos destacados
La IA agéntica se ve obstaculizada por las CPU tradicionales. En todo el bucle de razonamiento de un agente, la CPU compila el código generado, ejecuta cadenas de herramientas de Python y analiza el código de software. NVIDIA Vera acelera las tres cargas de trabajo hasta 1,8 veces en comparación con las CPU x86 líderes, potenciando el bucle interno de agentes para maximizar el rendimiento de la fábrica de IA.
Rendimiento relativo basado en datos medidos y sujeto a cambios. Rendimiento de la CPU NVIDIA Vera con LPDDR5X basado en la CPU x86 de última generación.
Rendimiento relativo basado en datos medidos y sujeto a cambios. El rendimiento de la CPU NVIDIA Vera con LPDDR5X se comparó con el de la CPU x86 de última generación con DDR5 en todas las métricas clave de rendimiento de memoria de CPU.
La DDR5 tradicional obliga a encontrar una compensación entre el ancho de banda, la eficiencia y la capacidad de mantenimiento. NVIDIA Vera combina la memoria LPDDR5X con SOCAMM, módulos desmontables y reemplazables en el campo que ofrecen eficiencia con bajo consumo de energía (LP) con flexibilidad de nivel de servidor y capacidad actualizable. El resultado es el doble de ancho de banda, el triple de ancho de banda por núcleo y el cuádruple de la eficiencia energética de las CPU x86 líderes con DDR5, lo que permite obtener una mayor capacidad de producción de fábrica de IA a hiperescala y a escala empresarial.
Casos de uso
Características
NVIDIA Vera, diseñada para las exigencias del aprendizaje por refuerzo y la IA de agentes, combina núcleos Olympus diseñados a medida, memoria LPDDR5X de alto ancho de banda y NVIDIA Scalable Coherency Fabric (SCF) de baja latencia. Con conectividad NVIDIA NVLink-C2C, computación confidencial y compatibilidad total con Arm, Vera se extiende a sistemas acelerados y entornos de centros de datos modernos. Su arquitectura de computación monolítica mantiene la capacidad de respuesta de los entornos de software y la movilidad de los datos de forma eficiente, lo que ayuda a maximizar la capacidad de procesamiento, la eficiencia energética y la utilización de la GPU en las cargas de trabajo de IA, análisis y HPC.
NVIDIA Vera Rubin NVL72 unifica las tecnologías de vanguardia de NVIDIA: 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX®-9 y DPU BlueField-4. Aumenta la inteligencia en una plataforma a escala de bastidor con el conmutador NVLink 6 y se escala con NVIDIA Quantum-X800 InfiniBand y Spectrum-X™ Ethernet para impulsar la revolución industrial de la IA.
Empezar
Suscríbase para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.