La base para el entrenamiento y la inferencia de IA a gigaescala.
Con la convergencia de las leyes de escalado de preentrenamiento, posentrenamiento y tiempo de inferencia, los centros de datos modernos se enfrentan a cuellos de botella de rendimiento y eficiencia cuando intentan dar soporte a modelos que requieren cadenas de pensamiento complejas y de varios pasos.
Diseñada específicamente para afrontar esos desafíos, NVIDIA DGX™ Vera Rubin NVL72 es una solución de infraestructura de IA lista para usar que proporciona un rendimiento de vanguardia al tiempo que mejora enormemente la eficiencia energética. DGX Vera Rubin NVL72 proporciona tokens por vatio y rendimiento por vatio líderes en el sector para cualquier carga de trabajo de IA, lo que permite a las empresas escalar drásticamente la inteligencia al tiempo que mejoran la economía de los tokens.
DGX Vera Rubin NVL72 combina la CPU NVIDIA Vera de bajo consumo con las GPU NVIDIA Rubin para ofrecer un rendimiento líder por vatio. Esto permite a las empresas escalar el entrenamiento y la inferencia de largo contexto dentro de su huella energética existente, lo que convierte al centro de datos en un motor energéticamente eficiente para la innovación de la IA.
NVIDIA DGX SuperPOD™ con sistemas DGX Vera Rubin NVL72 elimina las conjeturas derivadas de la implementación de una infraestructura de IA a gran escala. Con una arquitectura de bastidor sencilla y de fácil implementación, se ha diseñado para aprovechar los últimos avances en ingeniería de centros de datos.
NVIDIA Mission Control™ acelera cada aspecto de las operaciones, desde la configuración de DGX Vera Rubin NVL72 y la integración en las instalaciones hasta la gestión de clústeres y cargas de trabajo. Gracias a un software inteligente e integrado, las empresas obtienen control sobre los eventos de refrigeración y energía para redefinir la resiliencia de la infraestructura.
La plataforma NVIDIA DGX, diseñada desde cero para la IA empresarial, con NVIDIA DGX SuperPOD, integra lo mejor del software, la infraestructura y la experiencia de NVIDIA en una solución de desarrollo de IA moderna y unificada.
| GPU and CPU | 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera |
| Memoria total de la GPU | Ancho de banda | 20,7 TB | Hasta 28,8 TB/s |
| Memoria rápida total | 75 TB |
| Rendimiento | NVFP4 Inference: 3,600 PFLOPS NVFP4 Training: 2,520 PFLOPS FP8/FP6 Training: 1,260 PFLOPS |
| Redes | > 144x OSFP VPI de un solo puerto NVIDIA® ConnectX®-9 con 800 Gb/s NVIDIA InfiniBand y Ethernet > 18 VPI NVIDIA BlueField®-4 de doble puerto con 400 Gb/s NVIDIA InfiniBand y Ethernet |
| Sistema de conmutador NVIDIA NVLink™ | 9 conmutadores L1 NVIDIA NVLink |
| Red de gestión | Controlador de gestión de placa base host (BMC) con RJ45 |
| Software | NVIDIA Mission Control, NVIDIA AI Enterprise, NVIDIA DGX OS |
| Soporte para empresas | Tres años de soporte empresarial estándar para hardware y software |
Specifications subject to change
Hable con un experto de NVIDIA sobre NVIDIA DGX Vera Rubin NVL72.
Descubra por qué NVIDIA DGX es el estándar probado en el que se basa la IA empresarial.
Descubra todo el potencial de la IA con opciones de implementación flexibles, desde soluciones in situ hasta soluciones alojadas.