Visit your regional NVIDIA website for local content, pricing, and where to buy partners specific to your country.
Creada para la era del razonamiento IA.
Regístrese para recibir una notificación cuando NVIDIA GB300 NVL72 esté disponible.
Descripción General
NVIDIA GB300 NVL72 cuenta con un diseño a escala de bastidor con refrigeración líquida que unifica 72 GPU NVIDIA Blackwell Ultra y 36 CPU NVIDIA Grace™ basadas en Arm® en una sola plataforma optimizada para la inferencia de escalado en tiempo de prueba. Las fábricas de IA impulsadas por GB300 NVL72 con NVIDIA Quantum-X800 InfiniBand o Spectrum™-X Ethernet, junto con ConnectX®-8 SuperNICS, proporcionan un rendimiento 50 veces mayor para la inferencia de modelos de razonamiento en comparación con la plataforma NVIDIA Hopper™.
DeepSeek R1 ISL = 32K, OSL = 8K, GB300 NVL72 con desagregación FP4 Dynamo. H100 con procesamiento por lotes en vuelo FP8. El desempeñeo proyectado puede cambiar.
Obtenga un desempeño de razonamiento de IA de nivel superior con la plataforma NVIDIA GB300 NVL72. En comparación con Hopper, GB300 NVL72 ofrece un impresionante aumento de diez veces la capacidad de respuesta del usuario (TPS por usuario) y una mejora de cinco veces en el rendimiento (TPS por megavatio [MW]). En conjunto, estos avances se traducen en un notable aumento de 50 veces en la producción general del ecosistema de IA.
Funciones
El escalado en tiempo de prueba y el razonamiento IA aumentan la computación necesaria para lograr calidad en el servicio y un rendimiento máximo. Los Núcleos Tensor de NVIDIA Blackwell Ultra están potenciados con el doble de aceleración de la capa de atención y 1,5 veces más operaciones de punto flotante de computación IA por segundo (FLOPS) en comparación con las GPU NVIDIA Blackwell.
Una capacidad de memoria más grande permite un tamaño de lotes más grande y el máximo rendimiento posible. Las GPU NVIDIA Blackwell Ultra ofrecen una memoria HBM3e 1.5 veces más grande en combinación con una computación IA adicional, lo que aumenta el rendimiento del razonamiento IA en longitudes contextuales más largas.
La arquitectura NVIDIA Blackwell ofrece avances innovadores en la computación acelerada, lo que impulsa una nueva era de desempeño, eficiencia y escala sin precedentes.
El módulo de entrada y salida (IO) de NVIDIA ConnectX-8 SuperNIC aloja dos dispositivos ConnectX-8, que proporcionan 800 gigabits por segundo (Gb/s) de conectividad de red para cada GPU en NVIDIA GB300 NVL72. Esto ofrece las mejores capacidades de acceso directo a memoria remota (RDMA) en su clase con las plataformas de redes NVIDIA Quantum-X800 InfiniBand o Spectrum-X Ethernet, lo que permite una máxima eficiencia en las cargas de trabajo de la IA.
La CPU NVIDIA Grace es un procesador innovador diseñado para cargas de trabajo de data centers modernos. Proporciona un desempeño y un ancho de banda de memoria excepcionales con el doble de eficiencia energética que los procesadores líderes en servidores actuales.
Descubrir y aprovechar todo el potencial de la computación acelerada requiere una comunicación fluida entre cada GPU. La quinta generación de NVIDIA NVLink™ es una interconexión de escalado que desata el desempeño acelerado de los modelos de razonamiento IA
Especificaciones
1. Especificaciones preliminares. Pueden estar sujetas a cambios. Todas las especificaciones del Núcleo Tensor son con dispersión, a menos que se indique lo contrario. 2. Sin dispersión.
Recursos
Regístrese para recibir las últimas noticias, actualizaciones y más información de NVIDIA.