Arquitectura NVIDIA Blackwell

Impulsamos la IA generativa a escala de billones de parámetros.

Derribamos las barreras de la IA generativa

Explore los avances innovadores que la arquitectura NVIDIA Blackwell aporta a la IA generativa y la computación acelerada. Sobre la base de generaciones de tecnologías NVIDIA, Blackwell define el próximo capítulo de la IA generativa con un rendimiento, una eficacia y una escala sin precedentes.

Eche un vistazo a los avances tecnológicos

Arquitectura de IA unificada

Blackwell se ha creado con 208 000 millones de transistores mediante un proceso TSMC 4NP adaptado para mantener el liderazgo de NVIDIA en computación acelerada, y sus GPU incluyen los chips más potentes jamás creados. Sus dos matrices son las más grandes posibles, que proporcionan el rendimiento de comunicación más rápido para las operaciones de IA al tiempo que maximizan la eficiencia energética, y están interconectadas a través de una interfaz NVHyperfuse de 10 terabytes por segundo (TB/s) de chip a chip, que proporciona una visión transparente de una sola GPU para todas las cachés y la comunicación.

Motor de IA generativa

Además de admitir la tecnología Transformer Engine que acelera el entrenamiento con precisiones FP8 y FP16, Blackwell presenta el nuevo motor de IA generativa. El motor de IA generativa utiliza tecnología de núcleos Tensor de Blackwell personalizadapara acelerar la inferencia de la IA generativa y los modelos de lenguaje de gran tamaño (LLM) con nuevos formatos de precisión, incluidos los formatos de microescalado (MX) definidos por la comunidad. Los formatos MXFP4, MXFP6, MXFP8 y MXINT8 del motor de IA generativa potencian la aceleración para los LLM actuales con un rendimiento mejorado gracias a las pequeñas huellas de modelo y a un mayor rendimiento que FP8 y FP16.

IA segura

Los LLM tienen un inmenso potencial para las empresas. La optimización de los ingresos, la aportación de información empresarial y la ayuda en la generación de contenidos son solo algunas de las ventajas. Pero la adopción de LLM puede resultar difícil para las empresas que necesitan entrenarlos sobre datos privados sujetos a normativas de privacidad o que incluyen información privada que plantea riesgos si se expone. Blackwell incluye computación confidencial de NVIDIA, que protege los datos confidenciales y los modelos de IA de accesos no autorizados con una sólida seguridad basada en hardware.

Sistema de conmutadores NVLink, NVSwitch y NVLink

Para liberar todo el potencial de la computación a exaescala y los modelos de IA de billones de parámetros, es necesario que exista una comunicación rápida y sin fisuras entre todas las GPU de un clúster de servidores. La quinta generación de NVIDIA® NVLink® es una interconexión a escala vertical que libera un rendimiento acelerado para modelos de IA de billones y billones de parámetros. 

La cuarta generación de NVIDIA NVSwitch™ ofrece 130 TB/s de ancho de banda de GPU en un dominio NVLink de 72 GPU (NVL72) y ofrece una eficiencia de ancho de banda cuatro veces mayor con la compatibilidad con el Protocolo escalable de reducción y agregación jerárquica de NVIDIA (SHARP)™ FP8. Gracias a NVSwitch, el sistema de conmutadores NVIDIA  NVLink admite clústeres que van más allá de un solo servidor con la misma impresionante interconexión de 1,8 TB/s. Los clústeres multiservidor con NVLink escalan las comunicaciones de GPU en equilibrio con el aumento de la computación, por lo que NVL72 puede ofrecer 9 veces más rendimiento de GPU que un solo sistema de ocho GPU. 

Motor de descompresión

Los flujos de trabajo de análisis de datos y bases de datos han dependido tradicionalmente de las CPU para el cálculo. La ciencia de datos acelerada puede aumentar drásticamente el rendimiento de los análisis de extremo a extremo, lo que acelera la generación de valor al tiempo que reduce los costes. Las bases de datos, incluida Apache Spark, desempeñan un papel fundamental en la gestión, el procesamiento y el análisis de grandes volúmenes de datos para el análisis de datos.

El motor de descompresión de Blackwell y su capacidad para acceder a grandes cantidades de memoria en la CPU NVIDIA Grace™ a través de un enlace de alta velocidad, 900 gigabytes por segundo (GB/s) de ancho de banda bidireccional, aceleran toda la canalización de consultas de la base de datos para obtener el máximo rendimiento en el análisis y la ciencia de datos. Blackwell es compatible con los formatos de compresión más recientes, como LZ4, Snappy y Deflate, y ofrece un rendimiento 20 veces superior al de las CPU y 7 veces superior al de las GPU NVIDIA H100Tensor Core en las pruebas de referencia.

Motor de fiabilidad, disponibilidad y mantenimiento (RAS)

Blackwell añade resiliencia inteligente con un motor dedicado de fiabilidad, disponibilidad y mantenimiento (RAS) para identificar posibles fallos que pueden ocurrir pronto para minimizar el tiempo de inactividad.  Las capacidades de gestión predictiva con tecnología de IA de NVIDIA supervisan continuamente miles de puntos de datos en hardware y software para que el estado general pueda predecir e interceptar fuentes de tiempo de inactividad e ineficiencia. Esto crea una resiliencia inteligente que ahorra tiempo, energía y costes informáticos.

El motor RAS de NVIDIA proporciona información de diagnóstico detallada que puede identificar áreas de preocupación y planificar el mantenimiento. El motor RAS reduce el tiempo de respuesta al localizar rápidamente el origen de los problemas y minimiza el tiempo de inactividad al facilitar una solución eficaz.

Primeros pasos

Envíeme una notificación cuando NVIDIA Blackwell esté disponible.