NVLink y NVLink Switch

Los elementos básicos de la comunicación de alta velocidad y multi-GPU para alimentar grandes conjuntos de datos más rápido en modelos e intercambiar datos rápidamente entre GPU.

La necesidad de interconexiones más rápidas y de escalado vertical

Para liberar todo el potencial de la computación a exaescala y los modelos de IA de billones de parámetros, debe existir una comunicación rápida y sin fisuras entre todas las GPU de un clúster de servidores. La quinta generación de NVIDIA® NVLink® es una interconexión a escala vertical que libera un rendimiento acelerado para modelos de IA de billones y billones de parámetros.

Maximiza el rendimiento del sistema con NVIDIA NVLink

La quinta generación de NVLink mejora enormemente la escalabilidad para sistemas de varias GPU más grandes. Una sola GPU NVIDIA Blackwell Tensor Core admite hasta 18 conexiones NVLink de 100 gigabytes por segundo (GB/s) para un ancho de banda total de 1,8 terabytes por segundo (TB/s), 2 veces el ancho de banda de la generación anterior y más de 14 veces el de PCIe Gen5. Las plataformas de servidor como GB200 NVL72 aprovechan esta tecnología para ofrecer una mayor escalabilidad para los modelos de gran tamaño más complejos de hoy en día.

Rendimiento de NVLink

NVLink en NVIDIA H100 aumenta en 1,5 veces el ancho de banda de comunicación entre GPU en comparación con la generación anterior, por lo que los investigadores pueden utilizar aplicaciones más grandes y sofisticadas para resolver problemas más complejos.

Aumentar el rendimiento de la GPU con comunicación NVLink

Conexión total de GPU con NVIDIA NVLink y NVLink Switch

NVLink es una interconexión bidireccional directa entre GPU de 1,8TB/s que escala la entrada y salida (IO) de varias GPU dentro de un servidor. Los chips de NVIDIA NVLink Switch conectan varios NVLinks para ofrecer comunicación total con la GPU a velocidad NVLink completa dentro de un solo rack y entre racks.

A fin de permitir operaciones colectivas y de alta velocidad, cada NVLink Switch tiene motores para el Protocolo Escalable de Reducción y Agregación Jerárquica (SHARP)™ de NVIDIA para reducciones de red y aceleración de multidifusión.

Más información sobre NVLink Switch

Entrenar modelos de varios billones de parámetros con el sistema de conmutadores NVLink

Con NVLink Switch, las conexiones NVLink se pueden extender a través de nodos para crear un clúster de GPU sin problemas, de alto ancho de banda y de varios nodos, que forma eficazmente una GPU con tamaño de centro de datos. El sistema de conmutación NVIDIA NVLink permite 130 TB/s de ancho de banda de GPU en un NVL72 para el paralelismo de modelos de gran tamaño. Los clústeres multiservidor con NVLink escalan las comunicaciones de GPU en equilibrio con el aumento de la computación, por lo que NVL72 puede ofrecer 9 veces más recuento de GPU que un solo sistema de ocho GPU.

Más información sobre NVIDIA GB200 NVL72

NVIDIA NVLink Switch

El conmutador NVIDIA NVLink cuenta con 144 puertos NVLink con una capacidad de conmutación sin bloqueo de 14,4 TB/s. El conmutador de rack está diseñado para ofrecer un ancho de banda alto y una latencia baja en los sistemas NVIDIA GB200 NVL72 que admiten conectividad NVLink externa de quinta generación.

Leer el blog de tecnología

Escalado de empresa a exaescala

Conexión completa para un rendimiento sin igual

NVLink Switch es la primera arquitectura de conmutador de nivel de bastidor capaz de admitir hasta 576 GPU totalmente conectadas en una estructura de computación sin bloqueo. NVLink Switch interconecta cada par de GPU con unos increíbles 1,800 GB/s. Admite comunicación completa entre todos los componentes. Las 72 GPU de GB200 NVL72 se pueden utilizar como un solo acelerador de alto rendimiento con hasta 1,4 exaflops de potencia de computación de IA.

La plataforma de IA y HPC más potente

NVLink y NVLink Switch son elementos esenciales de la solución completa del centro de datos de NVIDIA que incorpora hardware, redes, software y bibliotecas, así como modelos y aplicaciones de IA optimizados del conjunto de software de NVIDIA AI Enterprise y el catálogo de NVIDIA NGC™. La plataforma de IA y HPC integral más potente, permite a los investigadores ofrecer resultados reales e implementar soluciones en producción, impulsando una aceleración sin precedentes a todas las escalas.

Especificaciones

NVLink
NVLink Switch

	Segunda generación	Tercera generación	Cuarta generación	5ª generación
Ancho de banda NVLink por GPU	300 GB/s	600 GB/s	900 GB/s	1,800 GB/s
Número máximo de enlaces por GPU	6	12	18	18
Arquitecturas NVIDIA compatibles	Arquitectura NVIDIA Volta™	Arquitectura NVIDIA Ampere	Arquitectura NVIDIA Hopper™	Arquitectura NVIDIA Blackwell

	Primera generación	Segunda generación	Tercera generación	NVLink Switch
Cantidad de GPU con conexión directa dentro de un dominio NVLink	Hasta 8	Hasta 8	Hasta 8	Hasta 576
Ancho de banda de GPU a GPU de NVSwitch	300 GB/s	600 GB/s	900 GB/s	1,800 GB/s
Ancho de banda agregado total	2.4 TB/s	4.8 TB/s	7.2 TB/s	1 PB/s
Arquitecturas NVIDIA compatibles	Arquitectura NVIDIA Volta™	Arquitectura NVIDIA Ampere	Arquitectura NVIDIA Hopper™	Arquitectura NVIDIA Blackwell

Las especificaciones preliminares pueden estar sujetas a cambios.

Sumérgete en la arquitectura NVIDIA Blackwell

Más información