NVLink Switch Chip

NVIDIA NVLink et commutateur NVLink

Scale-up networking fabric with high-bandwidth GPU-to-GPU communications for AI training, inference, and other demanding rack-scale GPU-accelerated workloads.

La nécessité d'une interconnexion évolutive plus rapide

Atteindre les performances les plus élevées des derniers modèles d'IA requiert des communications GPU à GPU fluides et haut débit sur l'ensemble du rack de serveur. Grâce à une faible latence, une bande passante de mise en réseau massive et une connectivité complète, la sixième génération de NVIDIA NVLink™ et du commutateur NVLink est conçue pour accélérer l'entraînement et l'inférence pour un raisonnement et des charges de travail d'IA agentique plus rapides.

Performances de NVLink à grande échelle

La sixième génération NVIDIA NVLink dans NVIDIA Rubin double la bande passante de communication GPU à GPU par rapport à la génération précédente pour un entraînement et une inférence plus rapides avec les dernières architectures de modèles d'IA.

Améliorez le débit de raisonnement avec les communications NVLink

Connectez intégralement vos GPU avec NVIDIA NVLink et le commutateur NVLink

NVLink est une interconnexion bidirectionnelle directe GPU vers GPU de 3,6 To/s adaptant les entrées et sorties (IO) de plusieurs GPU au sein d'un serveur. Les puces de commutation NVIDIA NVLink connectent plusieurs NVLinks pour fournir une communication GPU complète à pleine vitesse NVLink sur l'ensemble de la baie. 

Pour mettre en œuvre des opérations collectives à haute vitesse, chaque commutateur NVLink dispose de moteurs pour le protocole SHARP™ (Scalable Hierarchical Aggregation Reduction Protocol) de NVIDIA pour la réduction de la latence et l’accélération des multi-diffusions sur le réseau.  

Accélérez les délais de raisonnement sur les modèles à plusieurs billions de paramètres grâce au système de commutation NVLink

Grâce aux commutateurs NVSwitch, les connexions NVLink peuvent être étendues sur plusieurs nœuds afin de créer un cluster de GPU multi-nœuds à haute bande passante à la fois fluide et efficace, ce qui permet de former un GPU de la taille d’un Data Center. Le commutateur NVIDIA NVLink permet une bande passante GPU de 260 To/s dans un NVIDIA Vera Rubin NVL72 pour le parallélisme des grands modèles. Les clusters multi-serveurs avec NVLink font évoluer les communications des GPU tout en équilibrant avec l'accroissement du calcul, de sorte que NVL72 peut prendre en charge jusqu'à neuf fois plus de GPU qu'un seul système à huit GPU.


Entrez dans l’ère du calcul exascale

Connexion intégrale pour des performances incomparables

La puce de commutation NVLink de Vera Rubin NVL72 permet d'interconnecter entièrement 72 GPU dans une structure de calcul sans blocage. Le commutateur NVLink interconnecte toutes les paires de GPU à une vitesse incroyable de 3,6 To/s. Il prend intégralement en charge les communications All-to-All.   Les 72 GPU du domaine Vera Rubin NVL72 peuvent être utilisés en tant qu’accélérateurs uniques à hautes performances offrant une puissance de calcul IA pouvant atteindre 3,6 exaflop. 

La plateforme d’IA et de HPC la plus puissante au monde

NVLink et le commutateur NVLink sont des composants clés de la solution de Data Center intégrale NVIDIA, qui comprend matériel, mise en réseau, logiciels, bibliothèques, ainsi que des modèles et des applications d'IA optimisés tirés de la suite logicielle NVIDIA AI Enterprise et du catalogue NVIDIA NGC™. Cette plateforme d'IA et de calcul intensif de bout en bout la plus puissante du marché permet aux chercheurs d'obtenir des résultats concrets et de déployer des solutions en production, pour une accélération sans précédent quelle que soit l'échelle.

Présentation de la plateforme NVIDIA Rubin.