Scale-up networking fabric with high-bandwidth GPU-to-GPU communications for AI training, inference, and other demanding rack-scale GPU-accelerated workloads.
Atteindre les performances les plus élevées des derniers modèles d'IA requiert des communications GPU à GPU fluides et haut débit sur l'ensemble du rack de serveur. Grâce à une faible latence, une bande passante de mise en réseau massive et une connectivité complète, la sixième génération de NVIDIA NVLink™ et du commutateur NVLink est conçue pour accélérer l'entraînement et l'inférence pour un raisonnement et des charges de travail d'IA agentique plus rapides.
NVLink de 5ᵉ génération améliore considérablement l'évolutivité des systèmes multi-GPU de grande taille en permettant aux GPU de partager leur mémoire et les calculs pour les workflows d'entraînement, d'inférence et de raisonnement. Un unique GPU NVIDIA Blackwell prend en charge jusqu'à 18 connexions NVLink à 100 giga-octets par seconde (Go/s), soit une bande passante totale de 1,8 téraoctet par seconde (To/s), c'est-à-dire deux fois plus que la génération précédente et plus de 14 fois plus qu'avec PCIe de 5ᵉ génération. Les plateformes de serveur telles que NVIDIA GB300 NVL72 tirent parti de cette technologie pour offrir une plus grande évolutivité pour les grands modèles les plus complexes d'aujourd'hui.
La sixième génération NVIDIA NVLink dans NVIDIA Rubin double la bande passante de communication GPU à GPU par rapport à la génération précédente pour un entraînement et une inférence plus rapides avec les dernières architectures de modèles d'IA.
NVLink est une interconnexion bidirectionnelle directe GPU vers GPU de 3,6 To/s adaptant les entrées et sorties (IO) de plusieurs GPU au sein d'un serveur. Les puces de commutation NVIDIA NVLink connectent plusieurs NVLinks pour fournir une communication GPU complète à pleine vitesse NVLink sur l'ensemble de la baie.
Pour mettre en œuvre des opérations collectives à haute vitesse, chaque commutateur NVLink dispose de moteurs pour le protocole SHARP™ (Scalable Hierarchical Aggregation Reduction Protocol) de NVIDIA pour la réduction de la latence et l’accélération des multi-diffusions sur le réseau.
Grâce aux commutateurs NVSwitch, les connexions NVLink peuvent être étendues sur plusieurs nœuds afin de créer un cluster de GPU multi-nœuds à haute bande passante à la fois fluide et efficace, ce qui permet de former un GPU de la taille d’un Data Center. Le commutateur NVIDIA NVLink permet une bande passante GPU de 260 To/s dans un NVIDIA Vera Rubin NVL72 pour le parallélisme des grands modèles. Les clusters multi-serveurs avec NVLink font évoluer les communications des GPU tout en équilibrant avec l'accroissement du calcul, de sorte que NVL72 peut prendre en charge jusqu'à neuf fois plus de GPU qu'un seul système à huit GPU.
NVIDIA NVLink Fusion offre une mise à l'échelle des performances d'IA de pointe pour le calcul personnalisé, permettant ainsi aux fournisseurs de services Hyperscale de développer une infrastructure d'IA commune avec la technologie NVIDIA NVLink et l'architecture à l'échelle du rack.
La puce de commutation NVLink de Vera Rubin NVL72 permet d'interconnecter entièrement 72 GPU dans une structure de calcul sans blocage. Le commutateur NVLink interconnecte toutes les paires de GPU à une vitesse incroyable de 3,6 To/s. Il prend intégralement en charge les communications All-to-All. Les 72 GPU du domaine Vera Rubin NVL72 peuvent être utilisés en tant qu’accélérateurs uniques à hautes performances offrant une puissance de calcul IA pouvant atteindre 3,6 exaflop.
NVLink et le commutateur NVLink sont des composants clés de la solution de Data Center intégrale NVIDIA, qui comprend matériel, mise en réseau, logiciels, bibliothèques, ainsi que des modèles et des applications d'IA optimisés tirés de la suite logicielle NVIDIA AI Enterprise et du catalogue NVIDIA NGC™. Cette plateforme d'IA et de calcul intensif de bout en bout la plus puissante du marché permet aux chercheurs d'obtenir des résultats concrets et de déployer des solutions en production, pour une accélération sans précédent quelle que soit l'échelle.
| Quatrième génération | Cinquième génération | Sixième génération | |
|---|---|---|---|
| Bande passante NVLink par GPU | 900 Go/s | 1800 Go/s | 3 600 Go/s |
| Architectures NVIDIA compatibles | 18 | 18 | 36 |
| Architectures NVIDIA compatibles | Architecture NVIDIA Hopper™ | Architecture NVIDIA Blackwell | NVIDIA Rubin Plateforme |
| Commutateur NVLink 4 | Commutateur NVLink 5 | Commutateur NVLink 6 | |
|---|---|---|---|
| Domaines GPU NVLink | 8 | 8 |72 | 8 |72 |
| Bande passante GPU vers GPU avec commutateur NVLink | 900 Go/s | 1 800 Go/s | 3 600 Go/s |
| Bande passante globale | 7,2 To/s | 130 To/s (NVL72) | 260 To/s (NVL72) |
| Architectures NVIDIA compatibles | Architecture NVIDIA Hopper™ | Architecture NVIDIA Blackwell | NVIDIA Rubin Plateforme |
Spécifications préliminaires susceptibles d’être modifiées.
Présentation de la plateforme NVIDIA Rubin.