NVIDIA NVLink Fusion

Infrastructure d'IA semi-personnalisée avec des performances d'IA évolutives éprouvées et une architecture à l'échelle du rack.

Aperçu

Usines d'IA semi-personnalisées avec NVLink Fusion

NVIDIA NVLink™ Fusion est une technologie de connexion à haut débit et à faible latence, ainsi qu'une propriété intellectuelle, qui permet aux hyperscalers et aux entreprises spécialisées dans l'IA de déployer des XPU et des CPU personnalisés au sein de la plateforme d'infrastructure IA de NVIDIA, leader mondial dans ce domaine. Exploitez la pile technologique et l’écosystème éprouvés de NVIDIA pour la mise à l’échelle verticale et horizontale, ainsi que l’architecture à l’échelle du rack MGX™ afin de réduire la complexité du développement, d’augmenter les performances et d’accélérer la mise sur le marché des usines d’IA semi-personnalisées. En s’appuyant sur une architecture unique et unifiée, NVLink Fusion simplifie les opérations dans l’ensemble du Data Center, permet un réprovisionnement flexible de la capacité du Data Center et permet à des XPU personnalisés de s’intégrer en toute simplicité aux GPU pour réaliser des calculs hétérogènes. 

AWS intègre l'infrastructure d'IA à NVIDIA NVLink Fusion pour le déploiement de Trainium4

Découvrez comment AWS utilise NVLink Fusion pour accélérer le déploiement de Trainium4.

Intégrer le calcul semi-personnalisé à l'architecture à l'échelle du rack avec NVIDIA NVLink Fusion

Découvrez comment NVIDIA NVLink Fusion permet aux hyperscalers de créer une infrastructure IA semi-personnalisée, en intégrant leurs ASIC ou leurs CPU aux GPU NVIDIA, tout en standardisant une infrastructure matérielle unique et évolutive.

Grâce à NVLink Fusion, les usines d'IA haute performance peuvent évoluer rapidement et tirer parti de tous les composants de la solution qui constituent l'architecture NVIDIA à l'échelle du rack.

Avantages

Avantages de NVLink Fusion

Performances évolutives de classe mondiale

Libérer le plein potentiel des usines d’IA nécessite une communication rapide et fluide entre tous les accélérateurs. NVIDIA NVLink 6 peut connecter 72 XPU en mode « all-to-all » à 3,6 To/s par XPU, avec de futures configurations de feuille de route incluant des domaines pouvant atteindre 1 152 XPU afin d’augmenter les performances d’IA et le retour sur investissement.

Écosystème technologique et une chaîne de provisionnement éprouvés en production

L’écosystème technologique complet de NVLink Fusion, qui inclut des partenaires de conception XPU, des partenaires de CPU et des fournisseurs de PI, aide les hyperscalers et les entreprises nées avec l’IA à optimiser les conceptions XPU et à rationaliser le développement. L'écosystème MGX offre une architecture complète à l'échelle du rack et relie les hyperscalers des utilisateurs à la même chaîne d'approvisionnement éprouvée que celle utilisée par NVIDIA pour ses propres systèmes basés sur MGX, ce qui élimine la complexité liée à la conception de nouveaux racks et à la gestion des fournisseurs, et accélère la mise sur le marché. 

Réapprovisionnement flexible et réduction des risques de déploiement

L’un des principaux avantages de l’adoption de l’architecture de rack MGX est que des systèmes basés sur XPU et GPU (tels que Vera Rubin NVL72) peuvent être facilement intégrés au même data center, partageant les mêmes racks et empreintes au sol, la mise en réseau, le refroidissement, l’alimentation et les systèmes de gestion. Cette approche unifiée permet aux entreprises qui ont adopté NVLink Fusion de dissocier la conception et le déploiement de data centers de la disponibilité et de l’approvisionnement en silicium, et leur permet de reprovisionner facilement la capacité des data centers avec une combinaison différente de systèmes basés sur XPU ou sur GPU à mesure que leurs besoins évoluent.

Architecture unifiée pour une infrastructure d’IA hétérogène

Les utilisateurs de NVLink Fusion peuvent déployer différents types de XPUs (ou XPU et GPU) dans le même data center pour effectuer des calculs hétérogènes pour l’inférence désagrégée et d’autres charges de travail asymétriques.

Le résultat est une usine d’IA unique et semi-personnalisée qu’aucune entreprise ne pourrait créer seule.

Plateforme

Technologie NVIDIA NVLink Fusion

NVIDIA NVLink

NVIDIA NVLink 6 et la puce de commutation NVLink permettent une bande passante de 260 To/s dans un seul domaine NVLink de 72 accélérateurs (NVL72), tout en fournissant une bande passante 4 fois plus efficace grâce à la prise en charge NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8.

NVIDIA NVLINK-C2C

NVIDIA NVLink-C2C étend la technologie de pointe NVLink à une interconnexion entre puces. Cela permet la création d'une nouvelle catégorie de produits intégrés avec les partenaires de NVIDIA, construits à l'aide de chiplets ; ainsi, les GPU ou CPU NVIDIA peuvent avoir une connexion cohérente à haut débit avec du silicium personnalisé.

Plateforme d’infrastructure d’IA

NVIDIA fournit un portefeuille modulaire de technologies d’usine d’IA, notamment des GPU de NVIDIA, des CPU de NVIDIA Vera, des commutateurs d’optique co-packagée (CPO), ConnectX SuperNIC, des DPU BlueField et des logiciels Mission Control pour optimiser les workflows d’IA et gérer l’infrastructure d’IA.

Des solutions de rack complet sont également disponibles pour l’intégration d’usines d’IA semi-personnalisées, notamment le rack Vera Rubin NVL72, qui peut être combiné avec des systèmes basés sur XPU pour une inférence désagrégée, le rack de CPU Vera pour la prise en charge des systèmes d’IA agentique et de l’apprentissage par renforcement, le rack NVIDIA LPX pour une inférence à contexte élevé et à faible latence, le rack NVIDIA STX pour le stockage natif de l’IA, ainsi que le rack NVIDIA SPX pour une mise en réseau évolutive.

Adoptants

Écosystème NVLink Fusion

Augmenter les performances de l’inférence d’IA avec NVLink Fusion

Découvrez comment NVIDIA NVLink Fusion répond aux exigences croissantes des modèles d'IA complexes.