Infrastructure d'IA semi-personnalisée avec des performances d'IA évolutives éprouvées et une architecture à l'échelle du rack.
NVIDIA NVLink™ Fusion est une technologie de connexion à haut débit et à faible latence, ainsi qu'une propriété intellectuelle, qui permet aux hyperscalers et aux entreprises spécialisées dans l'IA de déployer des XPU et des CPU personnalisés au sein de la plateforme d'infrastructure IA de NVIDIA, leader mondial dans ce domaine. Exploitez la pile technologique et l’écosystème éprouvés de NVIDIA pour la mise à l’échelle verticale et horizontale, ainsi que l’architecture à l’échelle du rack MGX™ afin de réduire la complexité du développement, d’augmenter les performances et d’accélérer la mise sur le marché des usines d’IA semi-personnalisées. En s’appuyant sur une architecture unique et unifiée, NVLink Fusion simplifie les opérations dans l’ensemble du Data Center, permet un réprovisionnement flexible de la capacité du Data Center et permet à des XPU personnalisés de s’intégrer en toute simplicité aux GPU pour réaliser des calculs hétérogènes.
Avantages
Libérer le plein potentiel des usines d’IA nécessite une communication rapide et fluide entre tous les accélérateurs. NVIDIA NVLink 6 peut connecter 72 XPU en mode « all-to-all » à 3,6 To/s par XPU, avec de futures configurations de feuille de route incluant des domaines pouvant atteindre 1 152 XPU afin d’augmenter les performances d’IA et le retour sur investissement.
L’écosystème technologique complet de NVLink Fusion, qui inclut des partenaires de conception XPU, des partenaires de CPU et des fournisseurs de PI, aide les hyperscalers et les entreprises nées avec l’IA à optimiser les conceptions XPU et à rationaliser le développement. L'écosystème MGX offre une architecture complète à l'échelle du rack et relie les hyperscalers des utilisateurs à la même chaîne d'approvisionnement éprouvée que celle utilisée par NVIDIA pour ses propres systèmes basés sur MGX, ce qui élimine la complexité liée à la conception de nouveaux racks et à la gestion des fournisseurs, et accélère la mise sur le marché.
L’un des principaux avantages de l’adoption de l’architecture de rack MGX est que des systèmes basés sur XPU et GPU (tels que Vera Rubin NVL72) peuvent être facilement intégrés au même data center, partageant les mêmes racks et empreintes au sol, la mise en réseau, le refroidissement, l’alimentation et les systèmes de gestion. Cette approche unifiée permet aux entreprises qui ont adopté NVLink Fusion de dissocier la conception et le déploiement de data centers de la disponibilité et de l’approvisionnement en silicium, et leur permet de reprovisionner facilement la capacité des data centers avec une combinaison différente de systèmes basés sur XPU ou sur GPU à mesure que leurs besoins évoluent.
Les utilisateurs de NVLink Fusion peuvent déployer différents types de XPUs (ou XPU et GPU) dans le même data center pour effectuer des calculs hétérogènes pour l’inférence désagrégée et d’autres charges de travail asymétriques.
Le résultat est une usine d’IA unique et semi-personnalisée qu’aucune entreprise ne pourrait créer seule.
Plateforme
NVIDIA NVLink 6 et la puce de commutation NVLink permettent une bande passante de 260 To/s dans un seul domaine NVLink de 72 accélérateurs (NVL72), tout en fournissant une bande passante 4 fois plus efficace grâce à la prise en charge NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8.
NVIDIA NVLink-C2C étend la technologie de pointe NVLink à une interconnexion entre puces. Cela permet la création d'une nouvelle catégorie de produits intégrés avec les partenaires de NVIDIA, construits à l'aide de chiplets ; ainsi, les GPU ou CPU NVIDIA peuvent avoir une connexion cohérente à haut débit avec du silicium personnalisé.
NVIDIA fournit un portefeuille modulaire de technologies d’usine d’IA, notamment des GPU de NVIDIA, des CPU de NVIDIA Vera, des commutateurs d’optique co-packagée (CPO), ConnectX SuperNIC, des DPU BlueField et des logiciels Mission Control pour optimiser les workflows d’IA et gérer l’infrastructure d’IA.
Des solutions de rack complet sont également disponibles pour l’intégration d’usines d’IA semi-personnalisées, notamment le rack Vera Rubin NVL72, qui peut être combiné avec des systèmes basés sur XPU pour une inférence désagrégée, le rack de CPU Vera pour la prise en charge des systèmes d’IA agentique et de l’apprentissage par renforcement, le rack NVIDIA LPX pour une inférence à contexte élevé et à faible latence, le rack NVIDIA STX pour le stockage natif de l’IA, ainsi que le rack NVIDIA SPX pour une mise en réseau évolutive.
Adoptants
Découvrez comment NVIDIA NVLink Fusion répond aux exigences croissantes des modèles d'IA complexes.