Aperçu
Les modèles d'IA agentique et de raisonnement redéfinissent les limites du calcul. Mais pour pleinement profiter de ces avancées, les entreprises ont besoin d'une infrastructure capable de raisonner à l'interne et de transmettre rapidement des informations entre les modèles et les agents. L'infrastructure doit prendre en charge de manière rentable la communication, la coordination, le mouvement de mémoire et la latence pendant l'entraînement, le post-entraînement et l'inférence.
NVIDIA DGX™ Rubin NVL8 fournit un modèle pour réussir à l'ère de l'IA agentique. Basé sur l'architecture NVIDIA Rubin, le DGX Rubin NVL8 est une solution d'infrastructure clé en main spécialement conçue pour accélérer n'importe quelle charge de travail d'IA et fournir de l'intelligence à l'échelle.
Fonctionnalités
Alimentés par huit GPU NVIDIA Rubin, les systèmes DGX Rubin NVL8 fournissent des performances d'inférence de 400 pétaflops et de 160 téraoctets par seconde (To/s) de mémoire à bande passante élevée (HBM), garantissant que les données soient transportées via l'infrastructure le plus rapidement possible. Le DGX Rubin NVL8 tire parti de la technologie NVIDIA NVLink™ de sixième génération afin de garantir une communication fluide entre pairs pour un parallélisme de modèles massif .
DGX Rubin NVL8 améliore considérablement la viabilité économique en optimisant les performances tout au long du cycle de vie de l'IA. Il dispose d'un moteur multi-agents spécialisé pour les workflows de raisonnement et d'un moteur d'apprentissage par renforcement dédié qui optimise les déplacements de mémoire dans le matériel, offrant ainsi un apprentissage par renforcement jusqu'à 3 fois plus rapide que les systèmes basés sur NVIDIA Blackwell.
NVIDIA Mission Control™ accélère chaque aspect des opérations, de la configuration de DGX Rubin NVL8 à l'intégration des installations, en passant par la gestion des grappes et des charges de travail. Grâce à des logiciels intelligents et intégrés, les entreprises contrôlent les événements de refroidissement et d'alimentation pour redéfinir la résilience de l'infrastructure.
La plateforme NVIDIA DGX a été conçue dès le départ pour l'IA d'entreprise. Elle inclut NVIDIA DGX SuperPOD et combine le meilleur des logiciels, de l'infrastructure et de l'expertise de NVIDIA dans une solution de développement de l'IA moderne et unifiée.
Spécifications
| GPU | 8x GPU NVIDIA Rubin |
| Mémoire GPU totale | Bande passante | 2,3 To | 160 To/s |
| Performances | NVFP4 Inference: 400 PF NVFP4 Training: 280 PF FP8/FP6 Training: 140 PF |
| CPU | 2x processeurs Intel® Xeon® 6776P |
| Système de commutation NVIDIA NVLink | 4 fois |
| Bande passante NVIDIA NVLink | Bande passante totale de 28,8 To/s |
| Consommation système | ~24 kW |
| les technologies de mise en réseau de NVIDIA | 8x ports OSFP desservant 8x NVIDIA® ConnectX®-9 VPI à port unique
|
| Logiciel | NVIDIA DGX OS, Ubuntu, Red Hat Enterprise Linux, Rocky |
|
Spécifications sujettes à modification. |
|
Offres
Parlez à un expert de NVIDIA à propos de NVIDIA DGX Rubin NVL8.
Découvrez pourquoi NVIDIA DGX est la norme éprouvée sur laquelle l'IA d'entreprise est construite.
Libérez le plein potentiel de l'IA grâce à des options de déploiement flexibles, de solutions sur site à des solutions hébergées.