La fondation de l'entraînement et de l'inférence de l'IA à l'échelle giga.
En raison de la convergence des lois de pré-entraînement, de post-entraînement et de mise à l'échelle du temps d'inférence, les centres de données modernes sont confrontés à des problèmes de performance et d'efficacité lorsqu'ils tentent de prendre en charge des modèles qui nécessitent des chaînes de pensée complexes et en plusieurs étapes.
Spécialement conçue pour relever ces défis, NVIDIA DGX™ Vera Rubin NVL72 est une solution d'infrastructure d'IA clé en main qui offre des performances de pointe tout en améliorant considérablement l'efficacité énergétique. DGX Vera Rubin NVL72 offre des performances de pointe par watt et par jetons par watt pour n'importe quelle charge de travail, ce qui permet aux entreprises de faire évoluer considérablement l'intelligence tout en améliorant l'économie des jetons.
DGX Vera Rubin NVL72 associe le CPU NVIDIA Vera à haute efficacité énergétique à des GPU NVIDIA Rubin afin de fournir des performances de pointe par watt. Les entreprises peuvent ainsi faire évoluer l'entraînement et l'inférence en long contexte dans le cadre de leur empreinte énergétique existante, transformant ainsi le centre de données en un moteur à haute efficacité énergétique pour l'innovation en matière d'IA.
NVIDIA DGX SuperPOD™ avec les systèmes DGX Vera Rubin NVL72 élimine les conjectures liées au déploiement d'une infrastructure d'IA à grande échelle. Grâce à une architecture de baies simple et facile à déployer, elle est conçue pour tirer parti des dernières avancées en matière d'ingénierie de centre de données.
NVIDIA Mission Control™ accélère chaque aspect des opérations, de la configuration de DGX Vera Rubin NVL72 à l'intégration des installations, en passant par la gestion des grappes et des charges de travail. Grâce à des logiciels intelligents et intégrés, les entreprises contrôlent les événements de refroidissement et d'alimentation pour redéfinir la résilience de l'infrastructure.
La plateforme NVIDIA DGX a été conçue dès le départ pour l'IA d'entreprise. Elle inclut NVIDIA DGX SuperPOD et combine le meilleur des logiciels, de l'infrastructure et de l'expertise de NVIDIA dans une solution de développement de l'IA moderne et unifiée.
| GPU and CPU | GPU NVIDIA Rubin 72x, CPU NVIDIA Vera 36x |
| Mémoire GPU totale | Bande passante | 20,7 To | Jusqu'à 28,8 To/s |
| Mémoire rapide totale | 75 To |
| Performances | NVFP4 Inference: 3,600 PFLOPS NVFP4 Training: 2,520 PFLOPS FP8/FP6 Training: 1,260 PFLOPS |
| les technologies de mise en réseau de NVIDIA | > 144x OSFP à un seul port NVIDIA® ConnectX®-9 VPI avec NVIDIA InfiniBand et Ethernet à 800 G b/s<ex id="1" equiv-text="</br>"/> > 18x NVIDIA BlueField®-4 VPI à deux ports avec NVIDIA InfiniBand et Ethernet à 400 Gb/s |
| Système NVIDIA NVLink™ Switch | 9 commutateurs NVIDIA NVLink L1 |
| Réseau de gestion | Contrôleur BMC hôte avec RJ45 |
| Logiciel | NVIDIA Mission Control, NVIDIA AI Enterprise, NVIDIA DGX OS |
| Assistance d'entreprise | Trois ans d'assistance Business Standard pour le matériel et les logiciels d'entreprise |
Specifications subject to change
Discutez avec un expert NVIDIA à propos de NVIDIA DGX Vera Rubin NVL72.
Découvrez pourquoi NVIDIA DGX est la norme éprouvée sur laquelle l'IA d'entreprise est construite.
Libérez le plein potentiel de l'IA grâce à des options de déploiement flexibles, de solutions sur site à des solutions hébergées.