NVIDIA Vera Rubin NVL72 à baie unique

NVIDIA Vera Rubin NVL72

Bâtir la nouvelle frontière de l'IA

Aperçu

Six nouvelles puces, un supercalculateur d'IA

NVIDIA Vera Rubin NVL72 unifie les technologies de pointe de NVIDIA : 72 GPU Rubin, 36 CPU Vera, des SuperNIC ConnectX®-9 et des DPU BlueField®-4. Il augmente l'intelligence dans une plateforme à l'échelle de la baie, grâce au commutateur NVIDIA NVLink™ 6 et évolue avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle.

Basée sur la conception rackable NVIDIA MGX™ NVL72 troisième génération, Vera Rubin NVL72 offre une transition fluide depuis les générations précédentes. Elle fournit un entraînement d'IA avec un quart des GPU et une inférence d'IA pour un septième du coût par million de jetons par rapport à NVIDIA Blackwell. Grâce à des conceptions de plateaux modulaires sans câble et à une prise en charge de plus de 80 partenaires de l'écosystème MGX, le supercalculateur d'IA à l'échelle de la baie offre des performances de classe mondiale avec un déploiement rapide.

NVIDIA lance la nouvelle génération de l'IA avec Rubin : six nouvelles puces et un supercalculateur d'IA incroyable

La plateforme de nouvelle génération facilite une adoption généralisée en réduisant le coût par jeton grâce à cinq avancées pour le raisonnement et les modèles d'IA agentique.

À l'intérieur de la plateforme NVIDIA Rubin : six nouvelles puces et un supercalculateur d'IA

Construit grâce à une cocréation extrême, NVIDIA Vera Rubin traite le centre de données, et non la puce, comme l'unité de calcul, établissant ainsi une nouvelle fondation afin de produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.

Performances

Gains d'efficacité massifs en matière d'entraînement et d'inférence de l'IA

Augmenter l'efficacité de la formation

NVIDIA Rubin entraîne des modèles MoE (Mixture-of-Expert) avec un quart du nombre de GPU par rapport à l'architecture NVIDIA Blackwell.

Performances projetées sujettes à modification. Nombre de GPU basés sur un modèle MoE 10T entraîné sur 100T de jetons sur une période fixe d'un mois.

Performances d'inférence LLM sujettes à modification. Coût par million de jetons basé sur un modèle Kimi-K2-Thinking qui utilise 32K/8K ISL/OSL en comparant Blackwell GB200 NVL72 et Rubin NVL72.

Réduire les coûts d'inférence

NVIDIA Rubin offre un dixième du coût par millions de jetons par rapport à NVIDIA Blackwell pour l'IA agentique à raisonnement profond et hautement interactif.

Innovations technologiques

À l'intérieur du supercalculateur d'IA

GPU NVIDIA Rubin

Les GPU Rubin avec HBM4 et un moteur Transformer de troisième génération, conçus pour la nouvelle génération de l'IA.

CPU NVIDIA Vera

Les CPU Vera sont spécialement conçus pour les mouvements de données et le raisonnement agentique, offrant ainsi une bande passante élevée et une efficacité énergétique avec des performances déterministes.

Commutateur NVIDIA NVLink 6

Les commutateurs NVLink 6 offrent une bande passante tout-à-tous de 3,6 téraoctets par seconde (To/s) par GPU, permettant ainsi des communications GPU à GPU à haute vitesse pour l'IA.

NVIDIA ConnectX-9 SuperNIC

Les SuperNICs ConnectX‑9 offrent une bande passante de 1,6 térabit par seconde (Tbit/s) par GPU avec une technologie programmable d'accès direct à la mémoire (RDMA) pour une mise en réseau GPU directe à faible latence et à grande échelle.

DPU NVIDIA BlueField-4

Les DPU BlueField-4 accélèrent le traitement des données pour le stockage, la mise en réseau, la cybersécurité et la mise à l'échelle élastique dans les usines d'IA.

NVIDIA Spectrum-X Ethernet avec optique co-intégrée

Les commutateurs extensibles Spectrum-X Ethernet avec photonique de silicium intégrée offrent une efficacité énergétique 5 fois supérieure, une résilience réseau 10 fois plus élevée et une disponibilité jusqu'à 5 fois plus élevée que la mise en réseau traditionnelle avec des émetteurs-récepteurs enfichables.

Spécifications¹

Spécifications de NVIDIA Vera Rubin NVL72

  NVIDIA Vera Rubin NVL72 Superpuce NVIDIA Vera Rubin GPU NVIDIA Rubin
Configuration 72 GPU NVIDIA Rubin | 36 CPU NVIDIA Vera 2 GPU Rubin | 1 CPU Vera 1 GPU Rubin
Inférence NVFP4 3 600 PFLOPS 100 PFLOPS 50 PFLOPS
Entraînement NVFP4 2 520 PFLOPS 70 PFLOPS 35 PFLOPS
Entraînement FP8/FP6 1 260 PFLOPS 35 PFLOPS 17,5 PFlops
Dense INT8² 18 POPS 0,5 POPS 0,25 POPS
Dense FP16/BF16² 288 PFLOPS 8 PFLOPS 4 PFLOPS
Dense TF32² 144 PFlops 4 PFLOPS 2 PFlops
FP32 9 360 TFLOPS 260 TFLOPS 130 TFLOPS
FP64 2 400 TFLOPS 67 TFlops 33 TFLOPS
FP32 SGEMM³ 28 800 TFLOPS 800 TFLOPS 400 TFLOPS
FP64 DGEMM³ 14 400 TFLOPS 400 TFLOPS 200 TFLOPS
Mémoire GPU | Bande passante 20.7 To HBM4 | 1 580 To/s 576 Go HBM4 | 44 To/s 288 Go HBM4 | 22 To/s
Bande passante NVLink 260 To/s 7,2 To/s 3,6 To/s
Bande passante NVLink-C2C 65 To/s 1,8 To/s -
Nombre de cœurs de CPU 3 168 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm) 88 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm) -
Mémoire CPU 54 To LPDDR5X 1,5 To LPDDR5X -
Total des puces NVIDIA + HBM4 1 296 30 12

1. Informations préliminaires, toutes les valeurs sont approximatives et sujettes à modification
2. Spécification Dense
3. Performances maximales avec des algorithmes d'émulation basés sur le Cœur Tensor

Démarrer

Suivez l'actualité de NVIDIA

Inscrivez-vous pour recevoir les dernières informations et annonces de NVIDIA.