Bâtir la nouvelle frontière de l'IA
Aperçu
NVIDIA Vera Rubin NVL72 unifie les technologies de pointe de NVIDIA : 72 GPU Rubin, 36 CPU Vera, des SuperNIC ConnectX®-9 et des DPU BlueField®-4. Il augmente l'intelligence dans une plateforme à l'échelle de la baie, grâce au commutateur NVIDIA NVLink™ 6 et évolue avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle.
Basée sur la conception rackable NVIDIA MGX™ NVL72 troisième génération, Vera Rubin NVL72 offre une transition fluide depuis les générations précédentes. Elle fournit un entraînement d'IA avec un quart des GPU et une inférence d'IA pour un septième du coût par million de jetons par rapport à NVIDIA Blackwell. Grâce à des conceptions de plateaux modulaires sans câble et à une prise en charge de plus de 80 partenaires de l'écosystème MGX, le supercalculateur d'IA à l'échelle de la baie offre des performances de classe mondiale avec un déploiement rapide.
Performances
NVIDIA Rubin entraîne des modèles MoE (Mixture-of-Expert) avec un quart du nombre de GPU par rapport à l'architecture NVIDIA Blackwell.
Performances projetées sujettes à modification. Nombre de GPU basés sur un modèle MoE 10T entraîné sur 100T de jetons sur une période fixe d'un mois.
Performances d'inférence LLM sujettes à modification. Coût par million de jetons basé sur un modèle Kimi-K2-Thinking qui utilise 32K/8K ISL/OSL en comparant Blackwell GB200 NVL72 et Rubin NVL72.
NVIDIA Rubin offre un dixième du coût par millions de jetons par rapport à NVIDIA Blackwell pour l'IA agentique à raisonnement profond et hautement interactif.
Innovations technologiques
Spécifications¹
| NVIDIA Vera Rubin NVL72 | Superpuce NVIDIA Vera Rubin | GPU NVIDIA Rubin | |
|---|---|---|---|
| Configuration | 72 GPU NVIDIA Rubin | 36 CPU NVIDIA Vera | 2 GPU Rubin | 1 CPU Vera | 1 GPU Rubin |
| Inférence NVFP4 | 3 600 PFLOPS | 100 PFLOPS | 50 PFLOPS |
| Entraînement NVFP4 | 2 520 PFLOPS | 70 PFLOPS | 35 PFLOPS |
| Entraînement FP8/FP6 | 1 260 PFLOPS | 35 PFLOPS | 17,5 PFlops |
| Dense INT8² | 18 POPS | 0,5 POPS | 0,25 POPS |
| Dense FP16/BF16² | 288 PFLOPS | 8 PFLOPS | 4 PFLOPS |
| Dense TF32² | 144 PFlops | 4 PFLOPS | 2 PFlops |
| FP32 | 9 360 TFLOPS | 260 TFLOPS | 130 TFLOPS |
| FP64 | 2 400 TFLOPS | 67 TFlops | 33 TFLOPS |
| FP32 SGEMM³ | 28 800 TFLOPS | 800 TFLOPS | 400 TFLOPS |
| FP64 DGEMM³ | 14 400 TFLOPS | 400 TFLOPS | 200 TFLOPS |
| Mémoire GPU | Bande passante | 20.7 To HBM4 | 1 580 To/s | 576 Go HBM4 | 44 To/s | 288 Go HBM4 | 22 To/s |
| Bande passante NVLink | 260 To/s | 7,2 To/s | 3,6 To/s |
| Bande passante NVLink-C2C | 65 To/s | 1,8 To/s | - |
| Nombre de cœurs de CPU | 3 168 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm) | 88 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm) | - |
| Mémoire CPU | 54 To LPDDR5X | 1,5 To LPDDR5X | - |
| Total des puces NVIDIA + HBM4 | 1 296 | 30 | 12 |
1. Informations préliminaires, toutes les valeurs sont approximatives et sujettes à modification
2. Spécification Dense
3. Performances maximales avec des algorithmes d'émulation basés sur le Cœur Tensor
Démarrer
Inscrivez-vous pour recevoir les dernières informations et annonces de NVIDIA.