NVIDIA Vera Rubin NVL72

Bâtir la nouvelle frontière de l'IA.

Aperçu

Sept nouvelles puces, un supercalculateur d'IA

NVIDIA Vera Rubin NVL72 unifie les technologies de pointe de NVIDIA : 72 GPU Rubin, 36 CPU Vera, SuperNIC ConnectX®-9 et DPU BlueField®-4. Il augmente l'intelligence dans une plateforme à l'échelle du rack, grâce au commutateur NVIDIA NVLink™ 6 et évolue avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle. Lorsqu'il est déployé avec des racks NVIDIA Groq 3 LPX, Vera Rubin NVL72 fournit un nouveau niveau de performances d'inférence pour les modèles comportant des trillions de paramètres et un contexte d'un million de jetons.

Vera Rubin NVL72 repose sur la conception de rack NVIDIA MGX™ NVL72 de troisième génération, ce qui permet une transition en douceur avec les générations précédentes. Elle fournit un entraînement d'IA avec un quart des GPU et une inférence d'IA pour un dixième du coût par million de jetons par rapport à NVIDIA Blackwell. Grâce à des conceptions de plateaux modulaires sans câble et à une prise en charge de plus de 80 partenaires de l'écosystème MGX, le supercalculateur d'IA à l'échelle de la baie offre des performances de classe mondiale avec un déploiement rapide.

NVIDIA lance la nouvelle génération d'IA avec Rubin

Cette plateforme de pointe facilite une adoption généralisée en réduisant le coût par jeton grâce à cinq avancées pour le raisonnement et les modèles d'IA agentique.

Lire le communiqué de presse

NVIDIA Vera Rubin repousse les frontières de l'IA agentique

La plateforme Vera Rubin offre sept nouvelles puces désormais en pleine production pour faire évoluer les usines d'IA les plus importantes au monde.

Lire le communiqué de presse

Performances

Gains d'efficacité massifs en matière d'entraînement et d'inférence de l'IA

Augmenter l'efficacité de la formation

NVIDIA Rubin entraîne des modèles MoE (Mixture-of-Expert) avec un quart du nombre de GPU par rapport à l'architecture NVIDIA Blackwell.

Performances projetées sujettes à modification. Nombre de GPU basés sur un modèle MoE 10T entraîné sur 100T de jetons sur une période fixe d'un mois.

Performances d'inférence LLM sujettes à modification. Coût par million de jetons basé sur un modèle Kimi-K2-Thinking utilisant 32K/8K ISL/OSL en comparant Blackwell NVL72 et Rubin NVL72.

Réduire les coûts d'inférence

NVIDIA Rubin offre un dixième du coût par millions de jetons par rapport à NVIDIA Blackwell pour l'IA agentique à raisonnement profond et hautement interactif.

Innovations technologiques

À l'intérieur du supercalculateur d'IA

GPU NVIDIA Rubin

Les GPU Rubin avec HBM4 et un moteur Transformer de troisième génération, conçus pour la nouvelle génération de l'IA.

CPU NVIDIA Vera

Les CPU Vera sont spécialement conçus pour les mouvements de données et le raisonnement agentique, offrant ainsi une bande passante élevée et une efficacité énergétique avec des performances déterministes.

Commutateur NVIDIA NVLink 6

Les commutateurs NVLink 6 offrent une bande passante tout-à-tous de 3,6 téraoctets par seconde (To/s) par GPU, permettant ainsi des communications GPU à GPU à haute vitesse pour l'IA.

NVIDIA ConnectX-9 SuperNIC

Les SuperNICs ConnectX‑9 offrent une bande passante de 1,6 térabit par seconde (Tbit/s) par GPU avec une technologie programmable d'accès direct à la mémoire (RDMA) pour une mise en réseau GPU directe à faible latence et à grande échelle.

DPU NVIDIA BlueField-4

Les DPU BlueField-4 accélèrent le traitement des données pour le stockage, la mise en réseau, la cybersécurité et la mise à l'échelle élastique dans les usines d'IA.

NVIDIA Spectrum-X Ethernet avec optique co-intégrée

Les commutateurs extensibles Spectrum-X Ethernet avec photonique de silicium intégrée offrent une efficacité énergétique 5 fois supérieure, une résilience réseau 10 fois plus élevée et une disponibilité jusqu'à 5 fois plus élevée que la mise en réseau traditionnelle avec des émetteurs-récepteurs enfichables.

LPU NVIDIA Groq 3

C'est notre accélérateur d'inférence pour NVIDIA Vera Rubin NVL72, conçu pour répondre aux exigences de faible latence et de grand contexte des systèmes agentiques. Le rack NVIDIA Groq 3 LPX intègre 256 LPU avec 128 Go de SRAM, une bande passante mémoire de 40 PB/s et une bande passante évolutive de 640 To/s par rack. Il est co-conçu avec Vera Rubin NVL72 pour fournir des performances d'inférence par watt 35 fois supérieures et des opportunités de revenus jusqu'à 10 fois supérieures pour les modèles à mille milliards de paramètres par rapport à Blackwell.

Spécifications¹

Spécifications de NVIDIA Vera Rubin NVL72

	NVIDIA Vera Rubin NVL72	Superpuce NVIDIA Vera Rubin	GPU NVIDIA Rubin
Configuration	72 GPU NVIDIA Rubin \| 36 CPU NVIDIA Vera	2 GPU Rubin \| 1 CPU Vera	1 GPU Rubin
Inférence NVFP4	3 600 PFLOPS	100 PFLOPS	50 PFLOPS
Entraînement NVFP4²	2 520 PFLOPS	70 PFLOPS	35 PFLOPS
Entraînement FP8/FP6²	1 260 PFLOPS	35 PFLOPS	17,5 PFlops
Dense INT8²	18 POPS	0,5 POPS	0,25 POPS
Dense FP16/BF16²	288 PFLOPS	8 PFLOPS	4 PFLOPS
Dense TF32²	144 PFlops	4 PFLOPS	2 PFlops
FP32	9 360 TFLOPS	260 TFLOPS	130 TFLOPS
FP64	2 400 TFLOPS	67 TFlops	33 TFLOPS
FP32 SGEMM³	28 800 TFLOPS	800 TFLOPS	400 TFLOPS
FP64 DGEMM³	14 400 TFLOPS	400 TFLOPS	200 TFLOPS
Mémoire GPU \| Bande passante	20.7 To HBM4 \| 1 580 To/s	576 Go HBM4 \| 44 To/s	288 Go HBM4 \| 22 To/s
Bande passante NVLink	260 To/s	7,2 To/s	3,6 To/s
Bande passante NVLink-C2C	65 To/s	1,8 To/s	-
Nombre de cœurs de CPU	3 168 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm)	88 cœurs NVIDIA Olympus personnalisés (compatibles avec Arm)	-
Mémoire CPU	54 To LPDDR5X	1,5 To LPDDR5X	-
Total des puces NVIDIA + HBM4	1 296	30	12

1. Informations préliminaires, toutes les valeurs sont approximatives et sujettes à modification
2. Spécification Dense
3. Performances maximales avec des algorithmes d'émulation basés sur le Cœur Tensor

Démarrer

Suivez l'actualité de NVIDIA

Inscrivez-vous pour recevoir les dernières informations et annonces de NVIDIA.

Restez informés