Plateforme NVIDIA Rubin

Plateforme NVIDIA Rubin

Façonner la nouvelle génération d'IA.

Aperçu

Propulser l'ère de l'IA agentique

La plateforme NVIDIA Rubin est conçue pour l'ère de l'IA agentique et du raisonnement, et elle est pensée pour maîtriser la résolution de problèmes en plusieurs étapes et les workflows massifs à long contexte à grande échelle. En éliminant les goulets d'étranglement critiques en matière de communication et de mouvement de mémoire, la plateforme Rubin booste l'inférence, fournissant plus de jetons par watt et réduisant le coût par jeton par rapport à la génération NVIDIA Blackwell.

NVIDIA lance la nouvelle génération de l'IA avec Rubin : six nouvelles puces et un supercalculateur d'IA incroyable

Cette plateforme de pointe facilite une adoption généralisée en réduisant le coût par jeton grâce à cinq avancées pour le raisonnement et les modèles d'IA agentique.

Découvrez les avancées technologiques

Moteur de transformation

La plateforme Rubin comprend un nouveau moteur Transformer avec compression adaptative accélérée par le matériel pour augmenter les performances NVFP4 tout en préservant la précision, permettant jusqu'à 50 pétaFLOPS d'inférence NVFP4. Entièrement compatible avec NVIDIA Blackwell, le Transformer Engine garantit des mises à niveau fluides, ce qui permet une transition sans effort des codes précédemment optimisés vers la plateforme Rubin.

Informatique confidentielle de troisième génération

La troisième génération de NVIDIA Confidential Computing déploie la sécurité à l'échelle full-rack avec NVIDIA Vera Rubin NVL72. Cette plateforme crée un environnement d'exécution de confiance, unifié sur les 36 CPU NVIDIA Vera, les 72 GPU NVIDIA Rubin et la structure NVIDIA NVLink™ qui les connecte de manière transparente. La plateforme préserve la sécurité des données dans les domaines CPU, GPU et NVLink. Avec des services d’attestation offrant une preuve cryptographique de conformité, elle allie une mise à l’échelle massive à une protection sans compromis, afin de sécuriser les plus grands modèles propriétaires au monde, ainsi que les données d’entraînement et les charges de travail d’inférence.

NVLink de sixième génération et commutateur NVLink

La technologie NVLink de sixième génération offre une avancée majeure en matière de structure d'interconnexion GPU à haute vitesse de NVIDIA qui unifie 72 GPU NVIDIA Rubin dans un seul domaine de performance. En doublant les performances de NVIDIA Blackwell, Rubin fournit 3,6 téraoctets par seconde (To/s) de bande passante par GPU et 260 To/s de connectivité avec une faible latence pour faciliter une communication plus rapide. Combinée au protocole d'agrégation et de réduction hiérarchique évolutif de NVIDIA® (SHARP)™, qui réduit jusqu'à 50 % la congestion du réseau pour les opérations collectives, cette interconnexion de nouvelle génération accélère l'entraînement et l'inférence des plus grands modèles au monde, à grande échelle et sans compromis.

Moteur de fiabilité, de disponibilité et de maintenabilité (RAS) de deuxième génération

La plateforme NVIDIA Rubin offre une résilience rack-scale avec des fonctionnalités de fiabilité avancées. Les GPU NVIDIA Rubin sont dotés d'un moteur RAS de deuxième génération dédié pour une maintenance proactive et des vérifications d'état en temps réel sans interruption, tandis que les CPU NVIDIA Vera offrent une amélioration de la facilité de maintenance avec SOCAMM LPDDR5X et des tests intégrés pour les cœurs de CPU. Le rack introduit des conceptions modulaires sans câble pour un assemblage et une facilité de service 18 fois plus rapides que NVIDIA Blackwell, combinées à une résilience intelligente et à un routage NVLink défini par logiciel, ce qui garantit un fonctionnement continu et réduit les frais de maintenance.

CPU NVIDIA Vera

Le CPU NVIDIA Vera est conçu pour les mouvements de données et le raisonnement agentique sur des systèmes accélérés, avec une prise en charge complète du calcul confidentiel. Il s'associe parfaitement aux GPU NVIDIA ou fonctionne de manière indépendante pour les charges de travail d'analyse, de Cloud, d'orchestration, de stockage et de calcul haute performance (HPC). Vera combine 88 cœurs conçus par NVIDIA, jusqu'à 1,2 To/s de bande passante mémoire LPDDR5X et la structure de cohérence évolutive NVIDIA pour offrir des performances prévisibles et écoénergétiques pour les charges de travail à haute intensité de données et de mémoire, avec une compatibilité complète avec Arm®. La connectivité NVLink-C2C intégrée permet un accès à la mémoire CPU-GPU cohérent à bande passante élevée afin de maximiser l'utilisation et l'efficacité du système.

Explorer les produits NVIDIA Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifie 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, des SuperNIC NVIDIA ConnectX®-9 et des DPU NVIDIA BlueField®-4. Il déploie l'intelligence dans une plateforme rack-scale en intégrant la sixième génération de NVLink et de commutateurs NVLink, et s'étend grâce à NVIDIA Quantum-X800 InfiniBand et NVIDIA Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA à grande échelle.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 fournit aux entreprises une solution d'infrastructure d'IA clé en main et prête à être déployée basée sur la plateforme NVIDIA Rubin, spécialement conçue pour être déployée à grande échelle afin d'accélérer les modèles d'IA les plus complexes.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 est un système d'IA à refroidissement liquide alimenté par huit GPU NVIDIA Rubin et NVLink de sixième génération, spécialement conçu pour accélérer l'entraînement, l'inférence et le post-entraînement de toutes les charges de travail d'IA.

À l'intérieur de la plateforme NVIDIA Rubin : six nouvelles puces et un supercalculateur d'IA

Lisez cette étude technique approfondie pour découvrir comment NVIDIA Vera Rubin traite le centre de données, et non la puce, comme l'unité de calcul, établissant ainsi une nouvelle base pour produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.