Plateforme NVIDIA Rubin

Plateforme NVIDIA Rubin

Façonner l'ère du raisonnement agentique.

Aperçu

Propulser l'ère de l'IA agentique

NVIDIA Rubin est conçu pour l'ère de l'IA agentique et des modèles de raisonnement en s'attaquant à la résolution de problèmes en plusieurs étapes et au flux de travail à contexte long à l'échelle. En éliminant les goulets d'étranglement en matière de communication, de coordination et de mouvement de mémoire, NVIDIA Rubin offre une évolutivité et une efficacité inégalées, permettant aux agents autonomes de raisonner, d'agir et d'innover à l'échelle.

Tout savoir sur NVIDIA Vera Rubin NVL72 : l'architecture de plateforme qui propulse la prochaine génération d'usines d'IA

Construit grâce à une cocréation extrême, NVIDIA Vera Rubin traite le centre de données, et non la puce, comme l'unité de calcul, établissant ainsi une nouvelle fondation afin de produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.

Découvrez les avancées technologiques

Moteur de transformation de troisième génération

Le Transformer Engine de troisième génération repousse considérablement la frontière des performances d'IA en fournissant des performances d'inférence en phase de contexte deux fois plus rapides pour les architectures de modèles de pointe telles que le mélange d'experts (MoE). Pour ce faire, il utilise son unité d'accélération adaptative (AAU), qui orchestre intelligemment l'exécution en sélectionnant de manière dynamique des chemins de calcul optimaux et en activant des instructions spécialisées. Ces optimisations améliorent les opérations d'attention, permettant ainsi d'atteindre un débit plus élevé, un coût par jeton plus économique et une efficacité évolutive des charges de travail d'IA générative de nouvelle génération.

Informatique confidentielle de troisième génération

La troisième génération de NVIDIA Confidential Computing comprend le CPU NVIDIA Vera qui étend la sécurité à l'échelle complète de la baie, grâce à NVIDIA Vera Rubin NVL72. Cette plateforme crée un environnement d'exécution de confiance, unifié sur 36 CPU NVIDIA Vera, 72 GPU NVIDIA Rubin et sur l'interconnexion NVIDIA NVLink™ à 260 téraoctets par seconde (To/s) qui les connecte de manière transparente. Il sécurise l'ensemble du cycle de vie de l'IA, du pré-entraînement et du post-entraînement à l'inférence, tout en isolant les modèles, les données et les invites propriétaires des fournisseurs de Cloud et des autres locataires. Grâce à des services d'attestation de preuve cryptographique de conformité et à un débit quasi non chiffré rendu possible par NVLink-C2C, NVL72 combine une évolutivité massive avec une protection sans compromis, faisant ainsi de la confidentialité un atout en matière de performances.

NVLink de sixième génération et commutateur NVLink

La technologie NVLink de sixième génération offre une avancée majeure en matière de structure d'interconnexion GPU à haute vitesse de NVIDIA qui unifie 72 GPU NVIDIA Rubin dans un seul domaine de performance. Il fournit une bande passante de 3,6 To/s par GPU et une connectivité de 260 To/s (deux fois plus que NVIDIA Blackwell) avec une faible latence afin de faciliter une communication plus rapide. Combiné au protocole d'agrégation et de réduction hiérarchique évolutif (SHARP)™, pour une efficacité exceptionnelle de la bande passante, cette interconnexion de nouvelle génération accélère l'entraînement et l'inférence des plus grands modèles au monde, à grande échelle et sans compromis.

Moteur de fiabilité, de disponibilité et de maintenabilité (RAS) de deuxième génération

NVIDIA Vera Rubin NVL72 offre une résilience à l'échelle de la baie avec des fonctionnalités de fiabilité avancées. Les GPU NVIDIA Rubin sont dotés d'un moteur RAS de deuxième génération dédié pour une maintenance proactive et des vérifications d'état en temps réel sans interruption, tandis que les CPU NVIDIA Vera offrent une amélioration de la facilité de maintenance avec SOCAMM LPDDR5X et des tests intégrés pour les cœurs de CPU. La conception modulaire et sans câble de la baie, combinée à un basculement intelligent et à un routage NVLink défini par logiciel, garantit un fonctionnement continu et réduit les frais de maintenance.

CPU NVIDIA Vera

Le CPU NVIDIA Vera est conçu pour le transfert de données et le raisonnement agentique sur des systèmes accélérés. Il s'associe parfaitement aux GPU NVIDIA ou fonctionne de manière indépendante pour les charges de travail d'analyse, de Cloud, d'orchestration, de stockage et de calcul haute performance (HPC). Avec 88 cœurs haute performance conçus par NVIDIA, jusqu'à 1,2 To/s de bande passante mémoire LPDDR5X et une structure de cohérence évolutive NVIDIA, NVIDIA Vera offre des performances prévisibles et écoénergétiques pour les charges de travail intensives de données et de mémoire. La connectivité NVLink-C2C intégrée permet un accès à la mémoire CPU-GPU cohérent et à bande passante élevée, maximisant ainsi l'utilisation du système, l'efficacité et le retour sur investissement. ​​

Explorer les produits NVIDIA Rubin

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 unifie 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, 144 SuperNIC NVIDIA ConnectX®-9 et 18 DPU NVIDIA BlueField®-4. Il augmente l'intelligence dans une plateforme cohérente à l'échelle de la baie avec NVLink 6 et s'étend avec NVIDIA Quantum-X800 InfiniBand et NVIDIA Spectrum-X™ Ethernet pour soutenir la révolution industrielle de l'IA à grande échelle.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 fournit aux entreprises une solution d'infrastructure d'IA clé en main et prête à être déployée sur l'architecture NVIDIA Vera Rubin, spécialement conçue pour être déployée à l'échelle pour accélérer les modèles d'IA les plus complexes.

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 est un système d'IA à refroidissement liquide alimenté par huit GPU NVIDIA Rubin et NVLink de sixième génération, spécialement conçu pour accélérer l'entraînement, l'inférence et le post-entraînement de toutes les charges de travail d'IA.

Tout savoir sur NVIDIA Vera Rubin NVL72 : l'architecture de plateforme qui alimente la prochaine vague d'usines d'IA

Construit grâce à une cocréation extrême, NVIDIA Vera Rubin traite le centre de données, et non la puce, comme l'unité de calcul, établissant ainsi une nouvelle fondation afin de produire de l'intelligence de manière efficace, sécurisée et prévisible à grande échelle.