Le CPU pour l'ère de l'IA.
Aperçu
NVIDIA Vera est conçu pour le travail du CPU derrière l'IA agentique et l'apprentissage par renforcement (RL), notamment l'exécution de code, l'utilisation des outils, le sandboxing, l'analyse, les pipelines de données et l'orchestration au-delà du modèle. En tant que CPU hôte pour les systèmes accélérés et CPU autonome pour les charges de travail d'usine d'IA, Vera alimente les GPU, permet aux agents d'être réactifs et assure la progression des boucles d'entraînement. Grâce à des cœurs NVIDIA Olympus rapides et écoénergétiques et à une mémoire LPDDR5X à bande passante élevée, Vera fournit des performances d'environnement de style bac à sable jusqu'à 80 % plus rapides que celles des infrastructures CPU traditionnelles, ce qui aide les usines d'IA à générer plus de jetons par dollar."
Le rack de CPU NVIDIA Vera alimente l'apprentissage par renforcement et l'IA agentique à l'échelle des usines d'IA. Basé sur NVIDIA MGX™, il intègre jusqu'à 256 CPU Vera pour exécuter simultanément plus de 22 500 environnements.
Points-clés
L'IA agentique est freinée par les CPU traditionnels. Tout au long de la boucle de raisonnement d'un agent, le CPU compile le code généré, exécute des chaînes d'outils Python et analyse le code logiciel. NVIDIA Vera accélère les trois charges de travail jusqu'à 1,8 fois par rapport aux principaux CPU x86, stimulant ainsi la boucle interne agentique pour maximiser la production des usines d'IA.
Performances relatives basées sur des données mesurées et susceptibles d'être modifiées. CPU NVIDIA Vera avec des performances LPDDR5X, évalué par rapport à un CPU x86 de dernière génération.
Performances relatives basées sur les données mesurées et sujettes à modification. CPU NVIDIA Vera avec des performances LPDDR5X, comparé à un CPU x86 de dernière génération avec DDR5 pour les principales métriques de performance de mémoire CPU.
La technologie DDR5 traditionnelle oblige à faire un compromis entre bande passante, efficacité et maintenabilité. NVIDIA Vera associe la mémoire LPDDR5X à des modules détachables et remplaçables sur le terrain SOCAMM, qui fournissent une efficacité à faible consommation (LP) avec une flexibilité de niveau serveur et une capacité évolutive. Il en résulte une bande passante 2 fois plus importante, une bande passante 3 fois plus importante par cœur et une efficacité énergétique 4 fois plus élevée que les principaux CPU x86 avec DDR5, permettant une production plus élevée des usines d'IA à l'échelle de l'hyperscale et de l'entreprise.
Cas d'utilisation
Fonctionnalités
Conçu pour les exigences de l'apprentissage par renforcement et de l'IA agentique, NVIDIA Vera combine des cœurs Olympus conçus sur mesure, une mémoire LPDDR5X à bande passante élevée et la structure NVIDIA Scalable Coherency Fabric (SCF) à faible latence. Grâce à une connectivité NVIDIA NVLink™-C2C, à un calcul confidentiel et à une compatibilité complète avec Arm®, Vera s'étend aux systèmes accélérés et aux environnements de Data Centers modernes. Son architecture de calcul monolithique garantit la réactivité des environnements logiciels et la circulation des données, ce qui maximise le débit, l'efficacité énergétique et l'utilisation des GPU pour les charges de travail d'IA, d'analyse et de HPC.
NVIDIA Vera Rubin NVL72 unifie des technologies de pointe de NVIDIA : 72 GPU Rubin, 36 CPU Vera, des SuperNIC ConnectX®-9 et des DPU BlueField-4. Il augmente l'intelligence dans une plateforme rackable avec le commutateur NVLink 6 et s'étend avec NVIDIA Quantum-X800 InfiniBand et Spectrum-X™ Ethernet pour alimenter la révolution industrielle de l'IA.
Démarrage
Inscrivez-vous pour recevoir les dernières informations et annonces de NVIDIA.