CPU NVIDIA Grace Superchip

CPU NVIDIA Grace Superchip

Découvrez un CPU révolutionnaire dédié aux Data Centers modernes.

Conçu pour répondre aux besoins en matière de performance et d'efficacité des Data Centers d'IA actuels

Le CPU NVIDIA Grace™ est conçu pour un nouveau type de Data Center, qui traite des quantités importantes de données pour produire des informations avec une efficacité énergétique maximale. Ces Data Centers exécutent diverses charges de travail telles que l'IA, l'analyse de données, les applications Hyperscale dans le Cloud et le calcul haute performance (HPC). Pour répondre aux besoins les plus exigeants des Data Centers, Grace fournit des performances par watt et une densité deux fois supérieures, ainsi qu'une bande passante mémoire la plus élevée par rapport aux principaux serveurs actuels.

Le processeur Grace combine 72 cœurs Arm® Neoverse™ V2 hautes performances et économes en énergie, connectés à la structure de cohérence évolutive (SCF) de NVIDIA, laquelle fournit 3,2 To/s de bande passante de bisection, soit le double de celles des processeurs classiques pour offrir des performances maximales, tout en assurant une compatibilité totale avec l'écosystème Arm. Grace est le premier CPU de Data Center à utiliser la mémoire vive haute vitesse LPDDR5X de classe serveur avec un grand sous-système de mémoire qui offre jusqu'à 500 Go/s de bande passante à un cinquième de la puissance de la mémoire DDR classique à un coût similaire.

LaunchPad du CPU NVIDIA Grace Superchip

Dans ce laboratoire gratuit, vous pourrez acquérir une expérience pratique sur le CPU NVIDIA Grace Superchip et interagir avec des démonstrations de sa bande passante mémoire et de son environnement logiciel.

Découvrez le CPU NVIDIA Grace

CPU NVIDIA Grace Superchip

La CPU Grace Superchip est composée de deux puces CPU Grace connectées de manière cohérente sur système Chip-to-Chip (C2C) NVIDIA NVLink™ à 900 Go/s. Elle contient 144 cœurs Neoverse V2 sur un seul module, avec une mémoire LPDDR5X de classe serveur qui fournit jusqu'à 1 To/s de bande passante mémoire. Le CPU Grace Superchip intègre le cœur d'un serveur à deux sockets dans un module compact, offrant 2 fois plus de performances à puissance égale que les processeurs de serveur classiques avec mémoire DDR5.

CPU NVIDIA Grace C1

Le NVIDIA Grace C1 est une plateforme de serveur hautes performances à socket unique optimisée pour les plateformes évolutives et à l'Edge, notamment pour le Cloud hyperscale, le CDN, le stockage, les télécommunications et d'autres plateformes hautes performances à l'Edge, qui ne compromet ni les performances ni la bande passante. Cette plateforme offre des performances x86 haut de gamme avec un capacité de configuration de 140 W à 250 W pour le processeur Grace et la mémoire LPDDR5X, contre plus de 400 W pour les plateformes x86 similaires. La structure de cohérence évolutive conçue par NVIDIA permet au processeur Grace d'offrir une efficacité énergétique 2 fois supérieure à celle des principales plateformes x86.

Highlights

Doublez la productivité du Data Center ou réduisez la consommation d'énergie de moitié avec le CPU Grace

Analyse de graphes

3 fois

Analyse de données

2 fois

Météo

2 fois

Microservices

1,6 fois

NVIDIA Grace Superchip avec 480 Go de mémoire vive LPDDR5X, AMD EPYC 9654 avec 768 Go de mémoire vive DDR5. Système d'exploitation : Ubuntu 22.04 Compilateurs : GCC 12.3 sauf indication contraire ci-dessous. La puissance pour l'efficacité énergétique comprend la puissance mesurée par le CPU et la mémoire vive. Analyse de graphes : Gap Benchmarks Suite BFS arXiv:1508.03619 [cs.DC], 2015. Analyse de données : HiBench et K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0 ; Grace : NVHPC 24.5, x86 : Intel 2021.4) Météo : ICON QUBICC avec résolution sur 80 km NVHPC 24.5 (Grace) ICC 2021.4 (x86) Microservices : Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N instances en parallèle)

Analyse de graphes

Le CPU NVIDIA Grace Superchip connecte les cœurs Arm Neoeverse V2 à une structure de cohérence évolutive de NVIDIA offrant des performances ultra rapides pour des charges de travail telles que GapBS Breadth First Search, qui met l'accent sur la communication et la synchronisation entre cœurs. NVIDIA Grace offre plus de 2 fois plus de performances au niveau du serveur et une efficacité énergétique 3 fois supérieure par rapport aux principaux systèmes x86.

Analyse de données

À mesure que les données continuent de croître, les entreprises doivent maximiser l'apprentissage de leurs données pour être compétitives. La suite HiBench teste les clusters K-means pour la découverte de connaissances et l'exploration de données, et tire parti de la mémoire à bande passante élevée et à faible consommation du processeur NVIDIA Grace. Le processeur Grace est plus de 2 fois plus économe en énergie que les principaux processeurs x86 actuellement commercialisés.

Météo

Les modèles de prévision météorologique sont un cas d'utilisation important pour le calcul haute performance (HPC) et sont essentiels pour comprendre et répondre aux changements météorologiques dus au changement climatique. La mémoire LPDDR5X à haute bande passante et économe en énergie du CPU Grace, qui offre jusqu'à 500 Go/s de bande passante pour environ 16 W seulement, lui permet de multiplier par deux le volume de travail avec la même enveloppe énergétique par rapport aux solutions x86 existantes.

Microservices

Les microservices sont un ensemble de petits services indépendants qui permettent aux Data Centers de s'adapter facilement pour répondre à la demande. Ils offrent également la flexibilité nécessaire pour gérer des services sans affecter l'ensemble de l'application. Google Protobufs mesure la rapidité avec laquelle le système peut sérialiser et analyser les données nécessaires à l'échange de données entre des systèmes essentiels à l'exécution des microservices. Les hautes performances et l'efficacité énergétique du processeur NVIDIA Grace offrent des performances et une efficacité énergétique de premier plan pour maximiser le débit du Data Center.

Caractéristiques

Avancées technologiques

Cœurs Arm Neoverse V2

Au cœur du Grace CPU se trouvent les cœurs de processeur Arm Neoverse V2, le cœur de Data Center le plus performant commercialisé actuellement par Arm. Les cœurs Neoverse V2 sont optimisés pour offrir des performances par cœur de pointe, tout en offrant une efficacité incroyable par rapport aux processeurs classiques. Le processeur Grace intègre 72 cœurs et offre deux fois plus de performances dans la même enveloppe énergétique que les principaux processeurs x86 lorsqu'il est associé à la mémoire LPDDR5X et à la structure de cohérence évolutive NVIDIA.

Structure de cohérence évolutive NVIDIA

La structure de cohérence évolutive (SCF) de NVIDIA est une structure maillée et de cache distribué conçue par NVIDIA pour répondre de manière efficace aux défis posés par la mise à l'échelle des cœurs et de la bande passante en matière de consommation et d'espace. SCF fournit plus de 3,2 To/s de bande passante de bisection au total, soit le double de celle des processeurs classiques, pour assurer la circulation des données entre les cœurs, la mémoire et les E/S du système. La SCF réduit les goulots d'étranglement dans les applications nécessitant des mouvements de données, telles que l'analyse de graphes, pour laquelle NVIDIA Grace offre jusqu'à deux fois plus de performances que les principaux serveurs x86.

Mémoire LPDDR5X

Le CPU NVIDIA Grace est le premier processeur de serveur à exploiter la mémoire LPDDR5X avec une fiabilité de niveau serveur grâce à des mécanismes avancés tels que le code correcteur d'erreurs (ECC). La mémoire LPDDR5X de NVIDIA Grace allie coût, puissance, bande passante et capacité. Elle fournit jusqu'à 500 Go/s avec seulement 16 W, soit environ un cinquième de la puissance de la mémoire DDR5 conventionnelle.

Socket unique et double socket

La gamme de processeurs Grace de NVIDIA comprend la puce Grace Superchip qui constitue le cœur d'un serveur à double socket, avec 144 cœurs Neoverse V2 et jusqu'à 960 Go de mémoire vive LPDDR5X dans un seul module compact, qui ne nécessite que 500 W pour le processeur et la mémoire vive. Dans un souci de flexibilité, le CPU Grace C1 offre des performances incroyables avec 72 cœurs Neoverse V2 connectés par une structure de cohérence évolutive NVIDIA ultra-rapide dans une configuration à socket unique, optimisée pour les déploiements dans le Cloud, le stockage, l'Edge et les entreprises de télécommunications afin de doubler les performances par Watt des serveurs x86 conventionnels.

Actualités

Révolutionner l'efficacité des Data Centers avec la famille NVIDIA Grace

Proposé dans un module compact à deux prises, le CPU Grace Superchip offre des performances 2 fois supérieures à celles des principaux processeurs classiques.

Architecture en profondeur du CPU NVIDIA Grace Superchip

Le CPU Grace associe l'expertise de NVIDIA aux processeurs Arm, aux structures sur-une-puce, à l'architecture de système-sur-une-puce (SoC) et aux technologies résilientes de mémoire à large bande passante et à faible consommation d'énergie. Il a été entièrement conçu pour créer la première super puce informatique au monde.

Améliorer les performances d'optimisation mathématique et l'efficacité énergétique sur le CPU NVIDIA Grace

Dans la mesure où la demande de solutions d'optimisation mathématique plus rapides et efficaces augmente, des innovations en continu sont nécessaires. Cet article de blog explore les résultats des tests de référence et les cas d'utilisation montrant une efficacité améliorée grâce au CPU NVIDIA Grace basé sur Arm.

Spécifications

Spécifications du CPU1 Grace

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Démarrage

Suivez toute l'actualité

Inscrivez-vous pour être informé(e) de la disponibilité de la puce NVIDIA Grace Blackwell.