CPU NVIDIA Grace Superchip

CPU NVIDIA Grace Superchip

La CPU innovadora para el data center moderno.

Diseñado para Satisfacer las Necesidades de Desempeño y Eficiencia de los Data Centers de IA Actuales

La CPU NVIDIA Grace™ ha sido diseñada para un nuevo tipo de data center que procesa enormes cantidades de datos para producir inteligencia con la máxima eficiencia energética. Estos data centers ejecutan diversas cargas de trabajo como IA, análisis de datos, aplicaciones de nube de hiperescala y computación de alto rendimiento (HPC). Para satisfacer las necesidades más exigentes de los data centers, Grace ofrece el doble de desempeño por vatio, el doble de densidad de empaquetado y el ancho de banda de memoria más alto en comparación con los servidores líderes actuales.

La CPU Grace combina 72 núcleos ARM® Neoverse™ V2 de alto desempeño y eficiencia energética, conectados con NVIDIA Scalable Coherency Fabric (SCF), que ofrece 3,2TB/s de ancho de banda biseccional, el doble que las CPU tradicionales, para brindar el máximo desempeño, manteniendo a la vez una compatibilidad total con el ecosistema ARM. Grace es la primera CPU de centro de datos en utilizar la memoria LPDDR5X de alta velocidad de tipo servidor con un subsistema de memoria amplio que ofrece hasta 500GB/s de ancho de banda

NVIDIA Grace CPU Superchip en LaunchPad

En este laboratorio gratuito, podrás obtener experiencia práctica con la CPU NVIDIA Grace Superchip e interactuar con demostraciones de su ancho de banda de memoria y entorno de software.

Conoce la CPU NVIDIA Grace

CPU NVIDIA Grace Superchip

La CPU Grace Superchip está compuesta por dos chips de CPU Grace conectados coherentemente a través de NVIDIA NVLinkTM Chip-to-Chip (C2C) a 900GB/s. Incluye 144 núcleos Neoverse V2 en un solo módulo, con memoria LPDDR5X de tipo servidor que ofrece hasta 1TB/s de ancho de banda de memoria. La CPU Grace Superchip contiene el centro de un servidor de dos zócalos en un módulo compacto y ofrece 2 veces el desempeño con el mismo consumo de energía que las CPU de servidor tradicionales con memoria DDR5.

CPU NVIDIA Grace C1

NVIDIA Grace C1 es una plataforma de servidor de un solo zócalo y alto desempeño optimizada para plataformas escalables y en el edge, que incluyen nube a hiperescala, CDN, almacenamiento, telecomunicaciones y otras plataformas de alto desempeño que no afecta el desempeño ni el ancho de banda. Esta plataforma ofrece un desempeño x86 de alta gama y es configurable de 140W a 250W para la CPU Grace y la memoria LPDDR5X en comparación con más de 400W para plataformas x86 similares. La trama de coherencia escalable diseñada por NVIDIA permite que la CPU Grace ofrezca el doble de eficiencia energética en comparación con las plataformas x86 líderes.

Aspectos Destacados

Duplica la Producción del Data Center o Reduce el Uso de Energía a la Mitad con la CPU Grace

Análisis de Gráficos

3 veces

Análisis de Datos

2 veces

Clima

2 veces

Microservicios

1.6 veces

NVIDIA Grace Superchip 480GB de LPDDR5X, AMD EPYC 9654 768 GB de DDR5. SO: Ubuntu 22.04. Compiladores: GCC 12.3 a menos que se indique a continuación. La potencia para eficiencia energética incluye potencia medida de CPU + memoria. Análisis de gráficos: Gap Benchmarks Suite BFS arXiv:1508.03619 [cs.DC], 2015. Análisis de datos: HiBench+K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4). Clima: ICON QUBICC 80 km resolución NVHPC 24.5 (Grace) ICC 2021.4 (x86) Microservicios: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N instancias en paralelo)

Análisis de Gráficos

La CPU NVIDIA Grace Superchip conecta los núcleos ARM Neoeverse V2 con una trama de coherencia escalable NVIDIA personalizada que ofrece un desempeño increíblemente rápido para cargas de trabajo como GapBS Breadth First Search, que enfatiza la comunicación y la sincronización de núcleo a núcleo. NVIDIA Grace ofrece un desempeño 2 veces mayor a nivel del servidor y una eficiencia energética 3 veces mayor en comparación con los sistemas x86 líderes.

Análisis de Datos

A medida que los datos continúan creciendo, las empresas necesitan maximizar el aprendizaje de sus datos para competir. El paquete HiBench prueba el agrupamiento K-means para descubrir conocimientos y hacer minería de datos y aprovecha la memoria de alto ancho de banda y baja potencia en la CPU NVIDIA Grace. La CPU Grace es 2 veces más eficiente en cuanto a consumo de energía en comparación con las CPU x86 líderes del mercado actual.

Clima

Los modelos de predicción meteorológica son un caso de uso importante para la computación de alto rendimiento (HPC) y son críticos para comprender y responder a los patrones climáticos cambiantes causados por el cambio climático. La memoria LPDDR5X de alto ancho de banda y eficiencia energética de la CPU Grace, que ofrece hasta 500GB/s de ancho de banda en solo 16W, permite que Grace realice casi el doble de trabajo con el mismo consumo de energía en comparación con las soluciones x86 existentes.

Microservicios

Los microservicios son una colección de pequeños servicios independientes que permiten que los data centers se expandan fácilmente para satisfacer la demanda. También ofrecen flexibilidad para administrar servicios individuales sin afectar a toda la aplicación. Google Protobufs mide la rapidez con la cual el sistema puede serializar y analizar los datos necesarios para intercambiar datos entre sistemas que son esenciales para la ejecución de microservicios. El alto desempeño y la eficiencia energética de la CPU NVIDIA Grace ofrecen un nivel líder de desempeño y eficiencia energética para maximizar el rendimiento del data center.

Funciones

Avances Tecnológicos

Núcleos Arm Neoverse V2

En el centro de la CPU Grace se encuentran los núcleos de CPU ARM Neoverse V2, el núcleo del data center de mayor desempeño de ARM en el mercado actual. Los núcleos Neoverse V2 están optimizados para ofrecer un desempeño líder por núcleo y a la vez proporcionan una eficiencia increíble en comparación con las CPU tradicionales. La CPU Grace integra 72 núcleos y, cuando se combina con la memoria LPDDR5X y con NVIDIA Scaled Coherency Fabric, ofrece el doble de desempeño con el mismo consumo de energía que las CPU x86 principales.

NVIDIA Scalable Coherency Fabric

NVIDIA Scalable Coherency Fabric (SCF) es una trama de malla y una arquitectura de caché distribuida diseñada por NVIDIA para satisfacer los desafíos de expandir núcleos y ancho de banda de una manera eficiente en términos de energía y superficie. SCF proporciona más de 3,2TB/s de ancho de banda de bisección total, el doble que las CPU tradicionales, para mantener el flujo de datos entre los núcleos de la CPU, la memoria y la E/S del sistema. SCF reduce los cuellos de botella en aplicaciones con alto nivel de movimiento de datos, como el análisis de gráficos, en las que NVIDIA Grace ofrece hasta el doble de desempeño en comparación con los servidores x86 líderes.

Memoria LPDDR5X

NVIDIA Grace es la primera CPU de servidor que utiliza memoria LPDDR5X con fiabilidad de tipo servidor a través de mecanismos como el código de corrección de errores (ECC). La memoria LPDDR5X de NVIDIA Grace equilibra costos, potencia, ancho de banda y capacidad. Ofrece hasta 500GB/s en solo unos 16W, aproximadamente una quinta parte de la potencia de la memoria DDR5 convencional.

Zócalo Simple y Doble

La cartera de CPU NVIDIA Grace incluye el superchip Grace que proporciona el núcleo de un servidor de doble zócalo con 144 núcleos Neoverse V2 y hasta 960GB de LPDDR5X en un solo módulo compacto, que requiere solo 500W para la CPU y la memoria. Para proporcionar más flexibilidad, la CPU Grace C1 ofrece un desempeño increíble con 72 núcleos Neoverse V2 conectados por una trama de coherencia escalable de NVIDIA increíblemente rápida, en una configuración de un solo zócalo optimizada para implementaciones en la nube, almacenamiento, edge y telecomunicaciones, para ofrecer hasta el doble del rendimiento por vatio que los servidores x86 convencionales.

Noticias

Revolucionando la Eficiencia del Data Center con la Familia NVIDIA Grace

La CPU Grace Superchip, que viene en un módulo compacto de dos zócalos, ofrece el doble de desempeño con el mismo consumo de energía que las principales CPU tradicionales.

Arquitectura de la CPU NVIDIA Grace Superchip en Detalle

La CPU Grace combina la experiencia de NVIDIA con los procesadores ARM, las tramas en chip, el diseño de sistema sobre chip (SoC) y las resilientes tecnologías de memoria de bajo consumo y alto ancho de banda, y fue construida desde cero para crear el primer superchip del mundo para la computación.

Mejorar el Desempeño de la Optimización Matemática y la Eficiencia Energética en la CPU NVIDIA Grace

A medida que crece la demanda de soluciones de optimización matemática más rápidas y mejores, se necesita una innovación completa. Esta publicación de blog explora los resultados de análisis de referencia y casos de uso que muestran una eficiencia mejorada con la CPU NVIDIA Grace.

Especificaciones

Especificaciones de la CPU Grace1

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Empieza Ahora

Mantente al Día

Regístrate para saber cuándo estará disponible NVIDIA Grace Blackwell.