CPU NVIDIA Grace

Diseñada Específicamente para Entrenar a los Modelos Más Grandes del Mundo

CPU Revolucionaria para las Cargas de Trabajo de IA y HPC Más Grandes

Los modelos de IA están aumentando en complejidad y tamaño a medida que mejoran la IA conversacional con cientos de miles de millones de parámetros, mejoran los sistemas de recomendación profundos con tablas integradas de decenas de terabytes de datos y permiten nuevos descubrimientos científicos. Estos modelos masivos están superando los límites de los sistemas actuales. Continuar escalando para lograr precisión y utilidad requiere un acceso rápido a una gran cantidad de memoria y un acoplamiento estrecho de la CPU y la GPU.

Observa el discurso de apertura del evento GTC a cargo del fundador y CEO de NVIDIA Jensen Huang, en donde presenta la CPU NVIDIA Grace.

 

Diseñada para Resolver Problemas Complejos

La CPU NVIDIA Grace aprovecha la flexibilidad de la arquitectura Arm® para crear una arquitectura de CPU y servidor diseñada desde cero para la computación acelerada. Este diseño innovador ofrecerá un ancho de banda agregado hasta 30 veces mayor en comparación con los servidores más rápidos de la actualidad y un rendimiento hasta 10 veces mayor para aplicaciones que ejecutan terabytes de datos. NVIDIA Grace está diseñada para permitir a los científicos e investigadores entrenar los modelos más grandes del mundo para resolver los problemas más complejos.

Las Últimas Innovaciones Técnicas

NVIDIA NVLink de Cuarta Generación

La resolución de los problemas de IA y HPC más importantes requiere una memoria de gran capacidad y de gran ancho de banda (HBM). NVIDIA® NVLink® de cuarta generación ofrece 900 gigabytes por segundo (GB/s) de ancho de banda bidireccional entre la CPU NVIDIA Grace y las GPU NVIDIA. La conexión proporciona un espacio de direcciones de memoria unificado y coherente con la caché que combina el sistema y la memoria de la GPU HBM para programabilidad simplificada. Esta conexión coherente de gran ancho de banda entre CPU y GPU es clave para acelerar los problemas de IA y HPC más complejos del mañana.

Nuevo Subsistema de Memoria de Gran Ancho de Banda que Utiliza LPDDR5x con ECC

El ancho de banda de la memoria es un factor crítico en el rendimiento del servidor, y la memoria estándar de doble velocidad de datos (DDR) consume una parte significativa de la potencia total del socket. La CPU NVIDIA Grace es la primera CPU de servidor que aprovecha la memoria LPDDR5x con confiabilidad de clase de servidor a través de mecanismos como el código de corrección de errores (ECC) para satisfacer las demandas del data center al tiempo que ofrece el doble de ancho de banda de memoria y hasta 10 veces mejor eficiencia energética en comparación a la memoria del servidor actual. La solución NVIDIA Grace LPDDR5x, junto con la caché grande, de alto rendimiento y de último nivel, ofrece el ancho de banda necesario para modelos grandes al tiempo que reduce la potencia del sistema para maximizar el rendimiento para la próxima generación de cargas de trabajo.

Núcleos Neoverse Arm de Próxima Generación

A medida que las capacidades de cómputo paralelo de las GPU continúan avanzando, las cargas de trabajo aún pueden ser controladas por tareas en serie que se ejecutan en la CPU. Una CPU rápida y eficiente es un componente crítico del diseño del sistema para permitir la máxima aceleración de la carga de trabajo. La CPU NVIDIA Grace integra núcleos Arm Neoverse™ de próxima generación para ofrecer un alto rendimiento en un diseño de uso eficiente de la energía, lo que facilita a los científicos e investigadores hacer el trabajo de su vida.

Observa el discurso de apertura del evento GTC a cargo del fundador y CEO de NVIDIA Jensen Huang, en donde presenta la CPU NVIDIA Grace. También puedes leer el comunicado de prensa para obtener más información.