CPU NVIDIA Grace

Progettata appositamente per addestrare i modelli più grandi del mondo

CPU rivoluzionaria per i più grandi carichi di lavoro IA e HPC

I modelli IA stanno esplodendo in termini di complessità e dimensioni, mentre migliorano l'IA conversazionale con centinaia di miliardi di parametri, potenziano i sistemi recommender avanzati con tabelle di integrazione di decine di terabyte di dati e consentono nuove scoperte scientifiche. Questi enormi modelli stanno spingendo i limiti dei sistemi di oggi. Il loro continuo ridimensionamento per migliorare la precisione e l'utilizzabilità richiede l'accesso rapido a un grande pool di memoria, oltre all'utilizzo congiunto di CPU e GPU.

Ascolta l'imperdibile presentazione del fondatore e CEO di NVIDIA, Jensen Huang, al GTC in cui svela la CPU NVIDIA Grace.

 

Progettata per risolvere problemi complessi

La CPU NVIDIA Grace sfrutta la flessibilità dell'architettura Arm® per creare un'architettura di CPU e server progettata da zero per il computing accelerato. Questo design innovativo offrirà una larghezza di banda aggregata fino a 30 volte superiore rispetto ai server più veloci di oggi e prestazioni fino a 10 volte superiori per le applicazioni che eseguono terabyte di dati. NVIDIA Grace è stata progettata per consentire a scienziati e ricercatori di addestrare i modelli più voluminosi del mondo e risolvere i problemi più complessi.

Le più recenti innovazioni tecniche

NVIDIA NVLink di quarta generazione

Per risolvere principali problemi di IA e HPC è necessaria una memoria ad alta capacità e a elevata larghezza di banda (HBM). NVIDIA® NVLink® di quarta generazione offre una banda bidirezionale a 900 gigabyte al secondo (GB/s) tra CPU NVIDIA Grace e GPU NVIDIA. La connessione garantisce uno spazio di indirizzi per la memoria unificato e con cache coerente, che abbina la memoria di sistema con la memoria HBM della GPU per una programmabilità semplificata. Questa connessione coerente e a elevata larghezza di banda tra CPU e GPU è fondamentale per accelerare la risoluzione di problemi di IA e HPC più complessi in futuro.

Nuovo sottosistema di memoria a elevata larghezza di banda che utilizza LPDDR5x con ECC

La larghezza di banda della memoria è un fattore critico per le prestazioni del server e una memoria DDR (Double Data Rate) standard consuma una parte significativa della potenza complessiva del socket. La CPU NVIDIA Grace è la prima CPU server a sfruttare la memoria LPDDR5x con affidabilità di classe server attraverso meccanismi come il codice di correzione errori (Error-Correcting Code, ECC) per soddisfare le esigenze del data center, offrendo al contempo una larghezza di banda della memoria 2 volte superiore e una maggiore efficienza energetica fino a 10 volte superiore rispetto alla memoria server di oggi. La soluzione NVIDIA Grace LPDDR5x abbinata all'ultimo livello di cache di grandi dimensioni e ad alte prestazioni offre la larghezza di banda necessaria per i grandi modelli, riducendo al contempo i consumi del sistema e massimizzando le prestazioni per la prossima generazione di carichi di lavoro.

Arm Neoverse Core di nuova generazione

Nonostante i progressi continui delle funzionalità di calcolo parallelo delle GPU, i carichi di lavoro possono ancora risultare confinati in attività seriali eseguite sulla CPU. Una CPU veloce ed efficiente è un componente fondamentale della progettazione del sistema per consentire la massima accelerazione del carico di lavoro. La CPU NVIDIA Grace integra gli Arm Neoverse™ core di nuova generazione per offrire prestazioni elevate in un design efficiente dal punto di vista energetico, il che aiuta scienziati e ricercatori a portare a termine i loro progetti.

Ascolta l'imperdibile presentazione del fondatore e CEO di NVIDIA, Jensen Huang, al GTC in cui svela la CPU NVIDIA Grace e leggi il comunicato stampa per saperne di più.