CPU NVIDIA Grace

Criada para Treinar os Maiores Modelos do Mundo

CPU Inovadora para as Maiores Cargas de Trabalho de AI e HPC

Os modelos de IA são cada vez maiores em complexidade e tamanho à medida que melhoram a AI de conversação com centenas de bilhões de parâmetros, aprimoram os sistemas de recomendação profunda com a incorporação de tabelas de dezenas de terabytes de dados e permitem novas descobertas científicas. Esses enormes modelos estão ultrapassando os limites dos sistemas atuais. Continuar a escaloná-los para precisão e utilidade requer acesso rápido a uma grande quantidade de memória e uma integração estreita entre a CPU e a GPU.

Assista à apresentação imperdível do fundador e CEO da NVIDIA, Jensen Huang, no GTC, em que ele anuncia a CPU NVIDIA Grace.

 

Projetado para Resolver Problemas Complexos

A CPU NVIDIA Grace aproveita a flexibilidade da arquitetura Arm® para criar uma arquitetura de CPU e servidor projetada desde o início para computação acelerada. Este design inovador fornecerá largura de banda agregada até 30 vezes maior em comparação aos servidores mais rápidos de hoje e desempenho até 10 vezes maior para aplicações que executam terabytes de dados. A NVIDIA Grace foi projetada para permitir que cientistas e pesquisadores treinem os maiores modelos do mundo para resolver os problemas mais complexos.

As Inovações Técnicas Mais Recentes

NVIDIA NVLink de Quarta Geração

Resolver os maiores problemas de IA e HPC requer memória de alta capacidade e alta largura de banda (HBM). O NVIDIA® NVLink® de quarta geração oferece 900 gigabytes por segundo (GB/s) de largura de banda bidirecional entre a CPU NVIDIA Grace e as GPUs NVIDIA. A conexão fornece um espaço de endereço de memória coerente com cache unificado que combina sistema e memória de GPU HBM para programação simplificada. Esta conexão coerente de alta largura de banda entre CPU e GPUs é a chave para acelerar os problemas mais complexos de IA e HPC de amanhã. 

Novo Subsistema de Memória de Alta Largura de Banda Usando LPDDR5x com ECC

A largura de banda da memória é um fator crítico no desempenho do servidor, e a memória DDR (taxa de dados dupla) padrão consome uma parte significativa da energia geral do soquete. A CPU NVIDIA Grace é a primeira CPU de servidor a aproveitar a memória LPDDR5x com confiabilidade de classe de servidor por meio de mecanismos como código de correção de erros (ECC) para atender às demandas do data center enquanto oferece o dobro da largura de banda da memória e eficiência energética até 10 vezes melhor em comparação para a memória do servidor de hoje. A solução NVIDIA Grace LPDDR5x juntamente com o grande cache de último nível de alto desempenho oferece a largura de banda necessária para modelos grandes enquanto reduz a energia do sistema para maximizar o desempenho para a próxima geração de cargas de trabalho.

Núcleos Arm Neoverse de Próxima Geração

Como os recursos de computação paralela das GPUs continuam a avançar, as cargas de trabalho ainda podem ser controladas por tarefas seriais executadas na CPU. Uma CPU rápida e eficiente é um componente crítico do design do sistema para permitir aceleração máxima da carga de trabalho. A CPU NVIDIA Grace integra a próxima geração de núcleos Arm Neoverse™ para oferecer alto desempenho em um design de baixo consumo de energia, facilitando o trabalho de cientistas e pesquisadores. 

Assista à apresentação imperdível do fundador e CEO da NVIDIA, Jensen Huang, no GTC, em que ele anuncia a CPU NVIDIA Grace. Confira também o press release para obter mais informações.