CPU NVIDIA Grace Superchip

CPU NVIDIA Grace Superchip

A CPU inovadora para o data center moderno.

Projetada para Atender às Necessidades de Desempenho e Eficiência dos Data Centers de IA de Hoje

A CPU NVIDIA Grace™ foi projetada para um novo tipo de data center que processa um grande volume de dados para produzir inteligência com máxima eficiência energética. Esses data centers executam diversas cargas de trabalho, como IA, análise de dados, aplicações na cloud de hiperescala e computação de alto desempenho (HPC). Para atender às necessidades mais exigentes de data centers, a Grace oferece o dobro do desempenho por watt, o dobro da densidade de empacotamento e a maior largura de banda de memória em comparação com os principais servidores atuais.

A CPU Grace combina 72 núcleos Arm® Neoverse™ V2 de alto desempenho e eficiência energética, conectados com o Scalable Coherency Fabric (SCF) da NVIDIA que oferece 3,2TB/s de largura de banda de bisecção, o dobro das CPUs tradicionais para oferecer o máximo desempenho, mantendo a compatibilidade total com o ecossistema Arm. A Grace é a primeira CPU de data center a utilizar memória LPDDR5X de alta velocidade da classe de servidor com um subsistema de memória ampla que oferece até 500GB/s de largura de banda a um quinto da energia da memória DDR tradicional a um preço semelhante.

Laboratório da CPU NVIDIA Grace Superchip

Neste laboratório gratuito, obtenha experiência prática com a CPU NVIDIA Grace Superchip e interaja com demonstrações de sua largura de banda de memória e ambiente de software.

Conheça a CPU NVIDIA Grace

CPU NVIDIA Grace Superchip

A CPU Grace Superchip é composta por dois chips da CPU Grace conectados coerentemente através do NVIDIA NVLink™ chip a chip (C2C) a 900GB/s. Ele inclui 144 núcleos Neoverse V2 em um único módulo, com memória LPDDR5X de classe de servidor que oferece até 1TB/s de largura de banda de memória. A CPU Grace Superchip compreende o coração de um servidor de dois soquetes em um módulo compacto, oferecendo o dobro do desempenho, o mesmo consumo que as CPUs de servidores tradicionais com memória DDR5.

CPU NVIDIA Grace C1

A NVIDIA Grace C1 é uma plataforma de servidor de soquete único e alto desempenho otimizada para plataformas escaláveis e no edge, incluindo nuvem de hiperescala, CDN, armazenamento, telecomunicações e outras plataformas no edge de alto desempenho que não comprometem o desempenho ou a largura de banda. Essa plataforma oferece desempenho x86 de ponta, sendo configurável de 140W a 250W para a CPU Grace e memória LPDDR5X em comparação com mais de 400W para plataformas x86 similares. A malha de coerência escalável projetada pela NVIDIA permite que a CPU Grace ofereça o dobro da eficiência energética em comparação com as principais plataformas x86.

Destaques

Duplique a Capacidade do Data Center ou Reduza o Consumo Pela Metade com a CPU Grace.

Análise de Gráficos

3x

Análise de Dados

2x

Clima

2x

Microsserviços

1,6x

Superchip NVIDIA Grace 480GB de LPDDR5X, AMD EPYC 9654 768GB de DDR5. SO: Ubuntu 22.04 Compiladores: GCC 12.3 a menos que indicado abaixo. Potência para eficiência energética inclui CPU + potência medida da memória. Análise de gráficos: The Gap Benchmarks Suite BFS arXiv:1508.03619 [cs.DC], 2015. Análise de dados: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4) Weather: ICON QUBICC 80 km resolução NVHPC 24.5 (Grace) ICC 2021.4 (x86) Microsserviços: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N instâncias em paralelo)

Análise de Gráficos

A CPU NVIDIA Grace Superchip conecta os núcleos Arm Neoeverse V2 com um Scaled Coherency Fabric da NVIDIA personalizada que oferece desempenho extremamente rápido para cargas de trabalho como a primeira pesquisa de amplitude GapBS que enfatiza a comunicação e a sincronização de núcleo a núcleo. O NVIDIA Grace oferece o dobro de desempenho no nível do servidor e eficiência energética 3 vezes melhor em comparação com os principais sistemas x86.

Análise de Dados

À medida que os dados continuam a crescer, as empresas precisam maximizar o aprendizado a partir dos seus dados para competir. O conjunto HiBench testa o agrupamento K-means para descoberta de conhecimento e mineração de dados e aproveita a memória de alta largura de banda e baixa potência na CPU NVIDIA Grace. A CPU Grace tem o dobro de eficiência energética em comparação com as principais CPUs x86 do mercado atual.

Clima

Os modelos de previsão meteorológica são um importante caso de uso para a computação de alto desempenho (HPC) e são essenciais para entender e responder às alterações dos padrões meteorológicos resultantes da mudança climáticas. A memória LPDDR5X de alta largura de banda e eficiência energética na CPU Grace, que oferece até 500GB/s de largura de banda em apenas cerca de 16W, permite que a Grace complete quase o dobro do trabalho no mesmo consumo de energia, em comparação com as soluções x86 existentes.

Microsserviços

Microsserviços são uma coleção de pequenos serviços independentes que permitem que os data centers escalem facilmente para atender à demanda. Eles também oferecem flexibilidade para gerenciar serviços individuais sem afetar toda a aplicação. O Google Protobufs mede a rapidez com que o sistema pode serializar e analisar os dados necessários para, posteriormente, comunicá-los entre sistemas essenciais para a execução de microsserviços. O alto desempenho e a eficiência energética da CPU NVIDIA Grace oferecem desempenho e eficiência energética de ponta para maximizar o rendimento do data center.

Recursos

Avanços Tecnológicos

Núcleos Arm Neoverse V2

No coração da CPU Grace estão os núcleos de CPU Arm Neoverse V2, o núcleo de data center de maior desempenho da Arm no mercado atualmente. Os núcleos Neoverse V2 são otimizados para oferecer desempenho líder por núcleo, enquanto fornecem uma eficiência incrível em comparação com CPUs tradicionais. A CPU Grace integra 72 núcleos e, quando emparelhada com a memória LPDDR5X e o Scaled Coherency Fabric NVIDIA, oferece o dobro do desempenho com o mesmo consumo que as principais CPUs x86.

Scalable Coherency Fabric da NVIDIA

O Scalable Coherency Fabric (SCF) da NVIDIA possui arquitetura de malha e cache distribuído, e foi projetada pela NVIDIA para enfrentar os desafios de escalar núcleos e largura de banda de forma eficiente em termos de energia e área. O SCF fornece mais de 3,2TB/s de largura de banda total de bisseção, isto é, o dobro das CPUs tradicionais, para manter o fluxo de dados entre os núcleos da CPU, a memória e a E/S do sistema. O SCF reduz os gargalos em aplicações com movimentos de dados pesados, como a análise de gráficos, onde a NVIDIA Grace oferece até 2 vezes o desempenho dos principais servidores x86.

Memória LPDDR5X

A NVIDIA Grace é a primeira CPU de servidor a usar memória LPDDR5X com confiabilidade de classe de servidor por meio de mecanismos como o código de correção de erros (ECC). A memória LPDDR5X na NVIDIA Grace equilibra custo, energia, largura de banda e capacidade. Ela oferece até 500GB/s em apenas cerca de 16W, aproximadamente um quinto da potência da memória DDR5 convencional.

Soquete Único e Duplo

O portfólio de CPUs NVIDIA Grace inclui o Superchip Grace que equipa o coração de um servidor de soquete duplo com 144 núcleos Neoverse V2 e até 960GB de LPDDR5X em um único módulo compacto que requer apenas 500W para a CPU e a memória. Para proporcionar flexibilidade adicional, a CPU Grace C1 oferece um desempenho incrível com 72 núcleos Neoverse V2 conectados pelo Scalable Coherency Fabric da NVIDIA extremamente rápido em uma configuração de soquete único otimizada para implantações de nuvem, armazenamento, edge e telecomunicações para oferecer até o dobro do desempenho por watt dos servidores x86 convencionais.

Novidades

Revolucionando a Eficiência do Data Center com a Família NVIDIA Grace

Oferecido em um único módulo compacto de dois soquetes, a CPU Grace Superchip oferece o dobro do desempenho com o mesmo consumo que as principais CPUs tradicionais.

Arquitetura da CPU NVIDIA Grace Superchip em Detalhes

Combinando a experiência da NVIDIA com processadores Arm, tecidos em chip, design de sistema em chip (SoC) e tecnologias de memória resilientes de baixo consumo e alta largura de banda, a CPU Grace foi construída desde o início para criar o primeiro superchip do mundo para computação.

Aumentando o Desempenho da Otimização Matemática e a Eficiência Energética na CPU NVIDIA Grace

À medida que cresce a demanda por soluções de otimização matemática mais rápidas e melhores, a inovação completa é necessária. Este post explora os resultados de benchmark e casos de uso que mostram uma eficiência aprimorada usando a CPU NVIDIA Grace baseada em Arm.

Especificações

Especificações da CPU Grace1

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Comece Agora

Fique Atualizado

Inscreva-se para saber quando a NVIDIA Grace Blackwell estará disponível.