Arquitetura NVIDIA Ampere

O coração dos data centers elásticos de maior desempenho do mundo. 

O Núcleo da AI e do HPC no Data Center Moderno

Resolvendo os desafios científicos, industriais e de negócios mais importantes do mundo com AI e HPC. Visualização de conteúdo complexo para criar produtos de ponta, contar histórias envolventes e reimaginar cidades do futuro. Extração de novos insights de grandes conjuntos de dados. A arquitetura NVIDIA Ampere, projetada para a era da computação elástica, supera todos esses desafios, fornecendo aceleração incomparável em todas as escalas.

Inovações Revolucionárias

Construída com 54 bilhões de transistores, a arquitetura NVIDIA Ampere é o maior chip de 7 nanômetros (nm) já construído e apresenta seis inovações importantes.. 

Tensor Cores de Terceira Geração

Introduzida pela primeira vez na arquitetura NVIDIA Volta™, a tecnologia NVIDIA Tensor Core trouxe acelerações significativas à AI, reduzindo o tempo de treinamento de semanas para horas e fornecendo aceleração massiva para inferência. A arquitetura NVIDIA Ampere se baseia nessas inovações, trazendo novas precisões, Tensor Float 32 (TF32) e ponto flutuante 64 (FP64), para acelerar e simplificar a adoção da AI e estender o poder dos Tensor Cores para HPC.

O TF32 funciona exatamente como o FP32, ao mesmo tempo que oferece acelerações de até 20 vezes para AI sem exigir nenhuma alteração de código. Usando o NVIDIA Automatic Mixed Precision, os pesquisadores podem obter um desempenho 2 vezes adicional com precisão mista automática e FP16 adicionando apenas algumas linhas de código. E com suporte para bfloat16, INT8 e INT4, Tensor Cores na arquitetura NVIDIA Ampere GPUs Tensor Core criam um acelerador incrivelmente versátil para treinamento de AI e inferência. Trazendo o poder dos Tensor Cores para as GPUs HPC, A100 e A30, também permite operações de matriz com precisão FP64 com certificação IEEE completa. 

Tensor Cores de Terceira Geração
GPU Multi-Instância (MIG)

GPU Multi-Instância (MIG)

Todas as aplicações de AI e HPC podem se beneficiar da aceleração, mas nem todas as aplicações precisam do desempenho de uma GPU completa. A GPU multi-instância (MIG) é um recurso compatível com as GPUs A100 e A30 que permite que as cargas de trabalho compartilhem a GPU. Com o MIG, cada GPU pode ser particionada em várias instâncias de GPU, totalmente isoladas e protegidas no nível do hardware com sua própria memória de alta largura de banda, cache e núcleos de computação. Agora, os desenvolvedores podem acessar uma aceleração revolucionária para todas as suas aplicações, grandes e pequenas, e obter qualidade de serviço garantida. E os administradores de IT podem oferecer aceleração de GPU do tamanho certo para utilização ideal e expandir o acesso a todos os usuários e aplicações em ambientes bare-metal e virtualizados.

Esparsidade Estrutural

Esparsidade Estrutural

As redes modernas de IA são grandes e cada vez maiores, com milhões e, em alguns casos, bilhões de parâmetros. Nem todos esses parâmetros são necessários para previsões e inferências precisas, e alguns podem ser convertidos em zeros para tornar os modelos “esparsos” sem comprometer a precisão. O Tensor Cores pode fornecer desempenho até 2 vezes maior para modelos esparsos. Embora o recurso de dispersão beneficie mais prontamente a inferência de AI, ele também pode ser usado para melhorar o desempenho do treinamento do modelo. 

RT Cores de Segunda Geração

Os RT Cores de segunda geração da arquitetura NVIDIA Ampere na GPU NVIDIA A40 oferecem acelerações massivas para cargas de trabalho como renderização fotorrealística de conteúdo de filmes, avaliações de projeto arquitetônico e prototipagem virtual de projetos de produtos. Os RT Cores também aceleram a renderização de motion blur por ray tracing para resultados mais rápidos com maior precisão visual e podem executar simultaneamente ray tracing com sombreamento ou recursos de eliminação de ruído.

RT Cores de Segunda Geração
Memória Mais Inteligente e Mais Rápida

Memória Mais Inteligente e Mais Rápida

A A100 traz grandes quantidades de computação para os data centers. Para manter esses mecanismos de computação totalmente utilizados, ela tem 2 terabytes por segundo (TB/s) de largura de banda de memória, mais do que o dobro da geração anterior. Além disso, a A100 tem mais memória no chip, incluindo um cache de nível 2 de 40 megabytes (MB), 7 vezes maior do que a geração anterior, para maximizar o desempenho de computação.

Otimizado para Escala

As ofertas de GPU NVIDIA e acelerador convergente da NVIDIA são desenvolvidas para implementação em escala, trazendo rede, segurança e pequenas pegadas para o cloud, data center e edge.

Potência Otimizada para Qualquer Servidor

Oferecendo o menor tamanho do portfólio, a GPU NVIDIA A2 é otimizada para cargas de trabalho de inferência e implantações em servidores de nível básico limitados por requisitos de espaço e térmicos, como 5G no edge e ambientes industriais. A A2 oferece um formato de baixo perfil operando em um envelope de baixa potência, de uma potência de design térmico (TDP) de 60W a 40W, tornando-o ideal para qualquer servidor.

Potência Otimizada para Qualquer Servidor
Computação Unificada e Aceleração de Rede

Computação Unificada e Aceleração de Rede

Nos aceleradores convergentes NVIDIA, a arquitetura NVIDIA Ampere e a unidade de processamento de dados NVIDIA BlueField®-2 (DPU) se unem para oferecer desempenho sem precedentes com segurança e rede aprimoradas para cargas de trabalho com GPU em computação avançada, telecomunicações e segurança de rede. BlueField-2 combina o poder do NVIDIA ConnectX®-6 Dx com núcleos Arm® programáveis ​​e offloads de hardware para armazenamento definido por software, rede, segurança e gerenciamento. Os aceleradores convergentes NVIDIA permitem um novo nível de eficiência e segurança do data center para cargas de trabalho com uso intensivo de rede e aceleradas por GPU.

Design com Densidade Otimizada

A GPU NVIDIA A16 vem em um design de placa quad-GPU otimizado para densidade de usuário e, combinado com o software NVIDIA Virtual PC (vPC), permite que PCs virtuais ricos em gráficos sejam acessíveis de qualquer lugar. Ofereça maior taxa de quadros e menor latência do usuário final em comparação com o VDI somente da CPU com NVIDIA A16, resultando em aplicações mais responsivas e uma experiência de usuário indistinguível de um PC nativo.

Design com Densidade Otimizada
Implantações Seguras

Implantações Seguras

As implantações seguras são críticas para as operações comerciais da empresa. A arquitetura NVIDIA Ampere fornece opcionalmente um boot seguro através de autenticação de código confiável e proteções de rollback reforçadas para proteger contra ataques maliciosos de malware, prevenindo perdas operacionais e garantindo a aceleração da carga de trabalho.

Por Dentro Da Arquitetura NVIDIA Ampere

Explore as tecnologias de ponta da arquitetura e sua linha completa de GPUs.