A GPU básica versátil que leva a NVIDIA AI para qualquer servidor.
A GPU NVIDIA A2 Tensor Core fornece inferência de nível básico com baixo consumo de energia, tamanho reduzido e alto desempenho para análise de vídeo inteligente (IVA) com NVIDIA AI no edge. Apresentando uma GPU PCIe Gen4 de baixo perfil e uma capacidade de design térmico configurável (TDP) de 40-60W, a A2 traz aceleração de inferência versátil para qualquer servidor para implantação em escala.
A inferência de AI é implantada para aprimorar a vida do consumidor com experiências inteligentes e em tempo real e para obter insights de trilhões de sensores e câmeras de endpoint. Em comparação com os servidores apenas com CPU, os servidores no edge e de entrada com GPUs NVIDIA A2 Tensor Core oferecem acelerações significativas para inferência, atualizando instantaneamente qualquer servidor para lidar com a AI moderna.
Comparações de uma GPU NVIDIA A2 Tensor Core com uma CPU Xeon Gold 6330N de dois soquetes
Configuração do Sistema: [CPU: HPE DL380 Gen10 Plus, 2S Xeon Gold 6330N a 2,2 GHz, 512 GB DDR4]
NLP: BERT-Large (comprimento da sequência: 384, SQuAD: v1.1) | TensorRT 8.2, precisão: INT8, BS: 1 (GPU) | OpenVINO 2021.4, Precisão: INT8, BS: 1 (CPU)
Texto-para-Voz: Pipeline de ponta a ponta Tacotron2 + Waveglow (comprimento de entrada: 128) | PyTorch 1.9, Precisão: FP16, BS: 1 (GPU) | PyTorch 1.9, Precisão: FP32, BS: 1 (CPU)
Visão Computacional: EfficientDet-D0 (COCO, 512x512) | TensorRT 8.2, Precisão: INT8, BS: 8 (GPU) | OpenVINO 2021.4, Precisão: INT8, BS: 8 (CPU)
Em comparação com as implantações de servidor apenas de CPU, os servidores equipados com GPUs NVIDIA A2 oferecem até 1,3 vezes mais desempenho em casos de uso no edge inteligente, incluindo cidades inteligentes, manufatura e varejo. Os servidores acelerados com GPUs NVIDIA A2 executando cargas de trabalho IVA oferecem implementações mais eficientes do que as gerações de GPU anteriores, com desempenho até 1,6 vez melhor por dólar e 10% mais eficiência energética.
Configuração do Sistema: [Supermicro SYS-1029GQ-TRT, 2S Xeon Gold 6240 @ 2,6 GHz, 512 GB DDR4, 1x NVIDIA A2 OU 1x NVIDIA T4] | Desempenho medido com Redes Deepstream 5.1. : ShuffleNet-v2 (224x224), MobileNet-v2 (224x224). | Pipeline representa desempenho de ponta a ponta com captura e decodificação de vídeo, pré-processamento, lote, inferência e pós-processamento.
A NVIDIA A2 é otimizada para cargas de trabalho de inferência e implantações em servidores de nível básico limitados por requisitos de espaço e térmicos, como 5G no edge e ambientes industriais. A A2 oferece um formato de baixo perfil operando em um envelope com menor consumo energético, de um TDP de 60 W a 40 W, tornando-o ideal para qualquer servidor.
A inferência de IA continua a impulsionar inovações revolucionárias em todos os setores, incluindo internet para consumidores, área da saúde e ciências da vida, serviços financeiros, varejo, manufatura e supercomputação. O formato pequeno e o baixo consumo de energia da A2, combinados com as GPUs NVIDIA A100 e A30 Tensor Core, oferece um portfólio completo de inferência de AI no cloud, data center e edge. A A2 e o portfólio de inferência NVIDIA AI garantem que as aplicações de AI sejam implantadas com menos servidores e menor consumo de energia, resultando em insights mais rápidos com custos efetivamente mais baixos.
NVIDIA AI Enterprise, uma suíte nativa do cloud de ponta a ponta de software de análise de dados e AI, é certificada para rodar a A2 em infraestrutura virtual baseada em hipervisor com VMware vSphere. Isso permite o gerenciamento e o dimensionamento de cargas de trabalho de AI e inferência em um ambiente de cloud híbrido.
Saiba mais sobre o NVIDIA AI Enterprise ›
Os Sistemas Certificados™ pela NVIDIA com NVIDIA A2 reúnem aceleração de computação e rede NVIDIA segura de alta velocidade em servidores de data center corporativos, desenvolvidos e vendidos por parceiros OEM da NVIDIA. Este programa permite que os clientes identifiquem, adquiram e implantem sistemas para aplicações modernas de AI tradicionais e diversas do catálogo NVIDIA NGC™ em uma única infraestrutura de alto desempenho, econômica e escalonável.
Saiba mais sobre os Sistemas Certificados pela NVIDIA ›
A arquitetura NVIDIA Ampere foi projetada para a era da computação elástica, oferecendo o desempenho e a aceleração necessários para alimentar as aplicações empresariais modernas. Explore o coração dos data centers elásticos de maior desempenho do mundo.
Saiba mais sobre a arquitetura NVIDIA Ampere ›
1 Com esparsidade 2 Compatível com versão futura de vGPU
Explore as tecnologias de ponta da arquitetura e sua linha completa de GPUs.