GPU entry-level che porta NVIDIA AI su qualsiasi server.
La GPU NVIDIA A2 Tensor Core fornisce inferenza entry-level a basso consumo, ingombro ridotto e prestazioni elevate per NVIDIA AI sull'Edge. Dotato di una scheda PCIe Gen4 a basso profilo e capacità TDP configurabile a basso consumo, da 40-60 W, l'A2 offre un'accelerazione dell'inferenza versatile a qualsiasi server per l'implementazione su larga scala.
L'inferenza con IA viene implementata per migliorare la vita dei consumatori con esperienze intelligenti e in tempo reale e per ottenere informazioni da trilioni di sensori e telecamere sugli end-point. Rispetto ai server basati su sola CPU, i server Edge ed entry-level con GPU NVIDIA A2 Tensor Core offrono prestazioni di inferenza fino a 20 volte superiori, rendendo subito qualsiasi server in grado di gestire l'IA moderna.
Comparisons of one NVIDIA A2 Tensor Core GPU versus a dual-socket Xeon Gold 6330N CPU
Configurazione di sistema: [CPU: HPE DL380 Gen10 Plus, 2S Xeon Gold 6330N a 2.2 GHz, 512 GB DDR4] NLP: BERT-Large (lunghezza sequenza: 384, SQuAD: v1.1) | TensorRT 8.2, Precisione: INT8, BS:1 (GPU) | OpenVINO 2021.4, Precisione: INT8, BS:1 (CPU) Sintesi vocale: pipeline completa Tacotron2 + Waveglow (lunghezza input: 128) | PyTorch 1.9, Precisione: FP16, BS:1 (GPU) | PyTorch 1.9, Precisione: FP32, BS:1 (CPU) Computer vision: EfficientDet-D0 (COCO, 512x512) | TensorRT 8.2, Precisione: INT8, BS:8 (GPU) | OpenVINO 2021.4, Precisione: INT8, BS:8 (CPU)
I server dotati di GPU NVIDIA A2 offrono prestazioni fino a 1,3 volte superiori negli scenari di utilizzo intelligenti sull'Edge, tra cui smart city, produzione e vendita al dettaglio. Le GPU NVIDIA A2 che eseguono carichi di lavoro IVA offrono implementazioni più efficienti con un rapporto prezzo-prestazioni fino a 1,6 volte migliore e un'efficienza energetica superiore del 10% rispetto alle precedenti generazioni di GPU.
Configurazione di sistema: [Supermicro SYS-1029GQ-TRT, 2S Xeon Gold 6240 a 2.6 GHz, 512 GB DDR4, 1 NVIDIA A2 O 1 NVIDIA T4] | Prestazioni misurate con Deepstream 5.1. Reti: ShuffleNet-v2 (224x224), MobileNet-v2 (224x224). | La pipeline rappresenta prestazioni end-to-end con acquisizione e decodifica video, pre-elaborazione, batching, inferenza e post-elaborazione.
La NVIDIA A2 è ottimizzata per carichi di lavoro di inferenza e distribuzione su server entry-level con vincoli di spazio e termici, come ambienti 5G Edge industriali. La A2 offre un fattore di forma a basso profilo che opera in un involucro a basso consumo, da TDP di 60 W fino a 40 W, il che la rende ideale per qualsiasi server.
L'inferenza dell'IA continua a guidare l'innovazione rivoluzionaria in tutti i settori, tra cui Internet per consumatori, sanità e scienze della vita, servizi finanziari, vendita al dettaglio, produzione e supercomputing. Il fattore di forma ridotto e i bassi consumi energetici della A2 abbinati alle GPU NVIDIA A100 e A30 Tensor Core offrono una gamma completa per l'inferenza con IA su cloud, data center ed Edge. La A2 e la gamma per inferenza NVIDIA AI garantiscono l'implementazione delle applicazioni IA con meno server e meno energia, per informazioni più rapide e costi sostanzialmente inferiori.
NVIDIA AI Enterprise, una suite cloud-native end-to-end di software di intelligenza artificiale e analisi dei dati, è certificata per l'esecuzione su A2 in un'infrastruttura virtuale basata su hypervisor con VMware vSphere. Ciò consente la gestione e il ridimensionamento dei carichi di lavoro di IA e inferenza in un ambiente cloud ibrido.
Scopri di più su NVIDIA AI Enterprise ›
Gli NVIDIA-Certified Systems™ con NVIDIA A2, riuniscono accelerazione di calcolo e rete NVIDIA sicura ad alta velocità nei server del data center aziendale, e sono costruiti e venduti dai partner OEM di NVIDIA. Questo programma consente ai clienti di identificare, acquisire e distribuire sistemi per applicazioni di intelligenza artificiale moderne tradizionali e diversificate dal catalogo NVIDIA NGC™ su un'unica infrastruttura ad alte prestazioni, economica e scalabile.
Scopri di più su NVIDIA-Certified Systems ›
L'architettura NVIDIA Ampere è progettata per l'era del computing elastico e offre le prestazioni e l'accelerazione necessarie per alimentare le moderne applicazioni aziendali. Esplora il cuore dei data center elastici con le più alte prestazioni del mondo.
Scopri di più sull'architettura NVIDIA Ampere ›
1 Con densità 2 Supportato nella versione vGPU futura
Esplora le tecnologie all'avanguardia dell'architettura e la gamma completa di GPU.