어떠한 서버에든 NVIDIA AI를 가져오는 엔트리 레벨급 GPU
NVIDIA A2 Tensor 코어 GPU는 엣지에서 NVIDIA AI를 사용하여 저전력, 작은 설치 공간 및 고성능의 엔트리급 추론 성능을 제공합니다. 로우 프로필 PCIe Gen4 카드와 낮은 40~60W 구성 가능한 열 설계 전력(TDP) 기능을 특징으로 하는 A2는 모든 서버에 다재다능한 추론 가속화를 제공하여 규모에 맞게 배포할 수 있도록 합니다.
AI 추론은 스마트한 실시간 경험으로 소비자의 삶을 향상시키고 수조 개의 종단점 센서와 카메라에서 인사이트를 얻기 위해 배포됩니다. CPU 전용 서버와 비교할 때 NVIDIA A2 Tensor 코어 GPU가 탑재된 엣지 및 엔트리급 서버는 추론 성능을 최대 20배 수준으로 향상하여 최신 AI를 처리할 수 있도록 모든 서버를 즉시 업그레이드합니다.
하나의 NVIDIA A2 Tensor 코어 GPU와 듀얼 소켓 Xeon Gold 6330N CPU의 비교
시스템 구성: [CPU: HPE DL380 Gen10 Plus, 2S Xeon Gold 6330N @2.2GHz, 512GB DDR4] NLP: BERT-Large (Sequence length: 384, SQuAD: v1.1) | TensorRT 8.2, Precision: INT8, BS:1 (GPU) | OpenVINO 2021.4, Precision: INT8, BS:1 (CPU) Text-to-Speech: Tacotron2 + Waveglow end-to-end pipeline (input length: 128) | PyTorch 1.9, Precision: FP16, BS:1 (GPU) | PyTorch 1.9, Precision: FP32, BS:1 (CPU) 컴퓨터 비전: EfficientDet-D0 (COCO, 512x512) | TensorRT 8.2, Precision: INT8, BS:8 (GPU) | OpenVINO 2021.4, Precision: INT8, BS:8 (CPU)
NVIDIA A2 GPU가 장착된 서버는 스마트 시티, 제조 및 리테일 분야를 포함한 지능형 엣지 사용 사례에서 최대 XXX의 더 높은 성능을 제공합니다. IVA 워크로드를 실행하는 NVIDIA A2 GPU로 가속화된 서버는 이전 GPU 세대보다 더 효율적인 배포를 제공하며, 달러당 최대 1.6배 더 나은 성능과 10% 더 나은 에너지 효율성을 제공합니다.
시스템 구성: [Supermicro SYS-1029GQ-TRT, 2S Xeon Gold 6240 @2.6GHz, 768GB DDR4, NVIDIA A2 1개 또는 NVIDIA T4 1개] | 성능은 Deepstream 5.1로 측정되었습니다. 네트워크: ShuffleNet-v2(224x224), MobileNet-v2(224x224). | 파이프라인은 영상 캡처 및 디코딩, 전처리, 배치, 추론, 후처리를 아우르는 종단 간 성능을 나타냅니다.
NVIDIA A2는 5G 엣지 및 산업 환경과 같은 공간 및 열 요구 사항의 제약을 받는 엔트리급 서버의 추론 워크로드 및 배포에 최적화되어 있습니다. A2는 60W에서 40W에 이르는 TDP의 저전력 포락선에서 작동하는 로우 프로필 폼 팩터를 제공하므로 모든 서버에 이상적입니다.
AI 추론은 소비자 인터넷, 헬스케어 및 생명 과학, 금융 서비스, 소매, 제조, 슈퍼컴퓨팅을 포함한 산업 전반에 걸쳐 계속해서 획기적인 혁신을 주도하고 있습니다. NVIDIA A100 및 A30 Tensor 코어 GPU와 결합된 A2의 소형 폼 팩터 및 저전력은 클라우드, 데이터센터 및 엣지 전반에 걸쳐 완전한 AI 추론 포트폴리오를 제공합니다. A2와 NVIDIA AI 추론 포트폴리오는 AI 애플리케이션이 더 적은 수의 서버와 더 적은 전력으로 배포되도록 하여 훨씬 더 낮은 비용으로 더 빠른 인사이트를 얻을 수 있도록 합니다.
AI 및 데이터 분석 소프트웨어의 엔드 투 엔드 클라우드 네이티브 제품군인 NVIDIA AI Enterprise는 VMware vSphere가 있는 하이퍼바이저 기반의 가상 인프라에서 A2에서 실행하도록 인증되었습니다. 이로써 하이브리드 클라우드 환경에서 AI 및 추론 워크로드의 관리 및 확장이 가능해집니다.
NVIDIA AI Enterprise에 대해 자세히 알아보세요 ›
NVIDIA A2가 있는 NVIDIA-Certified System™은 컴퓨팅 가속화와 빠르고 안전한 NVIDIA 네트워킹을 NVIDIA의 OEM 파트너가 구축 및 판매하는 엔터프라이즈 데이터센터 서버에 가져옵니다. 이 프로그램은 고객이 NVIDIA NGC™ 카탈로그에서 비용 효과적이며 확장 가능한 하나의 고성능 인프라에서 기존 및 다양한 최신 AI 애플리케이션에 대한 시스템을 식별, 획득 및 구축하도록 지원합니다.
NVIDIA-Certified System에 대해 자세히 알아보기 ›
NVIDIA Ampere 아키텍처는 탄력적 컴퓨팅 시대에 맞게 설계되어 최신 엔터프라이즈 애플리케이션을 구동하는 데 필요한 성능과 가속을 제공합니다. 세계 최고의 성능과 탄력성을 갖춘 데이터센터의 핵심을 살펴보세요.
NVIDIA Ampere 아키텍처에 대해 자세히 알아보기 ›
1 희소성 포함 2 향후 출시될 vGPU에서 지원
아키텍처의 최첨단 기술과 GPU의 전체 라인업을 살펴보세요.