This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA A2 Tensor 코어 GPU

어떠한 서버에든 NVIDIA AI를 가져오는 엔트리 레벨급 GPU

지능형 엣지를 위한 엔트리급 추론

NVIDIA A2 Tensor 코어 GPU는 엣지에서 NVIDIA AI를 사용하여 저전력, 작은 설치 공간 및 고성능의 엔트리급 추론 성능을 제공합니다. 로우 프로필 PCIe Gen4 카드와 낮은 40~60W 구성 가능한 열 설계 전력(TDP) 기능을 특징으로 하는 A2는 모든 서버에 다재다능한 추론 가속화를 제공하여 규모에 맞게 배포할 수 있도록 합니다.

NVIDIA A2 데이터시트 다운로드(538 KB)

NVIDIA A2 제품 개요 다운로드(362 KB)

최대 20배의 추론 성능

AI 추론은 스마트한 실시간 경험으로 소비자의 삶을 향상시키고 수조 개의 종단점 센서와 카메라에서 인사이트를 얻기 위해 배포됩니다. CPU 전용 서버와 비교할 때 NVIDIA A2 Tensor 코어 GPU가 탑재된 엣지 및 엔트리급 서버는 추론 성능을 최대 20배 수준으로 향상하여 최신 AI를 처리할 수 있도록 모든 서버를 즉시 업그레이드합니다.

컴퓨터 비전
(EfficientDet-DO)

자연어 처리
(BERT 대규모)

텍스트 음성 변환 TTS
(Tacotron2 + Waveglow)

하나의 NVIDIA A2 Tensor 코어 GPU와 듀얼 소켓 Xeon Gold 6330N CPU의 비교

시스템 구성: [CPU: HPE DL380 Gen10 Plus, 2S Xeon Gold 6330N @2.2GHz, 512GB DDR4]
NLP: BERT-Large (Sequence length: 384, SQuAD: v1.1) | TensorRT 8.2, Precision: INT8, BS:1 (GPU) | OpenVINO 2021.4, Precision: INT8, BS:1 (CPU)
Text-to-Speech: Tacotron2 + Waveglow end-to-end pipeline (input length: 128) | PyTorch 1.9, Precision: FP16, BS:1 (GPU) | PyTorch 1.9, Precision: FP32, BS:1 (CPU)
컴퓨터 비전: EfficientDet-D0 (COCO, 512x512) | TensorRT 8.2, Precision: INT8, BS:8 (GPU) | OpenVINO 2021.4, Precision: INT8, BS:8 (CPU)

지능형 엣지를 위한 향상된 IVA 성능

NVIDIA A2 GPU가 장착된 서버는 스마트 시티, 제조 및 리테일 분야를 포함한 지능형 엣지 사용 사례에서 최대 XXX의 더 높은 성능을 제공합니다. IVA 워크로드를 실행하는 NVIDIA A2 GPU로 가속화된 서버는 이전 GPU 세대보다 더 효율적인 배포를 제공하며, 달러당 최대 1.6배 더 나은 성능과 10% 더 나은 에너지 효율성을 제공합니다.

IVA 성능(정규화)

시스템 구성: [Supermicro SYS-1029GQ-TRT, 2S Xeon Gold 6240 @2.6GHz, 768GB DDR4, NVIDIA A2 1개 또는 NVIDIA T4 1개] | 성능은 Deepstream 5.1로 측정되었습니다. 네트워크: ShuffleNet-v2(224x224), MobileNet-v2(224x224). | 파이프라인은 영상 캡처 및 디코딩, 전처리, 배치, 추론, 후처리를 아우르는 종단 간 성능을 나타냅니다.

모든 서버에 최적화

NVIDIA A2는 5G 엣지 및 산업 환경과 같은 공간 및 열 요구 사항의 제약을 받는 엔트리급 서버의 추론 워크로드 및 배포에 최적화되어 있습니다. A2는 60W에서 40W에 이르는 TDP의 저전력 포락선에서 작동하는 로우 프로필 폼 팩터를 제공하므로 모든 서버에 이상적입니다.

저전력 및 구성 가능한 TDP

클라우드, 데이터센터 및 엣지 전반에 걸친 최고의 AI 추론 성능

AI 추론은 소비자 인터넷, 헬스케어 및 생명 과학, 금융 서비스, 소매, 제조, 슈퍼컴퓨팅을 포함한 산업 전반에 걸쳐 계속해서 획기적인 혁신을 주도하고 있습니다. NVIDIA A100 및 A30 Tensor 코어 GPU와 결합된 A2의 소형 폼 팩터 및 저전력은 클라우드, 데이터센터 및 엣지 전반에 걸쳐 완전한 AI 추론 포트폴리오를 제공합니다. A2와 NVIDIA AI 추론 포트폴리오는 AI 애플리케이션이 더 적은 수의 서버와 더 적은 전력으로 배포되도록 하여 훨씬 더 낮은 비용으로 더 빠른 인사이트를 얻을 수 있도록 합니다.

엔터프라이즈 활용 준비

NVIDIA AI Enterprise

AI 및 데이터 분석 소프트웨어의 엔드 투 엔드 클라우드 네이티브 제품군인 NVIDIA AI Enterprise는 VMware vSphere가 있는 하이퍼바이저 기반의 가상 인프라에서 A2에서 실행하도록 인증되었습니다. 이로써 하이브리드 클라우드 환경에서 AI 및 추론 워크로드의 관리 및 확장이 가능해집니다.

NVIDIA AI Enterprise에 대해 자세히 알아보세요 ›

MIG를 사용하는 A30은 GPU 가속화 인프라의 활용률을 극대화합니다.

주류 NVIDIA 인증 시스템

NVIDIA A2가 있는 NVIDIA-Certified System™은 컴퓨팅 가속화와 빠르고 안전한 NVIDIA 네트워킹을 NVIDIA의 OEM 파트너가 구축 및 판매하는 엔터프라이즈 데이터센터 서버에 가져옵니다. 이 프로그램은 고객이 NVIDIA NGC™ 카탈로그에서 비용 효과적이며 확장 가능한 하나의 고성능 인프라에서 기존 및 다양한 최신 AI 애플리케이션에 대한 시스템을 식별, 획득 및 구축하도록 지원합니다.

NVIDIA-Certified System에 대해 자세히 알아보기 ›

NVIDIA Ampere 아키텍처 기반

NVIDIA Ampere 아키텍처는 탄력적 컴퓨팅 시대에 맞게 설계되어 최신 엔터프라이즈 애플리케이션을 구동하는 데 필요한 성능과 가속을 제공합니다. 세계 최고의 성능과 탄력성을 갖춘 데이터센터의 핵심을 살펴보세요.

NVIDIA Ampere 아키텍처에 대해 자세히 알아보기 ›

기술 사양

Peak FP32	4.5 TF
TF32 Tensor Core	9 TF \| 18 TF¹
BFLOAT16 Tensor Core	18 TF \| 36 TF¹
Peak FP16 Tensor Core	18 TF \| 36 TF¹
Peak INT8 Tensor Core	36 TOPS \| 72 TOPS¹
Peak INT4 Tensor Core	72 TOPS \| 144 TOPS¹
RT Cores	10
Media engines	1 video encoder 2 video decoders (includes AV1 decode)
GPU memory	16GB GDDR6
GPU memory bandwidth	200GB/s
Interconnect	PCIe Gen4 x8
Form factor	1-slot, low-profile PCIe
Max thermal design power (TDP)	40–60W (configurable)
Virtual GPU (vGPU) software support^²	NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)

¹ 희소성 포함
² 향후 출시될 vGPU에서 지원

NVIDIA Ampere 아키텍처 살펴보기

NVIDIA Ampere 아키텍처의 최첨단 기술을 살펴보세요.

자세히 알아보기