This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA A30
Tensor 코어 GPU

주요 엔터프라이즈 서버를 위한 다용도 컴퓨팅 가속.

모든 엔터프라이즈를 위한 AI 추론 및 주요 컴퓨팅

NVIDIA A30 Tensor 코어 GPU를 통해 모든 엔터프라이즈 워크로드에 가속화된 성능을 제공하세요. NVIDIA Ampere 아키텍처 Tensor 코어 및 Multi-Instance GPU (MIG) 를 통해, 대규모 AI 추론 및 고성능 컴퓨팅(HPC) 애플리케이션을 포함하여 다양한 워크로드 전반에서 안전하게 속도 향상을 제공합니다. 고속 메모리 대역폭과 낮은 전력 소모량을 주류 서버에 최적인 PCIe 폼 팩터에 결합함으로써, A30은 탄력 있는 데이터센터를 지원하며 엔터프라이즈에게 최대한의 가치를 제공합니다.

NVIDIA A30 데이터시트 (PDF 708 KB) 보기

A30 PCIe 제품 개요 (PDF 539 KB) 보기

최신 IT를 위한 데이터센터 솔루션

NVIDIA Ampere 아키텍처는 완전한 NVIDIA 엔터프라이즈 데이터센터 솔루션 의 일부로, 하드웨어, 네트워킹, 소프트웨어, 라이브러리 및 NVIDIA NGC^™ 카탈로그.의 최적화된 AI 모델과 애플리케이션에 걸쳐 구성 요소를 통합합니다. 연구원은 데이터센터를 위한 가장 강력한 엔드 투 엔드 AI 및 HPC 플랫폼을 통해 실제 결과를 빠르게 제공하고 솔루션을 규모에 맞게 프로덕션에 배포할 수 있습니다.

딥러닝 트레이닝

AI 트레이닝—v100보다 최대 3배, T4보다 최대 6배 더 높은 처리량

BERT Large Pre-Training (Normalized)

NVIDIA A30 Tensor Cores with Tensor Float (TF32)

ERT-대규모 사전 트레이닝(에포크 9/10개) 1단계 및 (에포크 1/10개) 2단계, 1단계의 시퀀스 길이 = 128, 2단계 = 512, 데이터세트 = real, NGC™ 컨테이너 = 21.03,

8x GPU: T4(FP32, BS=8, 2) | V100 PCIE 16GB(FP32, BS=8, 2) | A30(TF32, BS=8, 2) | A100 PCIE 40GB(TF32, BS=54, 8) | 표시된 배치 크기는 각각 1단계 및 2단계에 해당

대화형 AI 등 다음 단계의 도전 과제에 대해 AI 모델을 트레이닝하는 데는 엄청난 컴퓨팅 성능과 확장성이 필요합니다.

Tensor Float(TF32)를 갖춘 NVIDIA A30 Tensor 코어 는 코드를 변경할 필요 없이 NVIDIA Volta보다 최대 10배 높은 성능과 더불어 자동 혼합 정밀도 및 FP16으로 추가적인 2배의 성능 향상을 보여주며 합쳐 20배 높은 처리량 향상을 제공합니다. NVIDIA^® NVLink, PCIe Gen4, NVIDIA 네트워킹 및 NVIDIA Magnum IO^™ SDK와 결합할 때 수천 개의 GPU로 확장 가능합니다.

Tensor 코어와 MIG를 통해 A30을 하루 내내 워크로드에 동적으로 사용할 수 있습니다. 수요가 피크일 때 프로덕션 추론에 사용할 수 있으며, GPU의 일부는 목적을 변경하여 피크 시간이 아닐 때 같은 모델을 재트레이닝할 수 있습니다.

NVIDIA는 AI 트레이닝에 대한 업계 전반의 벤치마크인 MLPerf, 에서 여러 성능 기록을 세웠습니다.

트레이닝을 위한 NVIDIA Ampere 아키텍처에 대해 자세히 알아보기 ›

딥러닝 추론

A30은 획기적인 기능을 도입하여 추론 워크로드를 최적화합니다. FP64에서 TF32 및 INT4에 이르는 전체 범위의 정밀도를 가속화합니다. GPU당 최대 4개의 MIG를 지원하는, A30은 여러 네트워크가 보장된 서비스 품질(QoS)을 갖추고 안전한 하드웨어 파티션에서 동시에 운영되도록 지원합니다. 또한 구조적 희소성 지원은 A30의 다른 추론 성능 이점 외에 최대 2배의 추가 성능을 제공합니다.

시장을 주도하는 NVIDIA의 AI 성능은 MLPerf Inference 에서 드러났습니다. 대규모 AI를 쉽게 배포하는 NVIDIA Triton^™ Inference 추론 서버와 결합했을 때, A30은 모든 엔터프라이즈에 이 혁신적인 성능을 제공합니다.

추론에 대한 NVIDIA Ampere 아키텍처에 대해 자세히 알아보기 ›

AI 추론—실시간 대화형 AI에서 V100보다 최대 3배 높은 처리량

BERT 대규모 추론(일반화됨)
<10ms 지연 시간에 대한 처리량

NVIDIA® TensorRT®, 정밀도=INT8, 시퀀스 길이 = 384, NGC 컨테이너 20.12, 지연 시간 <10ms, 데이터세트 = synthetic 1x GPU: A100 PCIE 40GB(BS=8) | A30(BS=4) | V100 SXM2 16GB | T4(BS=1)

AI 추론—실시간 영상 분류에서 T4보다 3배 이상 높은 처리량

RN50 v1.5 추론(Normalized)
<7ms 미만 레이턴시를 위한 처리량

TensorRT, NGC Container 20.12, Latency <7ms, Dataset=Synthetic, 1x GPU: T4 (BS=31, INT8) | V100 (BS=43, Mixed precision) | A30 (BS=96, INT8) | A100 (BS=174, INT8)

고성능 컴퓨팅

HPC—V100보다 최대 1.1배, T4보다 8배 높은 처리량

LAMMPS(일반화됨)

NVIDIA A30 features double precision (FP64)

데이터세트: ReaxFF/C, FP64 | 4x GPU: T4, V100 PCIE 16GB, A30

차세대 발견을 위해 과학자들은 우리 주위의 세계를 더 잘 이해할 수 있도록 시뮬레이션을 보고 있습니다.

NVIDIA A30에는 GPU가 소개된 후 HPC 성능의 가장 큰 도약을 제공한 FP64 NVIDIA Ampere 아키텍처 Tensor 코어가 있습니다. 24기가바이트(GB)의 GPU 메모리 및 초당 933기가바이트(GB/s)의 대역폭과 결합되어 연구원들이 이중 정밀 계산을 빠르게 해결하도록 해줍니다. HPC 애플리케이션도 TF32를 활용하여 단정밀도의 고밀도 매트릭스 곱셈 연산에서 높은 처리량을 달성할 수 있습니다.

FP64 Tensor 코어와 MIG의 결합은 연구 기관에서 GPU를 안전하게 파티션하여 여러 연구원들이 보장된 QoS 및 최대 GPU 활용률로 컴퓨팅 리소스에 액세스하도록 지원합니다. AI를 배포하는 엔터프라이즈는 피크 수요 기간 중에 A30의 추론 기능을 사용한 다음, 피크 기간이 아닐 때는 HPC 및 AI 트레이닝 워크로드에 대해 같은 컴퓨팅 서버의 목적을 변경할 수 있습니다.

HPC 애플리케이션의 최신 GPU 성능 살펴보기 ›

고성능 데이터 분석

데이터 사이언티스트는 대규모 데이터세트를 분석, 시각화하고 인사이트로 전환할 수 있어야 합니다. 하지만 스케일아웃 솔루션은 여러 서버에 흩어진 데이터세트 때문에 교착 상태에 빠지는 경우가 많습니다.

A30을 사용하는 가속화 서버는 대규모 HBM2 메모리, 933GB/s의 메모리 대역폭, NVLink를 통한 확장성과 함께 필요한 컴퓨팅 성능을 제공하여 이러한 워크로드를 처리합니다. NVIDIA InfiniBand, NVIDIA Magnum IO, RAPIDS^™ 및 Apache Spark용 RAPIDS Accelerator 등 오픈 소스 라이브러리의 RAPIDS™ 제품군과 함께 NVIDIA 데이터센터 플랫폼은 이러한 대규모 워크로드를 전례 없는 수준의 성능과 효율성으로 가속화합니다.

데이터 분석에 대해 자세히 알아보기 ›

고성능 데이터 분석

데이터 분석에 대해 자세히 알아보기 ›

엔터프라이즈 지원 활용률

A30 with MIG maximizes the utilization of GPU-accelerated infrastructure

MIG를 사용하는 A30은 GPU 가속화 인프라의 활용률을 극대화합니다. A30 GPU는 MIG를 통해 4개나 되는 별개의 인스턴스로 안전하게 분할될 수 있어 여러 사용자가 GPU 가속화에 액세스할 수 있습니다.

MIG는 Kubernetes, 컨테이너 및 하이퍼바이저 기반 서버 가상화와 연동됩니다. MIG는 인프라 관리자가 모든 작업에 보장된 QoS로 알맞은 크기의 GPU를 제공하도록 지원하여 모든 사용자가 가속 컴퓨팅 리소스를 사용할 수 있게 합니다.

MIG에 대해 자세히 알아보기 ›

NVIDIA AI Enterprise

AI 및 데이터 분석 소프트웨어의 엔드 투 엔드 클라우드 네이티브 제품군인 NVIDIA AI Enterprise는 VMware vSphere가 있는 하이퍼바이저 기반의 가상 인프라에서 A30에서 실행하도록 인증되었습니다. 이로써 하이브리드 클라우드 환경에서 AI 워크로드의 관리 및 확장이 가능해집니다.

NVIDIA AI Enterprise에 대해 자세히 알아보세요 ›

주류 NVIDIA 인증 시스템

NVIDIA A30이 있는 NVIDIA-Certified Systems™는 컴퓨팅 가속화와 빠르고 안전한 NVIDIA 네트워킹을 NVIDIA의 OEM 파트너가 구축 및 판매하는 엔터프라이즈 데이터센터 서버에 가져옵니다. 이 프로그램은 고객이 NVIDIA NGC 카탈로그에서 비용 효과적이며 확장 가능한 하나의 고성능 인프라에서 기존 및 다양한 최신 AI 애플리케이션에 대한 시스템을 식별, 획득 및 구축하도록 지원합니다.

NVIDIA 인증 시스템에 대해 자세히 알아보기 ›

A30 Tensor 코어 GPU 사양

FP64	5.2테라플롭스
FP64 Tensor 코어	10.3테라플롭스
FP32	10.3테라플롭스
TF32 Tensor 코어	82테라플롭스 \| 165테라플롭스*
BFLOAT16 Tensor 코어	165테라플롭스 \| 330테라플롭스*
FP16 Tensor 코어	165테라플롭스 \| 330테라플롭스*
INT8 Tensor 코어	330 TOPS \| 661 TOPS*
INT4 Tensor 코어	661 TOPS \| 1321 TOPS*
미디어 엔진	1개의 광학 플로우 가속기(OFA) 1개의 JPEG 디코더(NVJPEG) 4개의 영상 디코더(NVDEC)
GPU 메모리	24GB HBM2
GPU 메모리 대역폭	933GB/s
인터커넥트	PCIe Gen4: 64GB/s 3세대 NVLINK: 200GB/s**
폼 팩터	폼 팩터 듀얼 슬롯, 전체 높이, 전체 길이(FHFL)
최대 열 설계 전력(TDP)	165W
MIG(Multi-Instance GPU)	4개 GPU 인스턴스 @ 각 6GB 2개 GPU 인스턴스 @ 각 12GB 1개 GPU 인스턴스 @ 24GB
가상 GPU(vGPU) 소프트웨어 지원	용 NVIDIA AI Enterprise NVIDIA 가상 컴퓨팅 서버

* 희소성 포함
** 최대 2개 GPU를 위한 NVLink Bridge

NVIDIA Ampere 아키텍처 살펴보기

NVIDIA Ampere 아키텍처의 최첨단 기술을 살펴보세요.

자세히 알아보기