AI 모델은 정확한 기존 AI 및 딥 추천자 시스템과 같은 새로운 수준의 도전 과제를 수행함에 따라 복잡성이 폭발적으로 커지고 있습니다. 이러한 과제를 트레이닝하려면 엄청난 컴퓨팅 성능과 확장성이 필요합니다.
Tensor Float(TF32) 정밀도를 갖춘 NVIDIA A100의 3세대 Tensor CoresTensor 코어는 코드를 변경할 필요 없이 이전 세대보다 최대 10배 높은 성능과 함께 자동 혼합 정밀도로 추가 2배의 향상을 제공합니다. 3세대 NVIDIA® NVLink®, NVIDIA NVSwitch™, PCI Gen4, Mellanox InfiniBand 및 NVIDIA Magnum IO™ 소프트웨어 SDK와 결합하면 수천 개의 A100 GPU로 확장이 가능합니다. 이는 BERT와 같은 대규모 AI 모델을 A100 xx개의 클러스터에서 단 xx분 안에 트레이닝하여 유례 없는 성능과 확장성을 제공할 수 있다는 뜻입니다.
NVIDIA의 트레이닝 리더십은 AI 트레이닝에 대한 최초의 범산업 벤치마크인 MLPerf 0.6에서 입증되었습니다.