사전 학습, 사후 학습, 추론 시간 확장 법칙의 융합으로 인해 최신 데이터센터는 복잡한 다단계 사고 체계를 필요로 하는 모델을 지원하는 과정에서 성능과 효율성 병목 현상에 직면해 있습니다.
이러한 과제를 해결하기 위해 특수 설계된 NVIDIA DGX™ Vera Rubin NVL72는 최첨단 성능을 제공하는 동시에 에너지 효율을 대폭 향상시키는 턴키 AI 인프라 솔루션입니다. DGX Vera Rubin NVL72는 모든 AI 워크로드에서 업계 최고의 와트당 성능과 와트당 토큰을 제공합니다. 이를 통해 기업은 토큰 경제성을 개선하는 동시에 인텔리전스의 규모를 획기적으로 확장할 수 있습니다.
DGX Vera Rubin NVL72는 전력 효율이 높은 NVIDIA Vera CPU와 NVIDIA Rubin GPU를 결합하여, 업계 최고의 와트당 성능을 제공합니다. 이를 통해 기업은 기존의 전력 소모 수준을 유지하면서도 학습 규모와 롱 컨텍스트 추론 성능을 확장할 수 있으며, 데이터 센터를 AI 혁신을 위한 고효율 에너지 엔진으로 탈바꿈시킬 수 있습니다.
DGX Vera Rubin NVL72 시스템을 기반의 NVIDIA DGX SuperPOD™는 대규모 AI 인프라 배포 시의 불확실성을 제거합니다. 단순하고 배포하기 쉬운 랙 아키텍처를 갖춘 이 시스템은 데이터센터 엔지니어링의 최신 기술 발전을 활용할 수 있도록 설계되었습니다.
NVIDIA Mission Control™은 DGX Vera Rubin NVL72 구성부터 시설 통합, 클러스터 및 워크로드 관리에 이르기까지 운영의 모든 측면을 가속화합니다. 지능형 통합 소프트웨어를 기반으로, 기업은 냉각 및 전력 이벤트를 제어하여 인프라 회복 탄력성을 재정의할 수 있습니다.
엔터프라이즈 AI를 위해 처음부터 구축된 NVIDIA DGX 플랫폼은 NVIDIA DGX SuperPOD를 갖추고 있으며, 최고의 NVIDIA 소프트웨어, 인프라 및 전문성을 최신 통합 AI 개발 솔루션에 결합합니다.
| GPU | 72x NVIDIA Rubin GPUs, 36x NVIDIA Vera CPUs |
| 총 GPU 메모리 | 대역폭 | 20.7TB | 최대 28.8TB/s |
| 총 고속 메모리 | 75 TB |
| 성능 | NVFP4 Inference: 3,600 PFLOPS NVFP4 Training: 2,520 PFLOPS FP8/FP6 Training: 1,260 PFLOPS |
| 네트워킹 | > 144x OSFP 단일 포트 NVIDIA® ConnectX®-9 VPI(800 Gb/s NVIDIA InfiniBand 및 이더넷 지원) > 18x 듀얼 포트 NVIDIA BlueField®-4 VPI(400 Gb/s NVIDIA InfiniBand 및 이더넷 지원) |
| NVIDIA NVLink™ Switch 시스템 | L1 NVIDIA NVLink 스위치 9개 |
| 관리 네트워크 | RJ45가 탑재된 베이스보드 관리 컨트롤러(BMC) 호스트 |
| 소프트웨어 | NVIDIA Mission Control, NVIDIA AI Enterprise, NVIDIA DGX OS |
| 엔터프라이즈 지원 | 하드웨어 및 소프트웨어에 대한 3년 엔터프라이즈 비즈니스 표준 지원 |
Specifications subject to change
NVIDIA 전문가에게 NVIDIA DGX Vera Rubin NVL72에 대해 상담해보세요.
NVIDIA DGX가 엔터프라이즈 AI 구축의 검증된 표준으로 자리 잡은 이유를 확인해 보세요.
온프레미스부터 호스팅 솔루션에 이르는 유연한 배포 옵션을 통해, AI의 모든 잠재력을 실현해 보세요.