NVLink Switch Chip

NVIDIA NVLink 및 NVLink Switch

AI 학습, 추론 및 기타 고부하 랙 스케일 GPU 가속 워크로드를 위해, 고대역폭 GPU 간 통신을 지원하는 스케일업 네트워킹 패브릭을 구현합니다. 

더 빠른 스케일업 인터커넥트의 필요성

최신 AI 모델에서 최상의 성능을 구현하려면, 서버 랙 전체를 연결하는 원활한 고처리량 GPU 간 통신이 뒷받침되어야 합니다. 6세대 NVIDIA NVLink™ 및 NVLink 스위치는 낮은 지연 시간, 대규모 네트워크 대역폭, 올투올 연결성을 통해 훈련과 추론을 가속화하며, 이를 바탕으로 더 빠른 추론 및 에이전틱 AI 워크로드를 처리할 수 있도록 설계되었습니다.

NVLink 규모별 성능

NVIDIA Rubin에 탑재된 6세대 NVIDIA NVLink는 최신 AI 모델 아키텍처의 학습 및 추론 속도를 높이기 위해, GPU 간 통신 대역폭을 이전 세대 대비 2배로 확대했습니다.

NVLink Communications를 사용하여 추론 처리량 향상

NVIDIA NVLink 및 NVLink Switch로 GPU 완전 연결

NVLink는 서버 내부에서 멀티 GPU 입출력(IO)을 확장해 주는 3.6 TB/s 대역폭의 양방향 직접 GPU 간 인터커넥트 기술입니다. NVIDIA NVLink 스위치 칩은 여러 NVLink를 연결하여, 랙 전체에서 모든 GPU 간의 올투올을 최대 NVLink 속도로 지원합니다.

고속 집합 연산을 지원하기 위해, 각 NVLink Switch에는 네트워크 내 축소(in-network reduction) 및 멀티캐스트 가속을 위한 NVIDIA SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)™ 엔진이 탑재되어 있습니다.

NVLink Switch 시스템을 사용하여 수조 개의 매개변수 모델을 위한 테스트 시간 추론 가속화

NVLink Switch를 활용하면 노드 간 NVLink 연결을 확장해 높은 대역폭의 멀티 노드 GPU 클러스터를 구축할 수 있어, 데이터센터급 GPU 환경을 효과적으로 구현할 수 있습니다. NVIDIA NVLink 스위치는 대규모 모델 병렬 처리를 위해 단일 NVIDIA Vera Rubin NVL72에서 260TB/s의 GPU 대역폭을 구현합니다. NVLink 기반 멀티 서버 클러스터는 증가된 컴퓨팅 성능에 맞춰 GPU 간 통신을 균형 있게 확장하며, 이를 통해 NVIDIA Vera Rubin NVL72는 단일 8-GPU 시스템 대비 9배 더 많은 GPU를 수용할 수 있습니다.

엔터프라이즈에서 엑사스케일로 확장

비교할 수 없는 성능을 제공하는 완전 연결

Vera Rubin NVL72의 NVLink 스위치 칩은 논블로킹 컴퓨팅 패브릭을 통해 72개의 GPU가 완전히 연결된 환경을 구현합니다. NVLink Switch는 모든 GPU 쌍을 3.6 TB/s의 놀라운 속도로 상호 연결합니다. 완전한 올 투 올 커뮤니케이션을 지원합니다. Vera Rubin NVL72에 있는 72개의 GPU는 최대 3.6엑사플롭스의 AI 컴퓨팅 성능을 갖춘 단일 고성능 가속기로 사용할 수 있습니다.

가장 강력한 AI 및 HPC 플랫폼

NVLink 및 NVLink Switch는 완전한 NVIDIA 데이터센터 솔루션의 필수 구성 요소이며 해당 솔루션은 NVIDIA AI Enterprise 소프트웨어 제품군과 NVIDIA NGC™ 카탈로그의 하드웨어, 네트워킹, 소프트웨어, 라이브러리 및 최적화된 AI 모델 및 애플리케이션을 통합합니다. 연구원들은 가장 강력한 엔드 투 엔드 AI 및 HPC 플랫폼을 활용해 실제 결과를 도출하고 솔루션을 프로덕션에 배포함으로써, 모든 규모에서 전례 없는 가속화를 실현할 수 있습니다.

NVIDIA Rubin 플랫폼에 대해 자세히 알아보세요.