NVIDIA Quantum-2 InfiniBand
아키텍처

클라우드 기반 슈퍼컴퓨팅을 위한 극강의 성능

네트워크 통신에서 기록적인 성능

NVIDIA InfiniBand 아키텍처의 7세대인 NVIDIA Quantum-2는 AI 개발자와 과학 연구자에게 세계에서 가장 어려운 문제를 해결하고 세계 최고의 슈퍼컴퓨팅 데이터센터를 강화할 수 있는 가장 빠른 네트워킹 성능과 기능 세트를 제공합니다. 여기에는 소프트웨어 정의 네트워킹, 원격 직접 메모리 액세스(RDMA), 네트워크 내 컴퓨팅, 고급 가속 엔진, 최대 400Gb/s의 가장 빠른 속도 및 피드가 포함됩니다.

2X Data Throughput

데이터 속도

4X MPI Performance

향상된 성능

5X Switch System Capacity

향상된 TCO

6.5X Higher Scalability

엑사스케일 준비

32X More AI Acceleration

가속화된 딥 러닝

영향을 미치는 성능

HPC, AI 슈퍼컴퓨터 및 애플리케이션 강화

가속화된 인-네트워크 컴퓨팅

최신 HPC(고성능 컴퓨팅), AI 및 하이퍼스케일 인프라에는 더 높은 속도와 효율성으로 데이터를 분석하고 복잡한 시뮬레이션을 실행하기 위해 더 빠른 인터커넥트와 더 많은 지능형 네트워크가 필요합니다. NVIDIA Quantum-2는 3세대의 NVIDIA SHARPv3™(Scalable Hierarchical Aggregation and Reduction Protocol), MPI(Message Passing Interface) 인터페이스 태그 매칭, MPI 올-투-올 및 프로그래밍 가능한 엔진 등 프로그래밍 가능한 사전 구성된 컴퓨팅 엔진을 통해 인-네트워크 컴퓨팅을 향상 및 확장하여 최상의 노드당 비용과 ROI를 제공합니다.

 
Benefits of Performance Isolation

성능 분리

NVIDIA Quantum-2 InfiniBand 플랫폼은 혁신적인 사전 모니터링 및 혼잡 관리를 제공하여 트래픽 격리를 제공하고, 성능 지터를 거의 제거하고, 애플리케이션이 전용 시스템에서 실행되는 것처럼 예측 성능을 보장합니다.

클라우드 기반 슈퍼컴퓨팅

NVIDIA 클라우드 기반 슈퍼컴퓨팅 플랫폼은 NVIDIA® BlueField® 데이터 처리 장치(DPU) 아키텍처와 저지연 고속 NVIDIA Quantum-2 InfiniBand 네트워킹을 활용합니다. 이 솔루션은 베어 메탈 성능, 사용자 관리 및 분리, 데이터 보호, 온디맨드 HPC(고성능 컴퓨팅), AI 서비스를 간단하고 안전하게 제공합니다.

Data center with NVIDIA Quantum-2 InfiniBand architecture with SHARPv3 technology

빛의 속도로 데이터 제공

HCA(Host Channel Adapter)

NVIDIA ConnectX-7 InfiniBand HCA(Host-Channel Adapter)는 최고의 네트워크 성능을 제공해 세계에서 가장 까다로운 워크로드를 처리할 수 있습니다.

PCIe Gen4 및 Gen5가 탑재된 ConnectX-7 InfiniBand HCA는 다양한 폼 팩터를 지원하며, 초당 400기가비트(Gb/s)의 싱글 또는 듀얼 네트워크 포트를 제공합니다.

ConnectX-7 InfiniBand HCA에는 MPI 올-투-올 및 MPI 태그 매칭 하드웨어 엔진을 갖춘 고급 인-네트워크 컴퓨팅 기능이 포함되어 있습니다. 향상된 서비스 품질(QoS)을 위한 기타 패브릭 개선 사항에는 적응형 라우팅 및 혼잡 제어가 포함되어 있습니다. 또한 HCA에는 전처리 데이터 알고리즘을 지원하고 애플리케이션 제어 경로를 네트워크에 오프로드할 수 있는 프로그래밍 가능한 추가 엔진도 포함되어 있습니다. 이로써 높은 성능과 확장성을 제공하고 컴퓨팅과 통신 간의 중복을 강화합니다.

고정 구성 스위치

NVIDIA Quantum-2 고정 구성 스위치 제품군은 물리적인 32개의 OSFP(Octal Small Form-factor) 커넥터에서 64개의 400Gb/s 포트 또는 128개의 200Gb/s 포트를 구성합니다. 소형 1U 스위치 설계에는 내부 또는 외부적으로 관리되는 공랭식 및 수랭식 버전이 포함되어 있습니다.

NVIDIA Quantum-2 고정 구성 스위치 제품군은 초당 총 51.2테라비트(Tb/s)의 양방향 처리량을 초당 665억 이상의 패킷 용량으로 제공합니다. 이상적인 랙 장착 InfiniBand 솔루션인 스위치는 Fat Tree, DragonFly+, 다차원 Torus, Hypercube 등의 다양한 토폴로지에 대해 최대한의 유연성을 제공합니다.

모듈형 스위치

NVIDIA Quantum-2 모듈형 스위치 제품군은 다음과 같은 포트 구성을 제공합니다.

  • 400Gb/s 포트 2,048개 또는 200Gb/s 포트 4,096개
  • 400Gb/s 포트 1,024개 또는 200Gb/s 포트 2,048개
  • 400Gb/s 포트 512개 또는 200Gb/s 포트 1,024개

가장 큰 모듈형 스위치는 초당 총 1.64페타비트의 양방향 처리량을 제공하며, 이는 이전 세대의 NVIDIA Quantum InfiniBand 모듈형 스위치 대비 5배에 해당합니다.

트랜시버 및 케이블

NVIDIA Quantum-2 연결성 옵션에는 다양한 트랜시버 및 MPO(Multi-fiber Push-on Connector), ACC(Active Copper Cable) 및 DAC(Direct Attached Cable)가 1-2 및 1–4 스플리터 옵션과 함께 포함되어 있습니다. 따라서 어떠한 토폴로지라도 최고의 성능으로 구축할 수 있는 최대한의 유연성을 제공합니다.

세계 최고의 네트워킹 성능, 확장성 및 효율성

성능

  • 포트당 400Gb/s 대역폭
  • 싱글 스위치에서 400Gb/s 포트 64개 또는 200Gb/s 포트 128개
  • 싱글 스위치에서 400Gb/s 포트 2,048개 또는 200Gb/s 포트 4,096개
  • 싱글 NVIDIA Quantum 2 스위치 디바이스에서 초당 665억 이상의 패킷(양방향)

자체 신기록 갱신

  • 이전 세대 대비 포트당 대역폭 2배
  • 이전 세대 대비 스위치 기수 3배
  • MPI 성능 4배
  • 이전 세대 대비 스위치당 32배 높은 AI 가속화 성능
  • 4스위치 티어(3홉) DragonFly+ 네트워크에서 400Gb/s 노드 1백만 개 이상, 이전 세대보다 6.5배 높음
  • 데이터센터 전력 및 공간 7% 감소

주요 특징

  • 완전한 전송 오프로드
  • RDMA, GPUDirect® RDMA, GPUDirect 스토리지
  • 프로그래밍 가능한 인-네트워크 컴퓨팅 엔진
  • MPI 올-투-올 하드웨어 가속화
  • MPI 태그 매칭 하드웨어 가속화
  • NVIDIA SHARPv3
  • 향상된 적응형 라우팅, 정체 제어 및 QoS
  • 셀프 힐링 네트워킹

NVIDIA Quantum-2 InfiniBand 플랫폼에 대해 자세히 알아보려면 아키텍처 개요 전문을 읽어보세요.