NDR 400Gb/s InfiniBand 아키텍처

클라우드 기반 슈퍼컴퓨팅을 위한 극강의 성능

네트워크 통신에서 기록적인 성능

NDR 400Gb/s를 갖춘 7세대 NVIDIA InfiniBand 아키텍처는 AI 개발자와 과학 연구원들에게 세계에서 가장 까다로운 문제를 처리할 수 있는 가장 빠른 네트워킹 성능을 제공합니다. 소프트웨어 정의 네트워킹, 원격 직접 메모리 액세스(RDMA), 인-네트워크 컴퓨팅, 고급 가속 엔진 및 가장 빠른 속도와 피드를 갖춘 NDR InfiniBand는 세계 최고의 슈퍼컴퓨팅 데이터센터를 지원합니다

nvidia-networking-ndr-technology-numbers-1cn-d

HPC, AI 슈퍼컴퓨터 및 애플리케이션 강화

가속화된 인-네트워크 컴퓨팅

최신 HPC(고성능 컴퓨팅), AI 및 하이퍼스케일 인프라에는 더 높은 속도와 효율성으로 데이터를 분석하고 복잡한 시뮬레이션을 실행하기 위해 더 빠른 인터커넥트와 더 많은 지능형 네트워크가 필요합니다. NVIDIA InfiniBand는 3세대의 NVIDIA SHARPv3™(Scalable Hierarchical Aggregation and Reduction Protocol), MPI(Message Passing Interface) 인터페이스 태그 매칭, MPI 올-투-올 및 프로그래밍 가능한 엔진 등 프로그래밍 가능한 사전 구성된 컴퓨팅 엔진을 통해 인-네트워크 컴퓨팅을 향상 및 확장하여 최상의 노드당 비용과 ROI를 제공합니다.

NVIDIA Mellanox InfiniBand 아키텍처를 통해 가속화된 인-네트워크 컴퓨팅 아키텍처
SHARPv3 기술이 사용된 NVIDIA Mellanox NDR InfiniBand 아키텍처 기반 데이터센터

무제한 확장성

SHARPv3 기술이 사용된 NDR InfiniBand는 이전 세대의 HDR InfiniBand에 비해 32배 높은 AI 가속 성능에 해당하는 최대 64개의 병렬 흐름을 지원하여 네트워크를 통해 대규모 데이터 집계를 위한 거의 무제한의 확장성을 제공합니다. MPI 올-투-올 및 MPI 태그 매칭 하드웨어 엔진은 향상된 정체 제어, 적응형 라우팅, 자체 회복 네트워킹 등의 기능과 함께 HPC 및 AI 클러스터의 핵심 기능을 향상시켜 더욱 높은 성능을 달성하도록 지원합니다.

빛의 속도로 데이터 제공

HCA(Host Channel Adapter)

NVIDIA ConnectX-7 NDR 400Gb/s InfiniBand HCA(Host-Channel Adapter)는 최고의 네트워크 성능을 제공해 세계에서 가장 까다로운 워크로드를 처리할 수 있습니다.

PCIe Gen4 및 Gen5가 탑재된 NDR InfiniBand HCA는 다양한 폼 팩터를 지원하며, 초당 400기가비트(Gb/s)의 싱글 또는 듀얼 네트워크 포트를 제공합니다.

NDR InfiniBand HCA에는 MPI 올-투-올 및 MPI 태그 매칭 하드웨어 엔진을 갖춘 고급 인-네트워크 컴퓨팅 기능이 포함되어 있습니다. 향상된 서비스 품질(QoS)을 위한 기타 패브릭 개선 사항에는 적응형 라우팅 및 혼잡 제어가 포함되어 있습니다. 또한 HCA에는 전처리 데이터 알고리즘을 지원하고 애플리케이션 제어 경로를 네트워크에 오프로드할 수 있는 프로그래밍 가능한 추가 엔진도 포함되어 있습니다. 이로써 높은 성능과 확장성을 제공하고 컴퓨팅과 통신 간의 중복을 강화합니다.

엣지 스위치

NDR InfiniBand 고정 구성 스위치 제품군은 물리적인 32개의 OSFP(Octal Small Form-factor) 커넥터에서 64개의 NDR 포트 또는 128개의 NDR200 포트를 구성합니다. 소형 1U 스위치 설계에는 내부 또는 외부적으로 관리되는 공랭식 및 수랭식 버전이 포함되어 있습니다.

NDR InfiniBand 고정 구성 스위치 제품군은 초당 총 51.2테라비트(Tb/s)의 양방향 처리량을 초당 665억 이상의 패킷 용량으로 제공합니다. 이상적인 랙 장착 InfiniBand 솔루션인 스위치는 Fat Tree, DragonFly+, 다차원 Torus, Hypercube 등의 다양한 토폴로지에 대해 최대한의 유연성을 제공합니다.

모듈형 스위치

NDR InfiniBand 모듈형 스위치 제품군은 다음과 같은 포트 구성을 제공합니다

  • NDR 포트 2,048개(400Gb/s) 또는 NDR200 포트 4,096개(200Gb/s)
  • NDR 포트 1,024개(400Gb/s) 또는 NDR200 포트 2,048개(200Gb/s)
  • NDR 포트 512개(400Gb/s) 또는 NDR200 포트 1,024개(200Gb/s)

가장 큰 모듈형 스위치는 초당 총 1.64페타비트의 양방향 처리량을 제공하며, 이는 이전 세대의 HDR InfiniBand 모듈형 스위치 대비 5배에 해당합니다.

트랜시버 및 케이블

NDR InfiniBand 연결성 옵션에는 다양한 트랜시버 및 MPO(Multi-fiber Push-on Connector), ACC(Active Copper Cable) 및 DAC(Direct Attached Cable)가 1-2 및 1–4 스플리터 옵션과 함께 포함되어 있습니다. 따라서 어떠한 토폴로지라도 최고의 성능으로 구축할 수 있는 최대한의 유연성을 제공합니다..

세계 최고의 네트워킹 성능, 확장성 및 효율성

성능

  • 포트당 400Gb/s 대역폭
  • 싱글 스위치에서 NDR 400Gb/s 포트 64개 또는 NDR200 200Gb/s 포트 128개
  • 싱글 모듈형 스위치에서 NDR 포트 2,048개 또는 NDR200 포트 4,096개
  • 싱글 NDR 스위치 디바이스에서 초당 665억 이상의 패킷(양방향)

자체 신기록 갱신

  • HDR 대비 포트당 대역폭 2배
  • HDR 대비 스위치 기수 3배
  • HDR 대비 스위치당 32배 높은 AI 가속화 성능
  • 4스위치 티어(3홉) DragonFly+ 네트워크에서 400Gb/s 노드 1백만 개 이상, HDR보다 6.5배 높음

주요 특징

  • 완전한 전송 오프로드
  • RDMA, GPUDirect® RDMA, GPUDirect 스토리지
  • 프로그래밍 가능한 인-네트워크 컴퓨팅 엔진
  • MPI 올-투-올 하드웨어 가속화
  • MPI 태그 매칭 하드웨어 가속화
  • NVIDIA SHARPv3
  • 향상된 적응형 라우팅, 정체 제어 및 QoS
  • 셀프 힐링 네트워킹

NDR에 대해 자세히 알아보려면 아키텍처 개요 전문을 읽어보세요.