Arquitectura NDR 400G InfiniBand

Ofrece un rendimiento extremo para la era de IA a exaescala

Impulso de rendimiento excepcional en las comunicaciones de la red

La séptima generación de la arquitectura NVIDIA® Mellanox® InfiniBand, con NDR 400 GB/s InfiniBand, proporciona a los desarrolladores de IA y a los investigadores científicos el rendimiento de la red más rápido disponible para resolver los problemas más desafiantes del mundo. NVIDIA Mellanox InfiniBand® está diseñando el camino con las redes definidas por software, la aceleración de computación en red, el acceso remoto directo a la memoria (RDMA) y las velocidades y fuentes más rápidas, incluidos los impresionantes avances en comparación con la anterior generación de HDR InfiniBand.

 

Introducción a NVIDIA NDR 400 GB/s InfiniBand (1:48)

Mejora de las aplicaciones y superordenadores de HPC e IA

Computación en red acelerada

Las infraestructuras de computación de alto rendimiento (HPC), de IA y de hiperescala de hoy en día requieren interconexiones más rápidas y redes más inteligentes para analizar datos y ejecutar simulaciones complejas con mayor velocidad y eficiencia. NVIDIA Mellanox InfiniBand mejora y extiende su computación en red con motores computacionales preconfigurados y programables, como la tercera generación de protocolo de agregación y reducción jerárquica (SHARPv3) de NVIDIA Mellanox, la coincidencia de etiquetas MPI, MPI entre todos, y núcleos programables que ofrecen el mejor coste por nodo y ROI.

Computación en red acelerada por la arquitectura de NVIDIA Mellanox InfiniBand
Centro de datos con la arquitectura NVIDIA Mellanox NDR InfiniBand con tecnología SHARPv3

Escalabilidad ilimitada

NDR InfiniBand con la tecnología SHARPv3 crea una escalabilidad prácticamente ilimitada para ampliaciones de datos a través de la red, con soporte para hasta 64 flujos paralelos, 32 veces mayor potencia de aceleración de IA que con la anterior generación de HDR InfiniBand. Los motores de hardware de coincidencia de etiquetas MPI y MPI entre todos, además de otras capacidades, como el control de la congestión mejorada, el enrutamiento adaptable y la resolución automática de las redes, ofrecen mejoras críticas a los clústeres de HPC e IA, lo que les permite obtener un rendimiento todavía mayor.

Entrega de datos a la velocidad de la luz

Adaptadores de canal de host

Los adaptadores de canal de host (HCA) NDR InfiniBand con PCIe Gen4 y Gen5 admiten diversos formatos, que ofrecen puertos de red únicos o dobles a 400 Gigabit por segundo (GB/s) para NDR, 200 GB/s para NDR200 y velocidades inferiores.

Los HCA NDR InfiniBand incluyen capacidades avanzadas de computación en la red con los motores de hardware de coincidencia de etiquetas MPI y MPI entre todos, así como otras mejoras en el tejido para mejorar la calidad del servicio (QoS), incluido el enrutamiento adaptativo, el control de congestión y mucho más. Los HCA también incluyen núcleos de cálculo programables, que permiten descargar algoritmos de datos de preprocesamiento y rutas de control de aplicaciones a la red, lo que proporciona mayor rendimiento y escalabilidad, y mejora la superposición entre el cálculo y la comunicación.

Conmutadores periferales

La familia NDR InfiniBand de conmutadores periferales incluye 64 puertos NDR o 128 puertos NDR200 en 32 conectores de formato pequeño octal físicos (OSFP). Los conmutadores periferales compactos de 1U incluyen versiones refrigeradas por aire y por líquido, que se gestionan interna o externamente.

La familia NDR InfiniBand de conmutadores periferales proporciona 51,2 terabits por segundo (TB/s) adicionales de rendimiento bidireccional, con una capacidad de más de 66,5 mil millones paquetes por segundo. Como una solución InfiniBand ideal montada en el rack, el conmutador periferal NDR InfiniBand ofrece la máxima flexibilidad para una variedad de topologías, como Fat Tree, DragonFly+, Torus multidimensional, Hypercube y mucho más.

Conmutadores modulares

La familia NDR InfiniBand de conmutadores modulares proporciona estas configuraciones de puertos:

  • 2048 puertos de NDR (400 GB/s) o 4096 puertos de NDR200 (200 GB/s)
  • 1024 puertos de NDR (400 GB/s) o 2048 puertos de NDR200 (200 GB/s)

El conmutador modular más grande incorpora un rendimiento bidireccional total de 1,64 petabits por segundo, cinco veces superior al del conmutador modular HDR InfiniBand anterior.

El conmutador modular de tamaño mediano ofrece un rendimiento bidireccional total de 819 TB/s.

Transceptores y cables

Las opciones de conectividad NDR InfiniBand incluyen distintos transceptores y conectores de transporte de fibra óptica (MPO), cables de cobre activos (ACC) y cables con conexión directa (DAC) con opciones de separador de uno a dos y de uno a cuatro, lo que proporciona la máxima flexibilidad para crear cualquier topología con el mejor rendimiento.

Rendimiento de la red, escalabilidad y eficiencia líderes en el mundo

Rendimiento

  • 400 GB/s de ancho de banda por puerto
  • 64 puertos NDR 400 GB/s o 128 NDR200 de 200 GB/s en un solo conmutador
  • 2048 puertos NDR o 4096 NDR200 en un solo conmutador
  • Más de 66,5 mil millones paquetes por segundo (bidireccional) en un solo dispositivo de conmutación NDR

Rompemos nuestros propios récords

  • Duplica el ancho de banda por puerto frente a HDR
  • Triplica la base del conmutador frente a HDR
  • Potencia de aceleración de IA 32 veces más alta por conmutador frente a HDR
  • Nodos de más de 400 GB/s en una red de nivel de cuatro conmutadores (tres saltos) DragonFly+, 6,5 veces superior a HDR InfiniBand

Características principales

  • Descarga de transporte completa
  • RDMA, GPUDirect® RDMA, GPUDirect Storage
  • Motores de computación en red programables
  • Aceleración de hardware MPI entre todos los componentes
  • Aceleración de hardware de coincidencia de etiquetas MPI
  • NVIDIA Mellanox SHARPv3
  • Enrutamiento adaptativo avanzado, control de congestión y QoS
  • Redes que se recuperan automáticamente

Lee el resumen de la arquitectura completa para obtener más información sobre NDR.