NDR 400Gb/s InfiniBand Arquitectura

Ofrece un rendimiento extremo para la era de IA a exaescala

Record-Fractio euismod na rede de comunicacións

La séptima generación de la arquitectura InfiniBand de NVIDIA, con NDR 400 GB/s, proporciona a los desarrolladores de IA y a los investigadores científicos el rendimiento de la red más rápido disponible para enfrentarse a los problemas más desafiantes del mundo. NDR InfiniBand, con redes definidas por software, acceso remoto a memoria directa (RDMA), computación en red, motores de aceleración avanzados y las velocidades y fuentes más rápidas, capacita a los centros de datos de supercomputación líderes en el mundo.

nvidia-networking-ndr-technology-numbers-1cn-d

Mejora de las aplicaciones y superordenadores de HPC e IA

Computación en red acelerada

Las infraestructuras de computación de alto rendimiento (HPC), de IA y de hiperescala de hoy en día requieren interconexiones más rápidas y redes más inteligentes para analizar datos y ejecutar simulaciones complejas con mayor velocidad y eficiencia. NVIDIA Mellanox InfiniBand mejora y extiende su computación en red con motores computacionales preconfigurados y programables, como la tercera generación de protocolo de agregación y reducción jerárquica (SHARPv3) de NVIDIA Mellanox, la coincidencia de etiquetas MPI, MPI entre todos, y núcleos programables que ofrecen el mejor coste por nodo y ROI.

Computación en red acelerada por la arquitectura de NVIDIA Mellanox InfiniBand
Centro de datos con la arquitectura NVIDIA Mellanox NDR InfiniBand con tecnología SHARPv3

Escalabilidad ilimitada

NDR InfiniBand con la tecnología SHARPv3 crea una escalabilidad prácticamente ilimitada para ampliaciones de datos a través de la red, con soporte para hasta 64 flujos paralelos, 32 veces mayor potencia de aceleración de IA que con la anterior generación de HDR InfiniBand. Los motores de hardware de coincidencia de etiquetas MPI y MPI entre todos, además de otras capacidades, como el control de la congestión mejorada, el enrutamiento adaptable y la resolución automática de las redes, ofrecen mejoras críticas a los clústeres de HPC e IA, lo que les permite obtener un rendimiento todavía mayor.

Entrega de datos a la velocidad de la luz

Adaptadores de canal de host

El adaptador de canal host (HCA) NVIDIA ConnectX-7 InfiniBand, con NDR 400 GB/s, ofrece el mayor rendimiento de red disponible para las cargas de trabajo más complejas del mundo.

Los HCA NDR InfiniBand con PCIe Gen4 y Gen5 admiten diversos formatos, que ofrecen puertos de red únicos o dobles a 400 Gigabit por segundo (GB/s).

Los HCAs NDR InfiniBand incluyen capacidades avanzadas de computación en red, con motores de hardware MPI All-to-All y MPI Tag Matching. Para ofrecer una mayor calidad de servicio (QoS), otras mejoras en la estructura incluyen el enrutamiento adaptable y el control de congestión. Los HCA también incluyen motores programables adicionales que permiten preprocesar algoritmos de datos y descargar rutas de control de aplicaciones a la red. Así se ofrece un mayor rendimiento y escalabilidad, y se mejora la superposición entre el proceso y la comunicación.

Switches mit fester Konfiguration

La familia NDR InfiniBand de conmutadores de configuración fija incluye 64 puertos NDR o 128 puertos NDR200 en 32 conectores de formato pequeño octal físicos (OSFP). El diseño compacto de 1U de los conmutadores incluye versiones refrigeradas por aire y por líquido, que se gestionan interna o externamente.

La familia NDR InfiniBand de conmutadores de configuración fija proporciona 51,2 terabits por segundo (TB/s) adicionales de rendimiento bidireccional, con una capacidad de más de 66,5 mil millones de paquetes por segundo. Como una solución InfiniBand ideal montada en el rack, los conmutadores ofrecen la máxima flexibilidad para una variedad de topologías, como Fat Tree, DragonFly+, Torus multidimensional, Hypercube y mucho más.

Conmutadores modulares

La familia NDR InfiniBand de conmutadores modulares proporciona estas configuraciones de puertos:

  • 2048 puertos de NDR (400 GB/s) o 4096 puertos de NDR200 (200 GB/s)
  • 1024 puertos de NDR (400 GB/s) o 2048 puertos de NDR200 (200 GB/s)
  • 512 puertos de NDR (400 GB/s) o 1024 puertos de NDR200 (200 GB/s)

El conmutador modular más grande incorpora un rendimiento bidireccional total de 1,64 petabits por segundo, cinco veces superior al del conmutador modular HDR InfiniBand anterior.

Transceptores y cables

Las opciones de conectividad NDR InfiniBand incluyen distintos transceptores y conectores de transporte de fibra óptica (MPO), cables de cobre activos (ACC) y cables con conexión directa (DAC) con opciones de separador de uno a dos y de uno a cuatro. Esto proporciona la máxima flexibilidad para crear cualquier topología con el mejor rendimiento

Rendimiento de la red, escalabilidad y eficiencia líderes en el mundo

Rendimiento

  • 400 GB/s de ancho de banda por puerto
  • 64 puertos NDR 400 GB/s o 128 NDR200 de 200 GB/s en un solo conmutador
  • 2048 puertos NDR o 4096 NDR200 en un solo conmutador
  • Más de 66,5 mil millones de paquetes por segundo (bidireccional) en un solo dispositivo de conmutación NDR

Rompemos nuestros propios récords

  • Duplica el ancho de banda por puerto frente a HDR
  • Triplica la base del conmutador frente a HDR
  • Potencia de aceleración de IA 32 veces más alta por conmutador frente a HDR
  • Nodos de más de 400 GB/s en una red de nivel de cuatro conmutadores (tres saltos) DragonFly+, 6,5 veces superior a HDR

Características principales

  • Descarga de transporte completa
  • RDMA, GPUDirect® RDMA, GPUDirect Storage
  • Motores de computación en red programables
  • Aceleración de hardware MPI entre todos los componentes
  • Aceleración de hardware de coincidencia de etiquetas MPI
  • NVIDIA SHARPv3
  • Enrutamiento adaptativo avanzado, control de congestión y QoS
  • Redes que se recuperan automáticamente

Lee el resumen de la arquitectura completa para obtener más información sobre NDR.