Supercomputación Nativa del Cloud

Rendimiento de IA y HPC sin concesiones, aislamiento
de inquilinos de múltiples nodos y seguridad.

Rendimiento Completo con Aislamiento de Múltiples Inquilinos

La supercomputación nativa de cloud combina la potencia de la computación de alto rendimiento con la seguridad y la facilidad de uso de los servicios de computación de cloud. La plataforma de supercomputación nativa de cloud de NVIDIA aprovecha la arquitectura de la unidad de procesamiento de datos (DPU)  NVIDIA® BlueField® con la red NVIDIA InfiniBand de alta velocidad y baja latencia para proporcionar rendimiento bare-metal, aislamiento y administración de usuarios, protección de datos y servicios de IA y de computación de alto rendimiento (HPC) a pedido de forma sencilla y segura.

Innovación para la Próxima Década y Más Allá

La Plataforma de Supercomputación Nativa del Cloud

Para ofrecer el máximo rendimiento, las supercomputadoras deben ofrecer seguridad de múltiples clientes, lo que idealmente se logra a través de plataformas nativas del cloud. El elemento clave que permite esta transición de arquitectura es la DPU.

La DPU es una plataforma de data center en un chip completamente integrada, por lo que puede descargar y administrar la infraestructura del data center en lugar del procesador host. Esto permite la seguridad y la organización de la supercomputadora.

Cuando se usa en combinación con los switches NVIDIA InfiniBand, esta arquitectura proporciona un rendimiento óptimo de bare-metal y admite de forma nativa el aislamiento de clientes múltiples nodos.

La Plataforma de Supercomputación Nativa del Cloud
Hacia una Arquitectura de Confianza Cero

Hacia una Arquitectura de Confianza Cero

Los sistemas de supercomputación nativos del cloud están diseñados para ofrecer el máximo rendimiento, seguridad y organización en un entorno de múltiples clientes.

La DPU BlueField puede alojar clientes de múltiples nodos que no sean de confianza, al tiempo que garantiza que los recursos de supercomputación se entreguen limpios a los nuevos clientes sin residuos previos. Para lograr esto, la DPU BlueField proporciona una imagen de inicio limpia para un cliente recién programado, realiza una limpieza completa y restablece la confianza, virtualiza el almacenamiento y otorga acceso a áreas de almacenamiento aprobadas.

Aceleración del Rendimiento de las Aplicaciones

Las bibliotecas y los frameworks de comunicación de HPC y AI son sensibles a la latencia y al ancho de banda, y desempeñan un papel fundamental en la determinación del rendimiento de las aplicaciones.

La descarga de las bibliotecas de la CPU o GPU host a la DPU Bluefield crea el mayor grado de superposición para la progresión paralela de la comunicación y la computación. También reduce los efectos negativos de la fluctuación del sistema operativo y aumenta drásticamente el rendimiento de las aplicaciones. Esto es clave para habilitar la próxima generación de arquitectura de supercomputación.

Los primeros resultados de la investigación de la Universidad Estatal de Ohio demuestran que las supercomputadoras nativas del cloud pueden realizar trabajos de HPC 1.4 veces más rápido que las tradicionales.

La DPU Proporciona una Aceleración de Rendimiento 1,4 Veces Superior para P3DFFT

Aceleración del Rendimiento de las Aplicaciones

Plataforma de Supercomputación Nativa del Cloud

NVIDIA Bluefield

La DPU NVIDIA BlueField DPU combina el adaptador de red NVIDIA Mellanox ConnectX® líder en la industria, una matriz de núcleos Arm con un subsistema PCIe y motores de aceleración de hardware HPC especialmente diseñados para brindar una completa capacidad de programación en el chip de la infraestructura del data center.

InfiniBand

La red NVIDIA Mellanox InfiniBand acelera y descarga las transferencias de datos para garantizar que los recursos de computación nunca “pasen hambre” debido a la falta de datos o ancho de banda. La red InfiniBand se puede dividir entre diferentes usuarios o clientes, lo que brinda seguridad y garantías de QoS.

DOCA

El SDK NVIDIA DOCA permite a los desarrolladores de infraestructura crear rápidamente aplicaciones y servicios de red, almacenamiento, seguridad, administración e IA y HPC con la DPU NVIDIA BlueField, aprovechando las API estándar de la industria. Con DOCA, los desarrolladores pueden programar la infraestructura de supercomputación del mañana mediante la creación de servicios de alto rendimiento, definidos por software, acelerados por DPU y nativos del cloud.

Magnum IO

El conjunto de desarrollo de software NVIDIA MAGNUM IO™ permite a los desarrolladores optimizar la entrada/salida (E/S) en las aplicaciones, lo que reduce el tiempo integral de sus workflows.

Magnum IO cubre todos los aspectos de IO, incluido el almacenamiento, las redes, las comunicaciones de múltiples GPU y de múltiples nodos. También incluye herramientas para crear perfiles de aplicaciones y ajustarlas, y eliminar cuellos de botella de E/S.

Aspectos Clave

  • Aislamiento de múltiples clientes, protección de datos y seguridad
  • Descargas de servicios de infraestructura
  • Motores de hardware dedicados para acelerar los frameworks de comunicación
  • Calidad de servicio mejorada (QoS)

Beneficios

  • Ofrece un rendimiento óptimo de bare-metal
  • Aumenta la disponibilidad de la CPU, la escalabilidad de las aplicaciones y la eficiencia del sistema
  • Mayor superposición de la computación y la comunicación
  • Menor fluctuación y ruido del sistema
  • Reduce los costos de infraestructura

Obtén más información sobre la supercomputación nativa del cloud en la descripción técnica.