Supercomputación nativa en la nube

Rendimiento sin restricciones para HPC e IA, aislamiento de inquilino en varios nodos y seguridad.

Rendimiento sin sistema operativo con aislamiento multiinquilino

La supercomputación nativa en la nube combina el poder de la informática de alto rendimiento con la seguridad y la facilidad de uso de los servicios de computación en la nube. La plataforma NVIDIA Cloud-Native Supercomputing aprovecha la arquitectura de la unidad de procesamiento de datos (DPU) NVIDIA® BlueField® con la red de alta velocidad y baja latencia NVIDIA® Mellanox® InfiniBand para ofrecer rendimiento, gestión y aislamiento de usuarios, protección de datos y servicios de computación de alto rendimiento (HPC) e IA a demanda, de forma sencilla y segura.

Innovación para la próxima década y más allá

La plataforma de supercomputación nativa en la nube

Para ofrecer el máximo rendimiento, los superordenadores deben ofrecer seguridad multiinquilino, que se logra idealmente a través de plataformas nativas en la nube. El elemento clave que habilita esta transición de arquitectura es la DPU. 

Como plataforma de centro de datos en el chip totalmente integrada, la DPU puede descargar y administrar la infraestructura del centro de datos en lugar del procesador host, lo que permite la seguridad y la orquestación del superordenador. 

Combinada con la conmutación NVIDIA Mellanox® InfiniBand esta arquitectura ofrece un rendimiento sin sistema operativo óptimo, mientras que admite de forma nativa aislamiento de inquilinos de varios nodos.

Cloud-Native Supercomputing Platform
Toward a Zero-Trust Architecture

Hacia una arquitectura de confianza cero

Los sistemas de supercomputación nativos en la nube están diseñados para ofrecer el máximo rendimiento, seguridad y orquestación en un entorno multiinquilino.

La DPU BlueField puede hospedar inquilinos multinodo que no son de confianza, al tiempo que garantiza que los recursos de supercomputación se entreguen limpios a los nuevos inquilinos sin residuos previos. Para ello, la DPU BlueField proporciona una imagen de arranque limpia para un inquilino recién programado, realiza una limpieza completa y vuelve a establecer la confianza, virtualiza el almacenamiento y concede acceso a áreas de almacenamiento aprobadas.

Aceleración del rendimiento de la aplicación

Las plataformas y bibliotecas de comunicación HPC e IA son sensibles a la latencia y al ancho de banda, y desempeñan un papel fundamental en la determinación del rendimiento de las aplicaciones.

Descargar las bibliotecas de la CPU o GPU del host a la DPU Bluefield crea el mayor grado de superposición para la progresión paralela de la comunicación y la computación. También reduce los efectos negativos del jitter del sistema operativo y aumenta drásticamente el rendimiento de la aplicación. Esta es la clave para habilitar la próxima generación de arquitectura de supercomputación. 

Los primeros resultados de la investigación de la Universidad Estatal de Ohio demuestran que los superordenadores nativos en la nube pueden realizar trabajos de HPC 1,4 veces más rápido que los tradicionales.

DPU Provides 1.4X Higher Performance Acceleration for P3DFFT

HPC and AI communication frameworks

Plataforma de supercomputación nativa en la nube

NVIDIA Bluefield

La DPU NVIDIA BlueField combina el adaptador de red NVIDIA ConnectX® líder del sector,  una serie de núcleos de ARM con un subsistema PCIe, y motores de aceleración de hardware diseñados específicamente con HPC para proporcionar programabilidad completa de infraestructura de centro de datos en el chip.

InfiniBand

Las redes NVIDIA InfiniBand aceleran y descargan las transferencias de datos para garantizar que nunca falten recursos informáticos por falta de datos o ancho de banda. La red InfiniBand se puede particionar entre diferentes usuarios o inquilinos, proporcionando seguridad y garantías de QoS.

DOCA

El SDK NVIDIA DOCA permite a los desarrolladores de infraestructura crear rápidamente aplicaciones y servicios de red, almacenamiento, seguridad, administración e IA y HPC, además de la DPU NVIDIA BlueField, aprovechando las API estándar del sector. Con DOCA, los desarrolladores pueden programar la infraestructura de supercomputación del mañana mediante la creación de servicios acelerados por DPU de alto rendimiento, definidos por software y nativos en la nube.

Magnum IO

El kit de desarrollo de software NVIDIA MAGNUM IO™ permite a los desarrolladores optimizar la entrada/salida (E/S) en las aplicaciones, reduciendo el tiempo de extremo a extremo de sus flujos de trabajo.

Magnum IO cubre todos los aspectos de la E/S, incluidas las comunicaciones de almacenamiento, redes, multi-GPU y multinodo. También incluye herramientas para perfilar y ajustar aplicaciones y eliminar cuellos de botella de E/S.

Características principales

  • Aislamiento multiinquilino, protección de datos y seguridad
  • Descargas de servicios de infraestructura
  • Motores de hardware dedicados para acelerar las plataformas de comunicaciones
  • Calidad de servicio mejorada (QoS)

Beneficios

  • Ofrezca un rendimiento óptimo sin sistema operativo
  • Aumenta la disponibilidad de la CPU, la escalabilidad de las aplicaciones y la eficiencia del sistema
  • Mayor superposición de computación y comunicación
  • Reducción del jitter / ruido del sistema
  • Costes de infraestructura reducidos

Obtenga más información sobre la supercomputación nativa en la nube en el informe técnico.