Supercomputación nativa de la nube

Seguro, multiinquilino, sin sistema operativo

Rendimiento para IA, análisis de datos,
aplicaciones de HPC.

Rendimiento sin sistema operativo con aislamiento multiinquilino

La supercomputación nativa de la nube combina la potencia de la computación de alto rendimiento con la seguridad y la facilidad de uso de los servicios de computación en la nube. La plataforma de supercomputación nativa de la nube de NVIDIA aprovecha la arquitectura de la unidad de procesamiento de datos (DPU) NVIDIA® BlueField® con la red de alta velocidad y baja latencia NVIDIA Quantum InfiniBand para ofrecer rendimiento sin sistema operativo, gestión y aislamiento de usuarios, protección de datos y servicios de computación de alto rendimiento (HPC) e IA bajo demanda de forma sencilla y segura.  

Innovación para la próxima década y más allá

La plataforma de supercomputación nativa de la nube

Para ofrecer el máximo rendimiento, los superordenadores deben ofrecer seguridad multiinquilino, que se logra idealmente a través de plataformas nativas de la nube. El elemento clave que habilita esta transición de arquitectura es la DPU. 

Como plataforma de centro de datos en el chip totalmente integrada, la DPU puede descargar y administrar la infraestructura del centro de datos en lugar del procesador host, lo que permite la seguridad y la orquestación del superordenador. 

Combinada con la conmutación NVIDIA Quantum InfiniBand, esta arquitectura ofrece un rendimiento sin sistema operativo óptimo, mientras que admite de forma nativa el aislamiento de inquilinos de varios nodos.  

Plataforma de supercomputación nativa de la nube
Hacia una arquitectura de confianza cero

Hacia una arquitectura de confianza cero

Los sistemas de supercomputación nativos de la nube están diseñados para ofrecer el máximo rendimiento, seguridad y orquestación en un entorno multiinquilino.

La DPU BlueField puede hospedar inquilinos multinodo que no son de confianza, al tiempo que garantiza que los recursos de supercomputación se entreguen limpios a los nuevos inquilinos sin residuos previos. Para ello, la DPU BlueField proporciona una imagen de arranque limpia para un inquilino recién programado, realiza una limpieza completa y vuelve a establecer la confianza, virtualiza el almacenamiento y concede acceso a áreas de almacenamiento aprobadas.

Aceleración del rendimiento de la aplicación

Las plataformas y bibliotecas de comunicación HPC e IA son sensibles a la latencia y al ancho de banda, y desempeñan un papel fundamental en la determinación del rendimiento de las aplicaciones.

Descargar las bibliotecas de la CPU o GPU del host a la DPU Bluefield crea el mayor grado de superposición para la progresión paralela de la comunicación y la computación. También reduce los efectos negativos del jitter del sistema operativo y aumenta drásticamente el rendimiento de la aplicación. Esta es la clave para habilitar la próxima generación de arquitectura de supercomputación. 

Los primeros resultados de la investigación de la Universidad Estatal de Ohio demuestran que los superordenadores nativos en la nube pueden realizar trabajos de HPC 1,3 veces más rápido que los tradicionales.

LA DPU proporciona una aceleración de rendimiento 1,3 veces mayor para P3DFFT

Marcos de comunicación de HPC e IA
El superordenador nativo de la nube de NVIDIA ofrece rendimiento sin sistema operativo

Aislamiento de rendimiento

La plataforma NVIDIA Quantum-2 InfiniBand proporciona una innovadora supervisión proactiva y gestión de la congestión para ofrecer aislamientos de tráfico, casi eliminando el jitter de rendimiento y asegurando el rendimiento predictivo como si la aplicación se estuviera ejecutando en un sistema dedicado.

Plataforma de supercomputación nativa de la nube

NVIDIA Bluefield

La DPU NVIDIA BlueField combina el adaptador de red NVIDIA ConnectX® líder del sector,  una serie de núcleos de ARM con un subsistema PCIe, y motores de aceleración de hardware diseñados específicamente con HPC para proporcionar programabilidad completa de infraestructura de centro de datos en el chip.

InfiniBand

Las redes NVIDIA Quantum InfiniBand aceleran y descargan las transferencias de datos para garantizar que nunca falten recursos informáticos por falta de datos o ancho de banda. La red NVIDIA Quantum InfiniBand se puede particionar entre diferentes usuarios o inquilinos, proporcionando seguridad y garantías de calidad de servicio (QoS).

DOCA

El SDK NVIDIA DOCA permite a los desarrolladores de infraestructura crear rápidamente aplicaciones y servicios de red, almacenamiento, seguridad, administración e IA y HPC, además de la DPU NVIDIA BlueField, aprovechando las API estándar del sector. Con DOCA, los desarrolladores pueden programar la infraestructura de supercomputación del mañana mediante la creación de servicios acelerados por DPU de alto rendimiento, definidos por software y nativos en la nube.

Magnum IO

El kit de desarrollo de software (SDK) NVIDIA MAGNUM IO™ permite a los desarrolladores optimizar la entrada/salida (E/S) en las aplicaciones, reduciendo el tiempo de extremo a extremo de sus flujos de trabajo.

Magnum IO cubre todos los aspectos de la E/S, incluidas las comunicaciones de almacenamiento, redes, multi-GPU y multinodo. También incluye herramientas para perfilar y ajustar aplicaciones y eliminar cuellos de botella de E/S.

Características principales

  • Aislamiento multiinquilino, protección de datos y seguridad
  • Descargas de servicios de infraestructura
  • Motores de hardware dedicados para acelerar las plataformas de comunicaciones
  • Calidad de servicio mejorada (QoS)

Beneficios

  • Ofrece un rendimiento óptimo sin sistema operativo
  • Aumenta la disponibilidad de la CPU, la escalabilidad de las aplicaciones y la eficiencia del sistema
  • Mayor superposición de computación y comunicación
  • Reducción del jitter/ruido del sistema
  • Costes de infraestructura reducidos

Obtenga más información sobre la supercomputación nativa en la nube en el informe técnico.