GPU de instancias múltiples de NVIDIA

Siete instancias independientes en una sola GPU.

La GPU de instancias múltiples (MIG) expande el desempeño y el valor de las GPU NVIDIA Rubin, NVIDIA Blackwell y NVIDIA Hopper. MIG puede particionar la GPU en hasta siete instancias, cada una completamente aislada con su propia memoria de alto ancho de banda, caché y núcleos de computación. Esto brinda a los administradores la capacidad de admitir cada carga de trabajo, desde la más pequeña hasta la más grande, con calidad de servicio (QoS) garantizada, y extender el alcance de los recursos de computación acelerada a cada usuario.

Resumen de los Beneficios

Expande el Acceso a la GPU

Con MIG, puedes lograr hasta 7 veces más recursos de GPU en una sola GPU. MIG les brinda a los investigadores y desarrolladores más recursos y flexibilidad que nunca antes.

Optimiza la Utilización de la GPU

MIG proporciona la flexibilidad para elegir muchos tamaños de instancias diferentes, lo que permite el aprovisionamiento de la instancia de GPU del tamaño adecuado para cada carga de trabajo. Esto optimiza la utilización y maximiza la inversión en el data center.

Ejecuta Cargas de Trabajo Simultáneas

MIG permite que las cargas de trabajo de inferencia, entrenamiento y computación de alto rendimiento (HPC) se ejecuten al mismo tiempo en una sola GPU con una tasa de transferencia y una latencia deterministas. A diferencia de la división en porciones por tiempo, cada carga de trabajo se ejecuta en paralelo, lo que ofrece un mayor desempeño.

Cómo Funciona la Tecnología

Sin MIG, diferentes trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un mayor ancho de banda de memoria deja sin ayuda a otros, lo que hace que varios trabajos no cumplan con sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para la computación, la memoria y el ancho de banda de memoria, lo que da como resultado un rendimiento predecible con QoS y la máxima utilización de la GPU.

Aprovisiona y Configura Instancias Según Sea Necesario

Una GPU se puede dividir en instancias de MIG de diferentes tamaños. Por ejemplo, en NVIDIA GB200, un administrador podría crear dos instancias con 93 GB de memoria cada una, cuatro instancias con 46 GB cada una o siete instancias con 23 GB cada una.

Las instancias de MIG también se pueden reconfigurar dinámicamente, lo que les permite a los administradores cambiar los recursos de GPU en respuesta a las cambiantes demandas comerciales y de los usuarios. Por ejemplo, siete instancias de MIG se pueden usar durante el día para la inferencia de bajo rendimiento y reconfigurarse en una instancia de MIG grande por la noche para el entrenamiento de deep learning.

Ejecuta Cargas de Trabajo en Paralelo y de Forma Segura

Con un conjunto dedicado de recursos de hardware para la computación, la memoria y la memoria caché, cada instancia de MIG ofrece QoS garantizado y aislamiento de errores. Eso significa que una falla en una aplicación que se ejecuta en una instancia no afecta las aplicaciones que se ejecutan en otras instancias.

También significa que las diferentes instancias pueden ejecutar diferentes tipos de cargas de trabajo: desarrollo de modelos interactivos, entrenamiento de aprendizaje profundo, inferencia de IA o aplicaciones de HPC. Dado que las instancias se ejecutan en paralelo, las cargas de trabajo también se ejecutan en paralelo (pero separadas y aisladas) en la misma GPU física.

MIG en las GPU NVIDIA Blackwell y Hopper

Las GPU NVIDIA Blackwell y Hopper admiten MIG con configuraciones multitenant y multiusuario en entornos virtualizados en hasta siete instancias de GPU, lo que aísla de forma segura cada instancia con computación confidencial a nivel de hardware e hipervisor. Los decodificadores de video dedicados para cada instancia de MIG ofrecen un análisis inteligente de videos (IVA) seguro y con una tasa de transferencia alta en la infraestructura compartida. Con la creación de perfiles de MIG simultánea, los administradores pueden monitorear la aceleración por GPU del tamaño adecuado y asignar recursos para múltiples usuarios. 

Los investigadores con cargas de trabajo más pequeñas pueden usar MIG para aislar una porción de una GPU de forma segura, en lugar de alquilar una instancia completa en la nube, a la vez que tienen la garantía de que sus datos están seguros en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios de cloud coticen y aborden oportunidades de clientes más pequeñas.

Ver MIG en Acción

Ejecuta Varias Cargas de Trabajo en una sola GPU A100

Esta demostración ejecuta cargas de trabajo de IA y de computación de alto rendimiento (HPC) de forma simultánea en la misma GPU A100.

Aumento del rendimiento y la utilización con las múltiples instancias de GPU

Esta demostración muestra el rendimiento de la inferencia en una sola porción de MIG y, luego, se escala linealmente en toda la A100.

Diseñado para TI y DevOps

MIG permite un aprovisionamiento de GPU preciso por parte de los equipos de TI y DevOps. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay cambios en la plataforma CUDA. MIG se puede usar en todos los principales entornos de computación empresarial.

Se Implementa desde el Data Center hasta el Edge

Use MIG en las instalaciones, en la nube y en el edge.  

Aprovecha los Contenedores

Ejecute aplicaciones en contenedores en instancias de MIG.

Compatible con Kubernetes

Programe pods de Kubernetes en instancias de MIG.

Virtualiza Aplicaciones

Ejecute aplicaciones en instancias de MIG dentro de una máquina virtual.

Especificaciones de MIG

  GPU NVIDIA Blackwell Ultra* GPU NVIDIA Blackwell*
  NVIDIA GB300 NVL72 NVIDIA HGX B300 NVIDIA GB200 NVL72 NVIDIA HGX B200
Seguridad de IA
Tipos de Instancias 7 de 34 GB
4 de 69 GB
2 de 139 GB
1 de 279 GB
7 de 32 GB
4 de 67 GB
2 de 135 GB
1 de 270 GB
7 de 23 GB
4 de 46 GB
2 de 93 GB
1 de 186 GB
7 de 21 GB
4 de 45 GB
2 de 90 GB
1 de 180 GB
Generación de Perfiles y Monitoreo de GPU Al mismo tiempo en todas las instancias Al mismo tiempo en todas las instancias Al mismo tiempo en todas las instancias Al mismo tiempo en todas las instancias
Usuarios Seguros 7 7 7 7
Decodificadores de Medios NVJPEG y NVDEC dedicados por instancia NVJPEG y NVDEC dedicados por instancia NVJPEG y NVDEC dedicados por instancia NVJPEG y NVDEC dedicados por instancia

Especificaciones preliminares. Todos los valores son máximos y pueden estar sujetos a cambios.
* Los tamaños que se muestran son según las especificaciones de GPU para cada sistema. Para obtener más información, consulte la documentación técnica.

Más Información Sobre MIG.