La GPU de instancias múltiples (MIG) expande el desempeño y el valor de las GPU NVIDIA Rubin, NVIDIA Blackwell y NVIDIA Hopper. MIG puede particionar la GPU en hasta siete instancias, cada una completamente aislada con su propia memoria de alto ancho de banda, caché y núcleos de computación. Esto brinda a los administradores la capacidad de admitir cada carga de trabajo, desde la más pequeña hasta la más grande, con calidad de servicio (QoS) garantizada, y extender el alcance de los recursos de computación acelerada a cada usuario.
Sin MIG, diferentes trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un mayor ancho de banda de memoria deja sin ayuda a otros, lo que hace que varios trabajos no cumplan con sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para la computación, la memoria y el ancho de banda de memoria, lo que da como resultado un rendimiento predecible con QoS y la máxima utilización de la GPU.
Las GPU NVIDIA Blackwell y Hopper admiten MIG con configuraciones multitenant y multiusuario en entornos virtualizados en hasta siete instancias de GPU, lo que aísla de forma segura cada instancia con computación confidencial a nivel de hardware e hipervisor. Los decodificadores de video dedicados para cada instancia de MIG ofrecen un análisis inteligente de videos (IVA) seguro y con una tasa de transferencia alta en la infraestructura compartida. Con la creación de perfiles de MIG simultánea, los administradores pueden monitorear la aceleración por GPU del tamaño adecuado y asignar recursos para múltiples usuarios.
Los investigadores con cargas de trabajo más pequeñas pueden usar MIG para aislar una porción de una GPU de forma segura, en lugar de alquilar una instancia completa en la nube, a la vez que tienen la garantía de que sus datos están seguros en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios de cloud coticen y aborden oportunidades de clientes más pequeñas.
MIG permite un aprovisionamiento de GPU preciso por parte de los equipos de TI y DevOps. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay cambios en la plataforma CUDA. MIG se puede usar en todos los principales entornos de computación empresarial.
| GPU NVIDIA Blackwell Ultra* | GPU NVIDIA Blackwell* | |||
|---|---|---|---|---|
| NVIDIA GB300 NVL72 | NVIDIA HGX B300 | NVIDIA GB200 NVL72 | NVIDIA HGX B200 | |
| Seguridad de IA | Sí | Sí | Sí | Sí |
| Tipos de Instancias | 7 de 34 GB 4 de 69 GB 2 de 139 GB 1 de 279 GB |
7 de 32 GB 4 de 67 GB 2 de 135 GB 1 de 270 GB |
7 de 23 GB 4 de 46 GB 2 de 93 GB 1 de 186 GB |
7 de 21 GB 4 de 45 GB 2 de 90 GB 1 de 180 GB |
| Generación de Perfiles y Monitoreo de GPU | Al mismo tiempo en todas las instancias | Al mismo tiempo en todas las instancias | Al mismo tiempo en todas las instancias | Al mismo tiempo en todas las instancias |
| Usuarios Seguros | 7 | 7 | 7 | 7 |
| Decodificadores de Medios | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia |
Especificaciones preliminares. Todos los valores son máximos y pueden estar sujetos a cambios.
* Los tamaños que se muestran son según las especificaciones de GPU para cada sistema. Para obtener más información, consulte la documentación técnica.
Más Información Sobre MIG.