Cada instancia de MIG tiene un conjunto dedicado de recursos de hardware para computación, memoria y caché, que ofrece calidad de servicio garantizada (QoS) y aislamiento de fallas para la carga de trabajo. Eso significa que la falla en una aplicación que se ejecuta en una instancia no afecta las aplicaciones que se ejecutan en otras instancias. Y diferentes instancias pueden ejecutar diferentes tipos de cargas de trabajo: desarrollo de modelos interactivos, capacitación de deep learning, inferencia de IA o aplicaciones HPC. Dado que las instancias se ejecutan en paralelo, las cargas de trabajo también se ejecutan en paralelo, pero separadas y aisladas, en la misma GPU física A100.
MIG es ideal para cargas de trabajo como el desarrollo de modelos de IA y la inferencia de baja latencia. Estas cargas de trabajo pueden aprovechar al máximo las características de A100 y encajar en la memoria asignada de cada instancia.