Com um conjunto dedicado de recursos de hardware para computação, memória e cache, cada instância da MIG oferece garantia de qualidade de serviço (QoS) e de isolamento de falhas. Ou seja, se houver falha em uma aplicação executada em uma instância, as aplicações em execução em outras instâncias não serão afetadas.
Isso também significa que diferentes instâncias podem executar cargas de trabalho variadas: desenvolvimento de modelo interativo, treinamento de deep learning, inferência de AI ou aplicações de HPC. Como as instâncias são executadas em paralelo, as cargas de trabalho também são, porém separadas e isoladas, na mesma GPU física.