Cada instância MIG possui um conjunto dedicado de recursos de hardware para computação, memória e cache, oferecendo qualidade de serviço (QoS) garantida e isolamento de falhas para a carga de trabalho. Isso significa que a falha em uma aplicação em execução em uma instância não afeta as aplicações em execução em outras instâncias. E diferentes instâncias podem executar diferentes tipos de cargas de trabalho: desenvolvimento de modelo interativo, treinamento de deep learning, inferência de AI ou aplicações HPC. Como as instâncias são executadas em paralelo, as cargas de trabalho também são executadas em paralelo, mas separadas e isoladas, na mesma GPU A100 física.
A MIG é ideal para cargas de trabalho, como desenvolvimento de modelo de AI e inferência de baixa latência. Essas cargas de trabalho podem aproveitar ao máximo os recursos da A100 e caber na memória alocada de cada instância.