Ogni istanza MIG dispone di un set dedicato di risorse hardware per il calcolo, la memoria e la cache, che fornisce qualità del servizio (QoS) efficace e isolamento degli errori per il carico di lavoro. Ciò significa che un errore in un'applicazione in esecuzione su un'istanza non influisce sulle applicazioni in esecuzione su altre istanze. Inoltre, istanze diverse possono eseguire diversi tipi di carichi di lavoro: sviluppo di modelli interattivi, training su deep learning, inferenza con IA o applicazioni HPC. Poiché le istanze vengono eseguite in parallelo, anche i carichi di lavoro procedono in parallelo, ma separati e protetti, sulla stessa GPU A100 fisica.
MIG è ideale per carichi di lavoro come lo sviluppo di modelli IA e l'inferenza a bassa latenza. Questi carichi di lavoro possono sfruttare appieno le funzionalità di A100 e rientrare nella memoria allocata di ogni istanza.