La GPU Multi-Instance (MIG) espande le prestazioni e il valore delle GPU NVIDIA Rubin, NVIDIA Blackwell e NVIDIA Hopper. La tecnologia MIG è in grado di partizionare la GPU in un numero massimo di sette istanze, ciascuna completamente isolata con la memoria a banda elevata, cache e core di elaborazione distinti. Gli amministratori possono ora supportare qualsiasi carico di lavoro, dal più piccolo al più grande, qualità del servizio (QoS) garantita per ogni processo estendendo la portata delle risorse di elaborazione accelerate a tutti gli utenti.
Senza MIG, l'esecuzione di più processi sulla stessa GPU, come diverse richieste di inferenza IA, competono per l'uso delle stesse risorse. Un processo che consuma molta banda di memoria lascia carenza di banda per gli altri, determinando problemi di latenza per diversi processi. Con MIG, i processi vengono eseguiti simultaneamente su diverse istanza, ognuna con risorse dedicate per elaborazione, memoria e banda, generando prestazioni prevedibili con QoS e utilizzo massimo della GPU.
Le GPU NVIDIA Blackwell e Hopper supportano la MIG con configurazioni multi-tenant e multi-utente in ambienti virtualizzati su un massimo di sette istanze GPU, isolando in modo sicuro ogni istanza con il confidential computing a livello di hardware e hypervisor. I decoder video dedicati per ogni istanza MIG offrono analisi video intelligenti sicure e ad alta produttività (IVA) su infrastruttura condivisa. Con la profilazione MIG simultanea di Hopper, gli amministratori possono monitorare che l'accelerazione con GPU sia correttamente dimensionata e allocare le risorse a più utenti.
Per i ricercatori con carichi di lavoro più piccoli, invece di noleggiare un'istanza cloud completa, è possibile utilizzare MIG per isolare in modo sicuro una parte della GPU, garantendo al contempo che i dati siano al sicuro a riposo, in transito e in uso. Questa maggiore flessibilità permette ai fornitori di servizi cloud di stabilire i prezzi e gestire le opportunità per i clienti più piccoli.
MIG consente il provisioning granulare della GPU ai team IT e DevOps. Ogni istanza MIG si comporta come una GPU standalone per le applicazioni, quindi non c'è alcuna modifica alla piattaforma CUDA®. MIG può essere utilizzata in tutti i principali ambienti di calcolo aziendali.
| GPU NVIDIA Blackwell Ultra* | GPU NVIDIA Blackwell* | |||
|---|---|---|---|---|
| NVIDIA GB300 NVL72 | NVIDIA HGX B300 | NVIDIA GB200 NVL72 | NVIDIA HGX B200 | |
| Sicurezza IA | Sì | Sì | Sì | Sì |
| Tipi di istanze | 7 x 34GB 4 x 69GB 2 x 139GB 1 x 279GB |
7 x 32GB 4 x 67GB 2 x 135GB 1 x 270GB |
7 x 23GB 4 x 46GB 2 x 93GB 1 x 186GB |
7 x 21 GB 4 x 45 GB 2 x 90 GB 1 x 180 GB |
| Profilazione e monitoraggio delle GPU | Simultanei su tutte le istanze | Simultanei su tutte le istanze | Simultanei su tutte le istanze | Simultanei su tutte le istanze |
| Tenant sicuri | 7x | 7x | 7x | 7x |
| Decoder multimediali | NVJPEG dedicato e NVDEC per istanza | NVJPEG dedicato e NVDEC per istanza | NVJPEG dedicato e NVDEC per istanza | NVJPEG dedicato e NVDEC per istanza |
Specifiche preliminari. Tutti i valori sono indicativi e possono essere soggetti a modifiche.
* Le dimensioni mostrate sono per le specifiche della GPU per ogni sistema. Per ulteriori informazioni, consulta la documentazione tecnica.
Scopri di più su MIG.