Mehr-Instanzen-GPU (MIG) erweitert die Leistung und den Mehrwert von NVIDIA Rubin, NVIDIA Blackwell und NVIDIA Hopper GPUs. MIG kann den Grafikprozessor in bis zu sieben Instanzen aufteilen, die vollständig isoliert ausgeführt werden und über eigene Speicher-, Cache- und Recheneinheiten mit hoher Bandbreite verfügen. So können Administratoren jeden Workload in jeder Größe mit garantierter Servicequalität (QoS) unterstützen. Die Verfügbarkeit beschleunigter Computing-Ressourcen auf alle Nutzer wird dadurch erweitert.
Ohne MIG konkurrieren verschiedene Aufträge, die auf derselben GPU ausgeführt werden, wie beispielsweise verschiedene KI-Inferenzanforderungen, um die gleichen Ressourcen. Durch eine Aufgabe, die mehr Speicherbandbreite beansprucht, steht für andere Aufgaben weniger zur Verfügung, sodass mehrere Aufgaben ihre Latenzzielwerte verfehlen. Mit MIG werden Aufgaben gleichzeitig in verschiedenen Instanzen, jeweils mit dedizierten Ressourcen für Rechenleistung, Arbeitsspeicher und Speicherbandbreite, ausgeführt. Dies ermöglicht eine vorhersehbare Leistung mit hoher QoS und maximaler GPU-Auslastung.
NVIDIA Blackwell- und Hopper-GPUs unterstützen MIG mit Multi-Tenant- und Multi-User-Konfigurationen in virtualisierten Umgebungen für bis zu sieben GPU-Instanzen, wobei jede Instanz mit Confidential Computing auf Hardware- und Hypervisorebene sicher isoliert ist. Dedizierte Videodecoder für jede MIG-Instanz erlauben intelligente Videoanalysen (IVA) mit hohem Durchsatz auf gemeinsam genutzter Infrastruktur. Mit dem gleichzeitigen MIG-Profiling können Administratoren die korrekt dimensionierte Grafikprozessorbeschleunigung überwachen und Ressourcen für mehrere Benutzer zuweisen.
Im Bereich geringerer Arbeitslasten können Forscher anstelle der Anmietung einer vollständigen Cloud-Instanz MIG einsetzen, um einen Teil einer GPU sicher zu isolieren und gleichzeitig sicherzustellen, dass die Daten im Ruhezustand, während der Übertragung und der Verwendung geschützt sind. Dadurch wird die Flexibilität für Cloud-Service-Anbieter erhöht, kleinere Kundenpotenziale zu bedienen und preiswerter zu sein.
MIG ermöglicht eine feinabgestimmte GPU-Bereitstellung durch IT- und DevOps-Teams. Jede MIG-Instanz verhält sich gegenüber Anwendungen wie ein eigenständiger Grafikprozessor, sodass es nicht zu Änderungen an der CUDA®-Plattform kommt. MIG kann in allen wichtigen Computing-Umgebungen in Unternehmen eingesetzt werden.
| NVIDIA Blackwell Ultra GPU* | NVIDIA Blackwell GPU* | |||
|---|---|---|---|---|
| NVIDIA GB300 NVL72 | NVIDIA HGX B300 | NVIDIA GB200 NVL72 | NVIDIA HGX B200 | |
| KI-Sicherheit | Ja | Ja | Ja | Ja |
| Instanztypen | 7x 34 GB 4x 69 GB 2x 139 GB 1x 279 GB |
7x 32 GB 4x 67 GB 2x 135 GB 1x 270 GB |
7x 23 GB 4x 46 GB 2x 93 GB 1x 186 GB |
7x 21 GB 4x 45 GB 2x 90 GB 1x 180 GB |
| GPU-Profiling und -Überwachung | Gleichzeitig bei allen Instanzen | Gleichzeitig bei allen Instanzen | Gleichzeitig bei allen Instanzen | Gleichzeitig bei allen Instanzen |
| Sichere Mandanten | 7 x | 7 x | 7 x | 7 x |
| Mediendecoder | Eigene NVJPEG- und NVDEC-Technik pro Instanz | Eigene NVJPEG- und NVDEC-Technik pro Instanz | Eigene NVJPEG- und NVDEC-Technik pro Instanz | Eigene NVJPEG- und NVDEC-Technik pro Instanz |
Vorläufige Spezifikationen. Alle Werte sind bis zu den angegebenen Grenzen gültig und können sich ändern.
* Die angegebenen Größen entsprechen den GPU-Spezifikationen für jedes System. Weitere Informationen sind der technischen Dokumentation zu entnehmen.
Weitere Informationen zu MIG.