Mehr-Instanzen-GPU von NVIDIA

Sieben unabhängige Instanzen in einem einzelnen Grafikprozessor.

Mehr-Instanzen-GPU (MIG) erweitert die Leistung und den Mehrwert von NVIDIA Rubin, NVIDIA Blackwell und NVIDIA Hopper GPUs. MIG kann den Grafikprozessor in bis zu sieben Instanzen aufteilen, die vollständig isoliert ausgeführt werden und über eigene Speicher-, Cache- und Recheneinheiten mit hoher Bandbreite verfügen. So können Administratoren jeden Workload in jeder Größe mit garantierter Servicequalität (QoS) unterstützen. Die Verfügbarkeit beschleunigter Computing-Ressourcen auf alle Nutzer wird dadurch erweitert.

Vorteile
NVIDIA Blackwell und Hopper
Workloads
Technische Daten

Vorteile
NVIDIA Blackwell und Hopper
Workloads
Technische Daten

Vorteile Übersicht

Grafikprozessorzugriff erweitern

Mit MIG lassen sich bis zu 7-mal mehr GPU-Ressourcen auf einem einzelnen Grafikprozessor nutzen. MIG bietet Forschern und Entwicklern mehr Ressourcen und Flexibilität als je zuvor.

GPU-Auslastung optimieren

MIG bietet die Flexibilität, zwischen vielen verschiedenen Instanzgrößen auszuwählen, wodurch für jeden Workload ein Grafikprozessor der richtigen Größe bereitgestellt werden kann, um die Auslastung zu optimieren und die Rentabilität des Rechenzentrums zu erhöhen.

Workloads gleichzeitig ausführen

MIG ermöglicht die gleichzeitige Ausführung von Inferenz-, Trainings- und HPC-Workloads (High-Performance-Computing) auf einem einzelnen Grafikprozessor mit deterministischer Latenz und deterministischem Durchsatz. Im Gegensatz zum Time-Slicing läuft jeder Workload parallel und bietet eine höhere Leistung.

Funktionsweise der Technologie

Ohne MIG konkurrieren verschiedene Aufträge, die auf derselben GPU ausgeführt werden, wie beispielsweise verschiedene KI-Inferenzanforderungen, um die gleichen Ressourcen. Durch eine Aufgabe, die mehr Speicherbandbreite beansprucht, steht für andere Aufgaben weniger zur Verfügung, sodass mehrere Aufgaben ihre Latenzzielwerte verfehlen. Mit MIG werden Aufgaben gleichzeitig in verschiedenen Instanzen, jeweils mit dedizierten Ressourcen für Rechenleistung, Arbeitsspeicher und Speicherbandbreite, ausgeführt. Dies ermöglicht eine vorhersehbare Leistung mit hoher QoS und maximaler GPU-Auslastung.

Bereitstellung und Konfiguration von Instanzen nach Bedarf

Eine GPU kann in unterschiedlich große MIG-Instanzen aufgeteilt werden. Auf NVIDIA GB200 könnte ein Administrator beispielsweise zwei Instanzen mit jeweils 93 GB Speicher, vier Instanzen mit jeweils 46 GB oder sieben Instanzen mit jeweils 23 GB einrichten.

MIG-Instanzen können auch dynamisch neu konfiguriert werden, sodass Administratoren die GPU-Ressourcen an wechselnde Nutzer- und Geschäftsanforderungen anpassen können. Sieben MIG-Instanzen können z. B. tagsüber zur Inferenz mit geringem Durchsatz verwendet werden und für das Deep-Learning-Training in der Nacht zu einer großen MIG-Instanz umkonfiguriert werden.

Sichere parallele Ausführung von Workloads

Mit einem dedizierten Satz von Hardwareressourcen für Rechenleistung, Speicher und Cache bietet jede MIG-Instanz garantierte QoS- und Fehlerisolierung. Das bedeutet, dass sich ein Fehler in einer Anwendung, die auf einer Instanz ausgeführt wird, nicht auf Anwendungen auf anderen Instanzen auswirkt.

Unterschiedliche Instanzen können auch verschiedene Arten von Workloads ausführen: interaktive Modellentwicklung, Deep-Learning-Training, KI-Inferenz oder HPC-Anwendungen. Da die Instanzen parallel ausgeführt werden, laufen die Workloads ebenfalls parallel – jedoch getrennt und isoliert – auf demselben physischen Grafikprozessor.

MIG in NVIDIA Blackwell und Hopper-GPUs

NVIDIA Blackwell- und Hopper-GPUs unterstützen MIG mit Multi-Tenant- und Multi-User-Konfigurationen in virtualisierten Umgebungen für bis zu sieben GPU-Instanzen, wobei jede Instanz mit Confidential Computing auf Hardware- und Hypervisorebene sicher isoliert ist. Dedizierte Videodecoder für jede MIG-Instanz erlauben intelligente Videoanalysen (IVA) mit hohem Durchsatz auf gemeinsam genutzter Infrastruktur. Mit dem gleichzeitigen MIG-Profiling können Administratoren die korrekt dimensionierte Grafikprozessorbeschleunigung überwachen und Ressourcen für mehrere Benutzer zuweisen.

Im Bereich geringerer Arbeitslasten können Forscher anstelle der Anmietung einer vollständigen Cloud-Instanz MIG einsetzen, um einen Teil einer GPU sicher zu isolieren und gleichzeitig sicherzustellen, dass die Daten im Ruhezustand, während der Übertragung und der Verwendung geschützt sind. Dadurch wird die Flexibilität für Cloud-Service-Anbieter erhöht, kleinere Kundenpotenziale zu bedienen und preiswerter zu sein.

MIG in Aktion

Mehrere Workloads auf einer einzigen A100 GPU ausführen

Bei dieser Demo laufen KI- und High-Performance-Computing-Workloads (HPC) gleichzeitig auf der selben A100-GPU.

Video ansehen

Leistung und Auslastung durch Mehr-Instanzen-GPU verbessern

Diese Demo zeigt die Inferenzleistung einer einzelnen MIG-Instanz und skaliert anschließend linear über die gesamte A100.

Video ansehen

Speziell für IT und DevOps entwickelt

MIG ermöglicht eine feinabgestimmte GPU-Bereitstellung durch IT- und DevOps-Teams. Jede MIG-Instanz verhält sich gegenüber Anwendungen wie ein eigenständiger Grafikprozessor, sodass es nicht zu Änderungen an der CUDA®-Plattform kommt. MIG kann in allen wichtigen Computing-Umgebungen in Unternehmen eingesetzt werden.

Vom Rechenzentrum bis in die Peripherie einsetzbar

Verwenden Sie MIG vor Ort, in der Cloud und in der Peripherie.

Mehr erfahren

Nutzen Sie Container

Führen Sie containerisierte Anwendungen in MIG-Instanzen aus.

Mehr erfahren

Kubernetes-Unterstützung

Planen Sie Kubernetes-Pods in MIG-Instanzen.

Mehr erfahren

Virtuelle Anwendungen

Führen Sie Anwendungen in MIG-Instanzen auf virtuellen Maschinen aus.

Mehr erfahren

MIG-Spezifikationen

	NVIDIA Blackwell Ultra GPU*		NVIDIA Blackwell GPU*
	NVIDIA GB300 NVL72	NVIDIA HGX B300	NVIDIA GB200 NVL72	NVIDIA HGX B200
KI-Sicherheit	Ja	Ja	Ja	Ja
Instanztypen	7x 34 GB 4x 69 GB 2x 139 GB 1x 279 GB	7x 32 GB 4x 67 GB 2x 135 GB 1x 270 GB	7x 23 GB 4x 46 GB 2x 93 GB 1x 186 GB	7x 21 GB 4x 45 GB 2x 90 GB 1x 180 GB
GPU-Profiling und -Überwachung	Gleichzeitig bei allen Instanzen	Gleichzeitig bei allen Instanzen	Gleichzeitig bei allen Instanzen	Gleichzeitig bei allen Instanzen
Sichere Mandanten	7 x	7 x	7 x	7 x
Mediendecoder	Eigene NVJPEG- und NVDEC-Technik pro Instanz	Eigene NVJPEG- und NVDEC-Technik pro Instanz	Eigene NVJPEG- und NVDEC-Technik pro Instanz	Eigene NVJPEG- und NVDEC-Technik pro Instanz

Vorläufige Spezifikationen. Alle Werte sind bis zu den angegebenen Grenzen gültig und können sich ändern.
* Die angegebenen Größen entsprechen den GPU-Spezifikationen für jedes System. Weitere Informationen sind der technischen Dokumentation zu entnehmen.

Weitere Informationen zu MIG.

Mehr erfahren