Technologie de GPU multi-instances NVIDIA

Sept instances indépendantes sur un seul processeur graphique.

La technologie de GPU multi-instances (MIG) de NVIDIA améliore le niveau de performance et de rendement des processeurs graphiques reposant sur les architectures NVIDIA Rubin, NVIDIA Blackwell et NVIDIA Hopper. MIG permet de partitionner le processeur graphique en sept instances distinctes, chacune étant entièrement isolée avec sa propre mémoire à bande passante élevée, son cache spécial et des cœurs de calcul dédiés. Les administrateurs peuvent ainsi assurer le traitement d'une grande variété de charges de travail, peu importe leur taille, avec une qualité de service (QdS) garantie et l’extension de l’accès aux ressources de calcul accéléré pour tous les utilisateurs.

Avantages
NVIDIA Blackwell et Hopper
Charges de travail
Spécifications

Avantages
NVIDIA Blackwell et Hopper
Charges de travail
Spécifications

Présentation des avantages

Étendez l’accès aux ressources GPU

MIG vous permet de mettre en œuvre jusqu’à 7 fois plus de ressources GPU sur un seul processeur graphique. Les chercheurs et les développeurs ont ainsi accès à davantage de ressources et bénéficient d’une polyvalence encore plus élevée qu’auparavant.

Optimisez l’utilisation des ressources GPU

MIG offre la polyvalence de pouvoir choisir de nombreuses tailles d’instance différentes, vous permettant ainsi d’allouer une instance de processeur graphique de taille adaptée pour chaque charge de travail et d’optimiser l’utilisation et la rentabilité du Data Center.

Exécutez des charges de travail en simultané

MIG permet de programmer l’exécution simultanée des charges de travail d’inférence, d’entraînement ou de calcul haute performance (HPC) sur un seul processeur graphique avec une latence et un rendement déterministes. Contrairement au découpage temporel, chaque charge de travail est exécutée en parallèle et délivre des performances élevées.

Fonctionnement de la technologie

Sans MIG, différentes tâches exécutées sur le même processeur graphique (telles que le traitement de différentes demandes d’inférence pour l’IA) doivent se partager des ressources communes. Une tâche qui mobilise une importante bande passante impacte par conséquent les tâches annexes, ce qui les rend susceptibles de manquer leurs objectifs de latence. Avec MIG, les tâches sont exécutées en simultané sur différentes instances, chacune disposant de ressources dédiées pour le calcul, la mémoire et la bande passante, ce qui permet d’obtenir des performances prévisibles pour la qualité de service et une utilisation maximale des ressources GPU.

Allouez et configurez des instances selon vos besoins

Vous pouvez partitionner un processeur graphique en plusieurs instances MIG de tailles différentes. Par exemple, sur un système NVIDIA GB200, un administrateur peut créer deux instances avec 93 Go de mémoire chacune, quatre instances avec 46 Go chacune ou sept instances avec 23 Go chacune.

Les instances MIG peuvent être reconfigurées de manière dynamique, ce qui permet aux administrateurs de modifier l’allocation des ressources GPU selon les besoins évolutifs des utilisateurs et de l’entreprise. Il est ainsi possible d’utiliser sept instances MIG pendant la journée pour des tâches d’inférence à faible rendement, puis de les reconfigurer en une seule instance MIG durant la nuit pour exécuter des tâches d’entraînement basées sur le Deep Learning.

Exécutez vos charges de travail en parallèle et en toute sécurité

Avec un ensemble dédié de ressources matérielles pour le calcul, la mémoire et le cache, chaque instance MIG offre une qualité de service garantie et une fonction d'isolation des pannes. Cela signifie que tout échec sur une application qui est en cours d’exécution sur une instance donnée n’impactera pas les applications qui sont exécutées sur d’autres instances.

Cela signifie également que différentes instances peuvent traiter différents types de charge de travail : développement interactif de modèles, entraînement basé sur le Deep Learning, inférences d’IA ou applications HPC. Étant donné que les instances sont exécutées en parallèle, les charges de travail s’exécutent elles aussi en parallèle, mais de manière séparée et isolée sur un même processeur graphique physique.

MIG avec les GPU NVIDIA Blackwell et Hopper

Les GPU à architecture Blackwell et Hopper de NVIDIA prennent en charge des configurations mutualisées et multi-utilisateurs dans un environnement virtualisé pouvant accueillir jusqu’à sept instances de GPU, chacune d’entre elles étant isolée en toute sécurité avec des capacités de calcul confidentiel au niveau du matériel et de l’hyperviseur. Les décodeurs vidéo dédiés de chaque instance MIG facilitent la mise en œuvre d’une analyse vidéo intelligente (IVA) sécurisée et performante sur une infrastructure partagée. Grâce au profilage MIG simultané, les administrateurs peuvent activer une accélération GPU parfaitement calibrée pour chaque tâche et optimiser l’allocation des ressources pour tous les utilisateurs.

Plutôt que de louer une instance Cloud dédiée, les chercheurs qui doivent traiter de petites charges de travail peuvent choisir d’utiliser la technologie MIG pour isoler en toute sécurité une partie d’un GPU tout en ayant la certitude que leurs données seront parfaitement sécurisées, que ce soit au repos, en transit ou pendant leur utilisation. Les fournisseurs de services Cloud peuvent ainsi bénéficier d’une polyvalence accrue pour satisfaire aux exigences de prix et de capacité de tous leurs clients.

Découvrez MIG en action

Exécution de plusieurs charges de travail sur un seul processeur graphique A100

Cette démo présente l’exécution simultanée de charges de travail d’IA et de calcul haute performance (HPC) sur le même processeur graphique A100.

Regarder la vidéo

Optimisation des performances et de l’utilisation avec le GPU multi-instances

Cette démo présente les performances d’inférence sur une seule instance MIG, puis l’évolution linéaire des performances sur l’intégralité du processeur graphique A100.

Regarder la vidéo

Conçu pour les équipes informatiques et DevOps

MIG permet aux équipes informatiques et DevOps d’effectuer une allocation sur mesure des instances du processeur graphique. Chaque instance MIG agit comme un processeur graphique autonome pour les applications. C’est pourquoi aucun changement n’est requis sur la plateforme CUDA®. MIG peut être utilisé sur les principaux environnements de calcul d'entreprise.

Déployez vos projets du Data Center jusqu’à l’Edge

Utilisez MIG sur site, dans le Cloud ou à l’Edge.

Exploitez les conteneurs

Exécutez des applications conteneurisées sur les instances MIG.

Profitez de Kubernetes

Programmez des groupes Kubernetes sur les instances MIG.

Virtualisez vos applications

Exécutez vos applications sur les instances MIG au sein d’une machine virtuelle.

Spécifications de MIG

	GPU NVIDIA Blackwell Ultra*		GPU NVIDIA Blackwell*
	NVIDIA GB300 NVL72	NVIDIA HGX B300	NVIDIA GB200 NVL72	NVIDIA HGX B200
Sécurité basée sur l’IA	Oui	Oui	Oui	Oui
Types d’instance	7x 34 Go 4x 69 Go 2x 139 Go 1x 279 Go	7x 32 Go 4x 67 Go 2x 135 Go 1x 270 Go	7x 23 Go 4x 46 Go 2x 93 Go 1x 186 Go	7x 21 Go 4x 45 Go 2x 90 Go 1x 180 Go
Profilage et surveillance de GPU	Simultanément sur toutes les instances	Simultanément sur toutes les instances	Simultanément sur toutes les instances	Simultanément sur toutes les instances
Clients sécurisés	7x	7x	7x	7x
Décodeurs multimédia	NVJPEG et NVDEC dédiés par instance	NVJPEG et NVDEC dédiés par instance	NVJPEG et NVDEC dédiés par instance	NVJPEG et NVDEC dédiés par instance

Spécifications préliminaires. Toutes les valeurs fournies sont maximales et sont susceptibles d'être modifiées.
* Les tailles indiquées sont conformes aux spécifications GPU pour chaque système. Pour plus d'informations, veuillez vous reporter à notre documentation technique.

Obtenez plus d'infos sur MIG.