GPU multi-instances de NVIDIA

Sept instances indépendantes sur un seul processeur graphique.

La technologie de GPU multi-instances (MIG) de NVIDIA améliore le niveau de performance et de rendement des processeurs graphiques reposant sur les architectures NVIDIA Blackwell et NVIDIA Hopper™. MIG permet de partitionner le processeur graphique en sept instances distinctes, chacune étant entièrement isolée avec sa propre mémoire à bande passante élevée, son cache spécial et des cœurs de calcul dédiés. Les administrateurs peuvent ainsi assurer le traitement d'une grande variété de charges de travail, peu importe leur taille, avec une qualité de service (QdS) garantie et l’extension de l’accès aux ressources de calcul accéléré pour tous les utilisateurs.

Avantages
Blackwell
Découvrir MIG
Charges de travail
Spécifications

Avantages
Blackwell
Découvrir MIG
Charges de travail
Spécifications

Benefits Overview

Étendez l’accès aux ressources GPU

MIG vous permet de mettre en œuvre jusqu’à 7 fois plus de ressources GPU sur un seul processeur graphique. Les chercheurs et les développeurs ont ainsi accès à davantage de ressources et bénéficient d’une polyvalence encore plus élevée qu’auparavant.

Optimisez l’utilisation des ressources GPU

MIG offre la polyvalence de pouvoir choisir de nombreuses tailles d’instance différentes, vous permettant ainsi d’allouer une instance de processeur graphique de taille adaptée pour chaque charge de travail et d’optimiser l’utilisation et la rentabilité du Data Center.

Exécutez des charges de travail en simultané

MIG permet de programmer l’exécution simultanée des procédures d’inférence, d’entraînement ou de calcul haute performance (HPC) sur un seul processeur graphique avec une latence et un rendement déterministes. Contrairement au découpage temporel, chaque charge de travail est exécutée en parallèle et délivre des performances élevées.

Fonctionnement de la technologie

Sans MIG, différentes tâches exécutées sur le même processeur graphique (telles que le traitement de différentes demandes d’inférence pour l’IA) doivent se partager des ressources communes. Une tâche qui mobilise une importante bande passante impacte par conséquent les tâches annexes, ce qui les rend susceptibles de manquer leurs objectifs de latence. Avec MIG, les tâches sont exécutées en simultané sur différentes instances, chacune disposant de ressources dédiées pour le calcul, la mémoire et la bande passante, ce qui permet d’obtenir des performances prévisibles pour la qualité de service et une utilisation maximale des ressources GPU.

Allouez et configurez des instances selon vos besoins

Vous pouvez partitionner un processeur graphique en plusieurs instances MIG de tailles différentes. Par exemple, sur un processeur graphique NVIDIA H100, un administrateur peut créer deux instances avec 40 gigaoctets (Go) de mémoire chacune, quatre instances de 20 Go chacune ou sept instances de 10 Go chacune, voire envisager de procéder à une allocation personnalisée.

Les instances MIG peuvent être reconfigurées de manière dynamique, ce qui permet aux administrateurs de modifier l’allocation des ressources GPU selon les besoins évolutifs des utilisateurs et de l’entreprise. Il est ainsi possible d’utiliser sept instances MIG pendant la journée pour des tâches d’inférence à faible rendement, puis de les reconfigurer en une seule instance MIG durant la nuit pour exécuter des tâches d’entraînement basées sur le Deep Learning.

Exécutez vos charges de travail en parallèle et en toute sécurité

Avec un ensemble dédié de ressources matérielles pour le calcul, la mémoire et le cache, chaque instance MIG offre une qualité de service garantie et une fonction de localisation des incidents. Cela signifie que tout échec sur une application qui est en cours d’exécution sur une instance donnée n’impactera pas les applications qui sont exécutées sur d’autres instances.

Cela signifie également que différentes instances peuvent traiter différents types de charge de travail : développement interactif de modèles, entraînement basé sur le Deep Learning, inférences d’IA ou applications HPC. Étant donné que les instances sont exécutées en parallèle, les charges de travail s’exécutent elles aussi en parallèle, mais de manière séparée et isolée sur un même processeur graphique physique.

MIG avec les GPU Blackwell

Les GPU à architecture Blackwell et Hopper prennent en charge des configurations mutualisées et multi-utilisateurs dans un environnement virtualisé pouvant accueillir jusqu’à sept instances de GPU, chacune d’entre elles étant isolée avec des capacités de calcul confidentiel au niveau du matériel et de l’hyperviseur. Les décodeurs vidéo dédiés de chaque instance MIG facilitent la mise en œuvre d’une analyse vidéo intelligente (IVA) sécurisée et performante sur une infrastructure partagée. Grâce au profilage MIG simultané, les administrateurs peuvent activer une accélération GPU parfaitement calibrée pour chaque tâche et optimiser l’allocation des ressources pour tous les utilisateurs.

Plutôt que de louer une instance Cloud dédiée, les chercheurs qui doivent traiter de petites charges de travail peuvent choisir d’utiliser la technologie MIG pour isoler en toute sécurité une partie d’un GPU tout en ayant la certitude que leurs données seront parfaitement sécurisées, que ce soit au repos, en transit ou pendant leur utilisation. Les fournisseurs de services Cloud peuvent ainsi bénéficier d’une polyvalence accrue pour satisfaire aux exigences de prix et de capacité de tous leurs clients.

Découvrez MIG en action

Exécution de plusieurs charges de travail sur un seul processeur graphique A100

Cette démo présente l’exécution simultanée de charges de travail d’IA et de calcul haute performance (HPC) sur le même processeur graphique A100.

Voir La Vidéo

Optimisation des performances et de l’utilisation avec le GPU multi-instances

Cette démo présente les performances d’inférence sur une seule instance MIG, puis l’évolution linéaire des performances sur l’intégralité du processeur graphique A100.

Voir La Vidéo

Conçu pour les équipes informatiques et DevOps

MIG permet aux équipes informatiques et DevOps d’effectuer une allocation sur mesure des instances du processeur graphique. Chaque instance MIG agit comme un processeur graphique autonome pour les applications. C’est pourquoi aucun changement n’est requis sur la plateforme CUDA^®. MIG peut être utilisé sur les principaux environnements de calcul professionnels.

Déployez vos projets du Data Center jusqu’à l’Edge

Utilisez MIG sur site, dans le Cloud ou à l’Edge.

Exploitez les conteneurs

Exécutez des applications conteneurisées sur les instances MIG.

Profitez de Kubernetes

Programmez des groupes Kubernetes sur les instances MIG.

Virtualisez vos applications

Exécutez vos applications sur les instances MIG au sein d’une machine virtuelle.

Spécifications de MIG

	GB200/B200/B100	H100	H200
Calcul confidentiel	Oui	Oui	Oui
Types d’instance	Up to 7x 23GB Up to 4x 45GB Up to 2x 95GB Up to 1x 192GB	7x 10GB 4x 20GB 2x 40GB 1x 80GB	Up to 7x 18GB Up to 4x 35GB Up to 2x 71GB Up to 1x 141GB
Profilage et surveillance de processeur graphique	Simultanément sur toutes les instances	Simultanément sur toutes les instances	Simultanément sur toutes les instances
Clients sécurisés	7x	7x	7x
Décodeurs multimédia	NVJPEG et NVDEC dédié par instance	NVJPEG et NVDEC dédié par instance	NVJPEG et NVDEC dédié par instance

Spécifications préliminaires susceptibles d’être modifiées.

Obtenez plus d'informations sur NVIDIA Blackwell.