La technologie de GPU multi-instances (MIG) de NVIDIA améliore le niveau de performance et de rendement des processeurs graphiques reposant sur les architectures NVIDIA Rubin, NVIDIA Blackwell et NVIDIA Hopper. MIG permet de partitionner le processeur graphique en sept instances distinctes, chacune étant entièrement isolée avec sa propre mémoire à bande passante élevée, son cache spécial et des cœurs de calcul dédiés. Les administrateurs peuvent ainsi assurer le traitement d'une grande variété de charges de travail, peu importe leur taille, avec une qualité de service (QdS) garantie et l’extension de l’accès aux ressources de calcul accéléré pour tous les utilisateurs.
Sans MIG, différentes tâches exécutées sur le même processeur graphique (telles que le traitement de différentes demandes d’inférence pour l’IA) doivent se partager des ressources communes. Une tâche qui mobilise une importante bande passante impacte par conséquent les tâches annexes, ce qui les rend susceptibles de manquer leurs objectifs de latence. Avec MIG, les tâches sont exécutées en simultané sur différentes instances, chacune disposant de ressources dédiées pour le calcul, la mémoire et la bande passante, ce qui permet d’obtenir des performances prévisibles pour la qualité de service et une utilisation maximale des ressources GPU.
Les GPU à architecture Blackwell et Hopper de NVIDIA prennent en charge des configurations mutualisées et multi-utilisateurs dans un environnement virtualisé pouvant accueillir jusqu’à sept instances de GPU, chacune d’entre elles étant isolée en toute sécurité avec des capacités de calcul confidentiel au niveau du matériel et de l’hyperviseur. Les décodeurs vidéo dédiés de chaque instance MIG facilitent la mise en œuvre d’une analyse vidéo intelligente (IVA) sécurisée et performante sur une infrastructure partagée. Grâce au profilage MIG simultané, les administrateurs peuvent activer une accélération GPU parfaitement calibrée pour chaque tâche et optimiser l’allocation des ressources pour tous les utilisateurs.
Plutôt que de louer une instance Cloud dédiée, les chercheurs qui doivent traiter de petites charges de travail peuvent choisir d’utiliser la technologie MIG pour isoler en toute sécurité une partie d’un GPU tout en ayant la certitude que leurs données seront parfaitement sécurisées, que ce soit au repos, en transit ou pendant leur utilisation. Les fournisseurs de services Cloud peuvent ainsi bénéficier d’une polyvalence accrue pour satisfaire aux exigences de prix et de capacité de tous leurs clients.
MIG permet aux équipes informatiques et DevOps d’effectuer une allocation sur mesure des instances du processeur graphique. Chaque instance MIG agit comme un processeur graphique autonome pour les applications. C’est pourquoi aucun changement n’est requis sur la plateforme CUDA®. MIG peut être utilisé sur les principaux environnements de calcul d'entreprise.
| GPU NVIDIA Blackwell Ultra* | GPU NVIDIA Blackwell* | |||
|---|---|---|---|---|
| NVIDIA GB300 NVL72 | NVIDIA HGX B300 | NVIDIA GB200 NVL72 | NVIDIA HGX B200 | |
| Sécurité basée sur l’IA | Oui | Oui | Oui | Oui |
| Types d’instance | 7x 34 Go 4x 69 Go 2x 139 Go 1x 279 Go |
7x 32 Go 4x 67 Go 2x 135 Go 1x 270 Go |
7x 23 Go 4x 46 Go 2x 93 Go 1x 186 Go |
7x 21 Go 4x 45 Go 2x 90 Go 1x 180 Go |
| Profilage et surveillance de GPU | Simultanément sur toutes les instances | Simultanément sur toutes les instances | Simultanément sur toutes les instances | Simultanément sur toutes les instances |
| Clients sécurisés | 7x | 7x | 7x | 7x |
| Décodeurs multimédia | NVJPEG et NVDEC dédiés par instance | NVJPEG et NVDEC dédiés par instance | NVJPEG et NVDEC dédiés par instance | NVJPEG et NVDEC dédiés par instance |
Spécifications préliminaires. Toutes les valeurs fournies sont maximales et sont susceptibles d'être modifiées.
* Les tailles indiquées sont conformes aux spécifications GPU pour chaque système. Pour plus d'informations, veuillez vous reporter à notre documentation technique.
Obtenez plus d'infos sur MIG.