NVIDIA Mission Control

Exécutez des modèles, automatisez l'essentiel.

Aperçu

L'expertise en usines basées sur l'IA la plus avancée au monde à la portée de toutes les entreprises

NVIDIA Mission Control™ rationalise chaque aspect de l'usine d'IA, de la planification et l'orchestration de la charge de travail des développeurs à la surveillance et à la récupération autonome, tout en permettant aux équipes plateformes d'opérer efficacement et d'évoluer en toute confiance avec des logiciels entièrement pris en charge. Elle alimente les centres de données NVIDIA Blackwell et NVIDIA Rubin pour explorer les nouvelles frontières de l'IA, en combinant une visibilité en temps réel avec un contrôle précis des performances, de l'alimentation et du refroidissement, tout en offrant une résilience permanente pour optimiser le retour sur investissement des usines d'IA. Mission Control permet à toutes les entreprises d'exécuter l'IA avec l'efficacité des hyperscalers actuels, accélérant la production de jetons d'IA.

Gérez et exploitez des usines basées sur l'IA

NVIDIA Mission Control simplifie les opérations d'IA, du déploiement de clusters à l'orchestration des charges de travail, en passant par l'intégration de la gestion des bâtiments, et ce, en offrant aux entreprises agilité, résilience et efficacité hyperscale.

Du matériel à l'échelle du rack à l'infrastructure IA programmable

Pour les architectes IA et les opérateurs de plateformes HPC, le problème ne se limite pas à l'installation en rack et à l'empilement du matériel, mais plutôt à la transformation de ce rack en un ensemble de ressources sécurisées, performantes et faciles à utiliser pour les utilisateurs finaux. Une pile logicielle validée, telle que NVIDIA Mission Control, fournit les outils pour la planification multi-nœuds, prenant en charge Slurm et Kubernetes.

Technologie

Opérations et orchestration des Data Centers d'IA

Simplifiez le déploiement et l'exploitation des usines basées sur l'IA tout au long du cycle de vie des clusters.

Optimisations de puissance avancées

Exécutez à 85 % de puissance en bénéficiant d'un débit de performance de 93 % dans des environnements soumis à des contraintes énergétiques ou budgétaires, tout en bénéficiant d'un accès aux implémentations validées des dernières innovations énergétiques de NVIDIA.

Intégration de la gestion des bâtiments

Améliorez le contrôle des événements d'alimentation et de refroidissement, notamment la détection rapide des fuites, grâce à une coordination améliorée des installations du système et du centre de données soutenue par l'automatisation et des tableaux de bord intégrés.

Moteur de récupération autonome

Identifiez, isolez et corrigez les problèmes 10 fois plus rapidement, sans intervention manuelle, afin d'accélérer les cycles d'entraînement et d'inférence, d'optimiser la productivité des développeurs et de renforcer la résilience de l'infrastructure.

Examens de santé en continu

Validez les performances du matériel et des clusters tout au long du cycle de vie de votre infrastructure grâce à un accès à des contrôles d'état et la possibilité de déclencher des actions automatisées basées sur les règles prédéfinies de NVIDIA.

Orchestration de la charge de travail dynamique

Optimisez la disponibilité et l'utilisation des GPU grâce à la technologie NVIDIA Run:ai incluse, ou intégrez Slurm et votre propre environnement Kubernetes à notre plateforme de gestion des clusters.

Configuration flexible et sécurisée

Intégrez les services NVIDIA Mission Control à des solutions ISV fiables pour bénéficier de configurations flexibles et sécurisées qui fournissent des isolations de namespace validées et répondent aux besoins de votre entreprise.

Nouveautés

NVIDIA Mission Control 2.3

NVIDIA Mission Control 2.3 est entièrement intégré à l'écosystème NVIDIA et prend en charge NVIDIA GB200 NVL72 et NVIDIA GB300 NVL72. Cette solution intègre une nouvelle fonctionnalité d'authentification unifiée pour tous les services et une option de plan de contrôle virtualisé afin d'améliorer la flexibilité et l'évolutivité. De plus, Mission Control offre désormais un déploiement pour les environnements isolés (isolation de niveau Air-Gap) et inclut des contrôles de validation de détection de fuites. Les systèmes NVIDIA DGX™ avec architectures NVIDIA Blackwell ont désormais accès à l'ensemble des capacités Mission Control, notamment la suite de moteurs de récupération autonomes.

NVIDIA Mission Control permet d'accéder aux dernières innovations NVIDIA en matière d'optimisation énergétique dans un workflow validé avec interfaces graphiques faciles à utiliser pour superviser et gérer les actions au niveau cluster, système et charge de travail. Avec Mission Control, les administrateurs peuvent accéder au service de gestion de l'alimentation du domaine pour pouvoir définir des politiques dynamiques à l'échelle du cluster qui tiennent compte des tâches pour optimiser l'alimentation.

Avantages

Pourquoi NVIDIA Mission Control ?

Agilité opérationnelle instantanée

Apportez de l'agilité aux opérations des usines d'IA grâce à une orchestration transparente des tâches d'entraînement et d'inférence multi-nœuds, à une souplesse d'intégration des logiciels tiers et à une automatisation avancée de l'alimentation et du refroidissement.

Surveillance étendue

Bénéficiez d'une visibilité totale sur la disponibilité de la charge de travail, l'infrastructure de cluster et les installations grâce aux tableaux de bord Grafana intégrés et prêts à l'emploi et aux contrôles d'état permanents qui réduisent le nombre d'alertes inutiles et optimisent les performances.

Résilience intégrée

Redéfinissez la résilience des centres de données modernes avec un moteur de récupération autonome de bout en bout qui s'étend de la détection d'anomalies à l'isolement, jusqu'au redémarrage rapide des tâches et à la remédiation matérielle automatisée.

Production de jetons d'IA accélérée

Maximisez la production d'usine dIA avec des flux de travail validés de bout en bout, des opérations continues pour augmenter votre potentiel de revenus et l'assistance NVIDIA Enterprise pour bénéficier d'une nouvelle norme d'IA d'entreprise à grande échelle.

Partenaires

Déployer et exécuter des usines d’IA avec les principaux fournisseurs de systèmes

Configurez, validez et exploitez les usines d’IA reposant sur NVIDIA Grace™ Blackwell NVL72 provenant des principaux fournisseurs de systèmes qui ont testé et validé NVIDIA Mission Control sur leurs systèmes.

Solutions

Tout ce dont vous avez besoin pour une usine d'IA de pointe

NVIDIA fournit tous les composantes d'une usine d'IA digne de ce nom NVIDIA Mission Control et NVIDIA AI Enterprise fournissent à eux deux une infrastructure et une gestion de charge de travail de pointe, ainsi que des outils de développement pour l'IA de production, permettant aux entreprises d'exploiter la puissance transformative de l'IA à une échelle sans précédent.

NVIDIA DGX SuperPOD

Une infrastructure d'IA hors pairs, spécialement conçue pour répondre aux exigences uniques de l'IA.

NVIDIA DGX SuperPOD™ est une solution clé en main d'infrastructure de Data Center pour l'IA qui offre des performances sans compromis à tous les utilisateurs et sur toutes les charges de travail. Configurable avec n'importe quel système NVIDIA DGX™, DGX SuperPOD fournit une infrastructure accélérée de pointe avec des performances évolutives pour les charges de travail d'entraînement et d'inférence IA les plus exigeantes.

NVIDIA AI Enterprise

Plateforme logicielle pensée pour le Cloud qui optimise l'IA pour la production grâce à des outils conçus pour les développeurs.

La suite logicielle NVIDIA AI Enterprise inclut les meilleurs outils de Data Science de NVIDIA, des modèles pré-entraînés, des frameworks optimisés, et bien plus encore, entièrement pris en charge par l'assistance d'entreprise NVIDIA. NVIDIA AI Enterprise est optimisé pour fonctionner en parallèle de Mission Control.

Étapes suivantes

Vous voulez vous lancer ?

Profitez d'opérations d'IA simplifiées avec NVIDIA Mission Control pour donner de l'ampleur aux projets d'IA de votre entreprise.

Besoin d'aide sur NVIDIA Mission Control ?

Bénéficiez d'une assistance spécialisée, de résultats plus rapides et de conseils grâce à l'assistance et aux services NVIDIA DGX Enterprise.

Documentation sur NVIDIA Mission Control

Accédez aux guides d’utilisation et aux notes de publication de NVIDIA Mission Control.