Führen Sie Modelle aus und automatisieren Sie das Wesentliche.
NVIDIA Mission Control™ optimiert alle Aspekte der KI-Fabrik – von der Planung und Orchestrierung von Entwickler-Workloads bis hin zur Überwachung und autonomen Wiederherstellung – und ermöglicht es Plattformteams, mit vollständig unterstützter Software effizient zu arbeiten und zuverlässig zu skalieren. Es unterstützt NVIDIA Blackwell und NVIDIA Rubin-Rechenzentren für die neuesten Grenzen der KI und kombiniert Echtzeit-Transparenz mit präziser Kontrolle über Leistung, Energie und Kühlung mit kontinuierlich verfügbarer Ausfallsicherheit für einen maximierten ROI der KI-Fabrik. Mit Mission Control kann jedes Unternehmen KI mit der Effizienz heutiger Hyperscaler ausführen und die Produktion von KI-Token beschleunigen.
Vereinfachen Sie die Bereitstellung und den Betrieb von KI-Fabriken während des gesamten Cluster-Lebenszyklus.
NVIDIA Mission Control 2.3 ist vollständig in das NVIDIA-Ökosystem integriert und unterstützt NVIDIA GB200 NVL72 und NVIDIA GB300 NVL72. Es verfügt über eine neue einheitliche Authentifizierung über Dienste hinweg und eine zusätzliche Option für eine virtualisierte Steuerungsebene, um die Flexibilität und Skalierbarkeit zu verbessern. Darüber hinaus bietet Mission Control jetzt die Bereitstellung für Air-Gap-Umgebungen und bietet Validierungsprüfungen zur Leckageerkennung. NVIDIA DGX-Systeme mit NVIDIA Blackwell-Architekturen haben jetzt außerdem Zugriff auf den gesamten Umfang der Mission Control-Funktionen, einschließlich der Suite für die autonome Wiederherstellungs-Engine.
NVIDIA Mission Control umfasst den Zugriff auf die neuesten Innovationen von NVIDIA im Bereich Energieoptimierung in einem validierten Workflow mit benutzerfreundlichen grafischen Oberflächen für die Überwachung und Verwaltung von Aktionen auf Cluster-, System- und Workload-Ebene. Mit Mission Control können Administratoren auf den Domänen-Energiedienst zugreifen und clusterweite, dynamische und auftragsbezogene Richtlinien zur Energieoptimierung festlegen.
Bringen Sie Agilität in den KI-Fabrikbetrieb mit nahtlosem Multi-Knoten-Training und Inferenzorchestrierung, Flexibilität bei der Integration in Software von Drittanbietern sowie fortschrittlicher Energie- und Kühlungsautomatisierung.
Erhalten Sie einen tiefen Einblick in die Workload-Verfügbarkeit, die Cluster-Infrastruktur und die Einrichtungen mit integrierten, einsatzbereiten Grafana-Dashboards und ständig aktiven Zustandsprüfungen, die Alarmmüdigkeit reduzieren und die Leistung optimieren.
Definieren Sie die Ausfallsicherheit moderner Rechenzentren neu mit einer autonomen End-to-End-Wiederherstellungs-Engine, die von der Anomalieerkennung über die Isolation bis hin zum schnellen Neustart von Aufträgen und automatisierter Hardware-Fehlerbehebung reicht.
Maximieren Sie die Leistung von KI-Fabriken mit durchgängig validierten Workflows, kontinuierlichem Betrieb für verbessertes Umsatzpotenzial und NVIDIA Enterprise Support für einen neuen Standard der Unternehmens-KI in großem Maßstab.
Partner
Konfigurieren, validieren und betreiben Sie KI-Fabriken, die auf NVIDIA Grace™ Blackwell NVL72 basieren und von führenden Systemanbietern bereitgestellt werden, die NVIDIA Mission Control für ihre Systeme getestet und validiert haben.
NVIDIA liefert alle Bausteine für eine KI-Fabrik. Zusammen bieten NVIDIA Mission Control und NVIDIA AI Enterprise modernste Infrastruktur und Workload-Management sowie Entwicklertools für Produktions-KI, sodass Unternehmen die transformative Kraft von KI mit beispielloser, praktischer Skalierbarkeit nutzen können.