NVIDIA Mission Control™ は、開発者のワークロードのスケジューリングやオーケストレーションから、監視と自律回復まで、AI ファクトリーのあらゆる側面を効率化するとともに、プラットフォーム チームが完全にサポートされたソフトウェアで効率的な運用と自信を持ってスケールできるようにします。これは、AI の最新のフロンティア向け NVIDIA Blackwell と NVIDIA Rubin データセンターを支え、リアルタイムの可視化とパフォーマンス、電力、冷却の正確な制御を、AI ファクトリー ROI を最大化する常時稼働の耐障害性と組み合わせて提供します。Mission Control により、すべての企業は今日のハイパースケーラーの効率性で AI を運用し、AI トークン本番利用を高速化します。
クラスターのライフサイクル全体を通じて、AI ファクトリーのデプロイと運用を簡素化します。
NVIDIA Mission Control 2.3 は、NVIDIA エコシステム全体で完全に統合されており、NVIDIA GB200 NVL72 と NVIDIA GB300 NVL72 をサポートしています。 サービス全体にわたる新しい統合認証と、仮想化された制御プレーンのオプションを追加し、柔軟性と拡張性を向上させます。 さらに、Mission Control はエアギャップ環境でのデプロイを提供し、漏洩検出検証チェックを提供します。 また、NVIDIA Blackwell アーキテクチャを搭載した NVIDIA DGX™ システムでも、自律回復エンジン スイートなど、Mission Control のすべての機能を利用できるようになりました。
NVIDIA Mission Control には、検証済みのワークフローにおける NVIDIA の最新の電力最適化イノベーションへのアクセスが含まれており、クラスター、システム、ワークロード レベルでアクションを監視および管理するための使いやすいグラフィカル インターフェイスが備わっています。Mission Control により、管理者はドメインの電力サービスにアクセスし、電力最適化のためのジョブを認識するクラスター全体の動的なポリシーを設定できます。
シームレスなマルチノードのトレーニングと推論オーケストレーション、サードパーティ ソフトウェアとの柔軟な統合、高度な電力と冷却の自動化により、AI ファクトリーの運用に俊敏性をもたらします。
すぐに利用できる Grafana ダッシュボードと常時稼働状態チェックにより、ワークロードの稼働時間、クラスター インフラ、施設を詳細に可視化できます。アラートの疲労を軽減し、パフォーマンスを最適化します。
異常検出から分離まで、エンドツーエンドの自律回復エンジンで、最新のデータセンターの耐障害性を再定義します。このエンジンには、ジョブの高速再起動、ハードウェアの自動修復までが含まれます。
エンドツーエンドの検証済みワークフロー、収益可能性の向上のための継続的な運用、大規模な企業 AI の新標準向けの NVIDIA Enterprise サポートにより、AI ファクトリーの出力を最大化します。
パートナー
大手システム プロバイダーが自社システム向けに NVIDIA Mission Control をテストおよび検証した上で構築した NVIDIA Grace™ Blackwell NVL72 を基盤とする AI ファクトリーの構成、検証、運用をしましょう。
NVIDIA は、AI ファクトリーのすべての構成要素を提供しています。 NVIDIA Mission Control と NVIDIA AI Enterprise は、最先端のインフラとワークロード管理、そして本番環境向け AI 開発者ツールを提供しており、企業はかつてないほど実用的な規模で、AI の変革的な力を活用できます。