NVIDIA Mission Control™ agiliza cada aspecto de la fábrica de IA, desde la programación y la orquestación de la carga de trabajo del desarrollador hasta la supervisión y la recuperación autónoma, al tiempo que capacita a los equipos de la plataforma para trabajar de forma eficiente y escalar con confianza con un software totalmente compatible. Impulsa los centros de datos de NVIDIA Blackwell y NVIDIA Rubin para las nuevas fronteras de la IA, combinando visibilidad en tiempo real con un control preciso del rendimiento, la energía y la refrigeración, con resiliencia siempre activa para maximizar el retorno de la inversión de la fábrica de IA. Mission Control permite a todas las empresas ejecutar la IA con la eficiencia de los hiperescaladores actuales, acelerando la producción de tokens de IA.
Simplifique la forma en que se implementan y operan las fábricas de IA durante todo el ciclo de vida del clúster.
NVIDIA Mission Control 2.3 está totalmente integrado en el ecosistema de NVIDIA y es compatible con NVIDIA GB200 NVL72 y NVIDIA GB300 NVL72. Cuenta con una nueva autenticación unificada en todos los servicios y una opción añadida para ofrecer un plano de control virtualizado a fin de mejorar la flexibilidad y la escalabilidad. Además, Mission Control ahora ofrece la implementación para entornos aislados y proporciona comprobaciones de validación de la detección de fugas. Los sistemas NVIDIA DGX con arquitecturas NVIDIA Blackwell ya tienen acceso al alcance completo de las capacidades de Mission Control, incluido el conjunto de motores de recuperación autónoma.
NVIDIA Mission Control incluye acceso a las innovaciones más recientes de optimización de energía de NVIDIA en un flujo de trabajo validado con interfaces gráficas fáciles de usar para supervisar y gestionar acciones a nivel de clúster, sistema y carga de trabajo. Con Mission Control, los administradores pueden acceder al servicio de energía del dominio y establecer políticas dinámicas en todo el clúster que estén adaptadas al trabajo para optimizar la energía.
Aporte agilidad a las operaciones de fábrica de IA con capacidades óptimas de entrenamiento de varios nodos y orquestación de inferencias, flexibilidad para integrarse con software de terceros y automatización avanzada de energía y refrigeración.
Obtenga una visibilidad completa del tiempo de actividad de la carga de trabajo, la infraestructura de clústeres y las instalaciones con paneles de control de Grafana integrados y listos para usar, así como comprobaciones de estado siempre activas que reducen la fatiga por alertas y optimizan el rendimiento.
Redefina la resiliencia del centro de datos moderno con un motor de recuperación autónomo de extremo a extremo que abarca desde la detección de anomalías hasta el aislamiento, el reinicio rápido de trabajos y la corrección de hardware automatizada.
Maximice el rendimiento de la fábrica de IA con flujos de trabajo validados de extremo a extremo, operaciones continuas para mejorar el potencial de ingresos y NVIDIA Enterprise Support, que establece un nuevo estándar de IA empresarial a escala.
Partners
Configure, valide y gestione fábricas de IA basadas en NVIDIA Grace™ Blackwell NVL72 de los principales proveedores de sistemas que han probado y validado NVIDIA Mission Control para sus sistemas.
NVIDIA proporciona todos los elementos fundamentales de una fábrica de IA. Juntos, NVIDIA Mission Control y NVIDIA AI Enterprise proporcionan una gestión de vanguardia de las infraestructuras y cargas de trabajo, además de herramientas de desarrolladores para la IA de producción, lo que permite a las empresas aprovechar el poder transformador de la IA a una escala práctica sin precedentes.