NVIDIA Mission Control

Ejecute modelos y automatice lo esencial.

Descripción General

Llevamos el Conocimiento Especializado de las Fábricas de IA Más Avanzadas del Mundo a Cada Empresa

NVIDIA Mission Control™ agiliza cada aspecto de la fábrica de IA (desde la programación y orquestación de las cargas de trabajo de los desarrolladores hasta el monitoreo y la recuperación autónoma), a la vez que permite a los equipos de plataformas operar de manera eficiente y escalar con confianza con software completamente compatible. Impulsa los centros de datos NVIDIA Blackwell y NVIDIA Rubin para las nuevas fronteras de la IA, combinando la visibilidad en tiempo real con un control preciso sobre el desempeño, la alimentación y el enfriamiento, con una resiliencia siempre activa para lograr un rendimiento de la inversión maximizado en las fábricas de IA. Mission Control permite a todas las empresas ejecutar la IA con la eficiencia de los hiperescaladores actuales, lo que acelera la producción de tokens de IA.

Administre y Ejecute Fábricas de IA

NVIDIA Mission Control simplifica las operaciones de IA, desde la implementación de clústeres hasta la orquestación de cargas de trabajo y la integración de la administración de edificios, todo con agilidad, resiliencia y eficiencia a hiperescala para las empresas.

Del hardware a Escala de Bastidor a la Infraestructura de IA Planificable

Para los arquitectos de IA y los operadores de plataformas de HPC, el problema no es solo montar y apilar el hardware, sino que también es convertir ese bastidor en un conjunto de recursos seguros, de alto desempeño y fáciles de consumir para los usuarios finales. Una pila de software validada, como NVIDIA Mission Control, proporciona las herramientas para la programación de múltiples nodos y es compatible con Slurm y Kubernetes.

Tecnología

Operaciones y Orquestación de Data Centers de IA

Simplifique la forma en que se implementan y operan las fábricas de IA a lo largo de todo el ciclo de vida del clúster.

Optimizaciones Avanzadas de Energía

Trabaje con un 85 % de energía y un rendimiento del 93 % en entornos con limitaciones de energía o con restricciones de costos, con acceso a implementaciones validadas de las últimas innovaciones de energía de NVIDIA.

Integración de la Administración de Edificios

Mejore el control de los eventos de alimentación y refrigeración, lo que incluye la detección rápida de fugas, con una coordinación mejorada de las instalaciones del sistema y del centro de datos compatible con la automatización y los paneles de control integrados.

Motor de Recuperación Autónoma

Identifique, aísle y genere una recuperación de problemas diez veces más rápido, sin intervención manual, lo que permite ejecutar entrenamientos e inferencias más rápidamente para maximizar la productividad de los desarrolladores y la resiliencia de la infraestructura integrada.

Controles de Estado Continuos

Valide el desempeño del hardware y de los clústeres a lo largo de todo el ciclo de vida de su infraestructura con acceso a las verificaciones de estado, con la opción de activar acciones automatizadas basadas en las reglas preestablecidas de NVIDIA.

Orquestación Dinámica de Cargas de Trabajo

Impulse la disponibilidad y la utilización de las GPU con la tecnología NVIDIA Run:ai incluida, o integre Slurm e incorpore sus propios Kubernetes con nuestra plataforma de administración de clústeres.

Configuración Flexible y Segura

Integre los servicios de NVIDIA Mission Control con soluciones de ISV de confianza para obtener configuraciones flexibles y seguras que proporcionan aislamientos de espacios de nombres validados y satisfacen las necesidades de su organización.

Nuevos lanzamientos

NVIDIA Mission Control 2.3

NVIDIA Mission Control 2.3 está completamente integrado en todo el ecosistema de NVIDIA y es compatible con NVIDIA GB200 NVL72 y NVIDIA GB300 NVL72. Cuenta con una nueva autenticación unificada en todos los servicios y una opción agregada para un plano de control virtualizado a fin de mejorar la flexibilidad y la escalabilidad. Además, Mission Control ahora ofrece implementación para entornos aislados y proporciona verificaciones de validación de detección de fugas. Los sistemas NVIDIA DGX™ con las arquitecturas NVIDIA Blackwell ahora también tienen acceso al alcance completo de las capacidades de Mission Control, incluido el conjunto de motores de recuperación autónomos.

NVIDIA Mission Control incluye el acceso a las últimas innovaciones de NVIDIA en optimización de energía en un flujo de trabajo validado con interfaces gráficas fáciles de usar, para monitorear y administrar acciones a nivel de clústeres, sistemas y cargas de trabajo. Con Mission Control, los administradores pueden acceder al servicio de energía de dominio y establecer políticas dinámicas en todo el clúster que detectan los trabajos para optimizar la energía.

Beneficios

¿Por qué NVIDIA Mission Control?

Agilidad Operativa Instantánea

Brinde agilidad a las operaciones de las fábricas de IA con una orquestación de inferencia y entrenamiento de múltiples nodos sin dificultades, flexibilidad para integrarse con software de terceros y automatización avanzada de la alimentación y la refrigeración.

Monitoreo Extenso

Obtenga una visibilidad detallada del tiempo de actividad de las cargas de trabajo, la infraestructura de clústeres y las instalaciones con paneles de control Grafana integrados y listos para usar, y con verificaciones de estado siempre activas que reducen la fatiga de las alertas y optimizan el desempeño.

Resiliencia Incorporada

Redefina la resiliencia de los centros de datos modernos con un motor de recuperación autónomo integral que abarca desde la detección de anomalías hasta el aislamiento, el reinicio rápido de trabajos y la remediación automatizada de hardware.

Producción de Tokens de IA Acelerada

Maximice la producción de las fábricas de IA con flujos de trabajo validados integrales, operaciones continuas para mejorar el potencial de ingresos y la asistencia empresarial de NVIDIA para un nuevo estándar de la IA empresarial a escala.

Socios

Implemente y Ejecute Fábricas de IA con Proveedores de Sistemas Líderes

Configure, valide y opere fábricas de IA basadas en NVIDIA Grace™ Blackwell NVL72 de proveedores de sistemas líderes que han probado y validado NVIDIA Mission Control para sus sistemas.

Soluciones

Todo lo que Necesita para una Fábrica de IA de Clase Mundial

NVIDIA ofrece todos los componentes básicos de una fábrica de IA. Juntos, NVIDIA Mission Control e IA de NVIDIA Enterprise proporcionan una infraestructura de vanguardia y administración de cargas de trabajo, además de herramientas para desarrolladores para la IA de producción, lo que les permite a las empresas aprovechar el poder transformador de la IA a una escala práctica y sin precedentes.

NVIDIA DGX SuperPOD

Infraestructura de IA líder creada específicamente para las demandas únicas de la IA.

NVIDIA DGX SuperPOD™ es una solución de infraestructura lista para usar para data centers de IA que ofrece un desempeño sin concesiones a cada usuario y carga de trabajo. DGX SuperPOD, que se puede configurar con cualquier sistema NVIDIA DGX, proporciona una infraestructura acelerada de primer nivel con un desempeño escalable para las cargas de trabajo de entrenamiento e inferencia de IA más exigentes.

IA de NVIDIA Enterprise

Plataforma de software nativa de la nube que optimiza la IA de producción con herramientas creadas para desarrolladores.

El paquete de software NVIDIA AI Enterprise incluye las mejores herramientas de ciencia de datos de NVIDIA, modelos preentrenados, frameworks optimizados y más, todo respaldado por la asistencia empresarial de NVIDIA. NVIDIA AI Enterprise está optimizado para ejecutarse junto con Mission Control.

Próximos Pasos

¿Todo Listo para Comenzar?

Habilite operaciones de IA optimizadas con NVIDIA Mission Control para que impulse el lanzamiento de la IA en su empresa.

¿Necesita Asistencia para NVIDIA Mission Control?

Obtenga asistencia experta, resultados más rápidos y orientación con la asistencia y los servicios de NVIDIA DGX Enterprise.

Documentación de NVIDIA Mission Control

Acceda a guías de usuario y notas de lanzamiento de NVIDIA Mission Control.