NVIDIA Mission Control

Ejecute modelos, automatice lo esencial.

Descripción

Aplicar la experiencia en las fábricas con IA más avanzadas del mundo a todas las empresas

NVIDIA Mission Control™ agiliza cada aspecto de la fábrica de IA, desde la programación y la orquestación de la carga de trabajo del desarrollador hasta la supervisión y la recuperación autónoma, al tiempo que capacita a los equipos de la plataforma para trabajar de forma eficiente y escalar con confianza con un software totalmente compatible. Impulsa los centros de datos de NVIDIA Blackwell y NVIDIA Rubin para las nuevas fronteras de la IA, combinando visibilidad en tiempo real con un control preciso del rendimiento, la energía y la refrigeración, con resiliencia siempre activa para maximizar el retorno de la inversión de la fábrica de IA. Mission Control permite a todas las empresas ejecutar la IA con la eficiencia de los hiperescaladores actuales, acelerando la producción de tokens de IA.

Gestione y opere fábricas de IA

NVIDIA Mission Control simplifica las operaciones de IA, desde la implementación de clústeres hasta la orquestación de cargas de trabajo y la integración de la gestión de edificios; todo ello con agilidad, resiliencia y eficiencia a hiperescala para las empresas.

Desde hardware a escala de bastidor hasta infraestructura de IA programable

Para los arquitectos de IA y los operadores de plataformas de HPC, el problema no es solo montar y apilar el hardware, sino convertir los bastidores en un conjunto de recursos seguros, de alto rendimiento y fáciles de usar para los usuarios finales. Una pila de software validada, como NVIDIA Mission Control, proporciona las herramientas para la programación de varios nodos. Además, es compatible con Slurm y Kubernetes.

Tecnología

Operaciones y orquestación de centro de datos de IA

Simplifique la forma en que se implementan y operan las fábricas de IA durante todo el ciclo de vida del clúster.

Optimizaciones de energía avanzadas

Ejecute a una potencia del 85 % con un rendimiento del 93 % en entornos con restricciones energéticas o conscientes de los costes con acceso a implementaciones validadas de las últimas innovaciones energéticas de NVIDIA.

Integración de gestión de edificios

Mejore el control de los eventos de energía y refrigeración, incluida la detección rápida de fugas, con la coordinación mejorada de las instalaciones del centro de datos y el sistema, que está respaldada por automatización y paneles integrados.

Motor de recuperación autónomo

Identifique, aísle y recupérese de problemas 10 veces más rápido, sin intervención manual, lo que da lugar a ejecuciones de entrenamiento e inferencia más rápidas para maximizar la productividad de los desarrolladores y la resiliencia de la infraestructura integrada.

Comprobaciones continuas de estado

Valide el rendimiento del hardware y del clúster durante el ciclo de vida de su infraestructura con acceso a comprobaciones de estado y la opción de activar acciones automatizadas basadas en reglas prestablecidas de NVIDIA.

Orquestación dinámica de la carga de trabajo

Mejore la disponibilidad y la utilización de la GPU con la tecnología NVIDIA Run:ai incluida o integre Slurm y use su propio Kubernetes con nuestra plataforma de gestión de clústeres.

Configuración flexible y segura

Integre los servicios de NVIDIA Mission Control con soluciones de confianza de proveedores de software independientes (ISV) para obtener configuraciones flexibles y seguras que proporcionen aislamientos de espacios de nombres validados y satisfagan las necesidades de su organización.

Nuevos títulos

NVIDIA Mission Control 2.3

NVIDIA Mission Control 2.3 está totalmente integrado en el ecosistema de NVIDIA y es compatible con NVIDIA GB200 NVL72 y NVIDIA GB300 NVL72. Cuenta con una nueva autenticación unificada en todos los servicios y una opción añadida para ofrecer un plano de control virtualizado a fin de mejorar la flexibilidad y la escalabilidad. Además, Mission Control ahora ofrece la implementación para entornos aislados y proporciona comprobaciones de validación de la detección de fugas. Los sistemas NVIDIA DGX con arquitecturas NVIDIA Blackwell ya tienen acceso al alcance completo de las capacidades de Mission Control, incluido el conjunto de motores de recuperación autónoma.

NVIDIA Mission Control incluye acceso a las innovaciones más recientes de optimización de energía de NVIDIA en un flujo de trabajo validado con interfaces gráficas fáciles de usar para supervisar y gestionar acciones a nivel de clúster, sistema y carga de trabajo. Con Mission Control, los administradores pueden acceder al servicio de energía del dominio y establecer políticas dinámicas en todo el clúster que estén adaptadas al trabajo para optimizar la energía.

Ventajas

¿Por qué NVIDIA Mission Control?

Agilidad operativa instantánea

Aporte agilidad a las operaciones de fábrica de IA con capacidades óptimas de entrenamiento de varios nodos y orquestación de inferencias, flexibilidad para integrarse con software de terceros y automatización avanzada de energía y refrigeración.

Supervisión integral

Obtenga una visibilidad completa del tiempo de actividad de la carga de trabajo, la infraestructura de clústeres y las instalaciones con paneles de control de Grafana integrados y listos para usar, así como comprobaciones de estado siempre activas que reducen la fatiga por alertas y optimizan el rendimiento.

Resiliencia integrada

Redefina la resiliencia del centro de datos moderno con un motor de recuperación autónomo de extremo a extremo que abarca desde la detección de anomalías hasta el aislamiento, el reinicio rápido de trabajos y la corrección de hardware automatizada.

Producción acelerada de tokens de IA

Maximice el rendimiento de la fábrica de IA con flujos de trabajo validados de extremo a extremo, operaciones continuas para mejorar el potencial de ingresos y NVIDIA Enterprise Support, que establece un nuevo estándar de IA empresarial a escala.

Partners

Implemente y ejecute fábricas de IA con los principales proveedores de sistemas

Configure, valide y gestione fábricas de IA basadas en NVIDIA Grace™ Blackwell NVL72 de los principales proveedores de sistemas que han probado y validado NVIDIA Mission Control para sus sistemas.

Soluciones

Todo lo que necesita para una fábrica de IA de primer nivel

NVIDIA proporciona todos los elementos fundamentales de una fábrica de IA. Juntos, NVIDIA Mission Control y NVIDIA AI Enterprise proporcionan una gestión de vanguardia de las infraestructuras y cargas de trabajo, además de herramientas de desarrolladores para la IA de producción, lo que permite a las empresas aprovechar el poder transformador de la IA a una escala práctica sin precedentes.

NVIDIA DGX SuperPOD

Infraestructura de IA líder en su categoría construida específicamente para las exigencias únicas de la IA.

NVIDIA DGX SuperPOD™ es una solución de infraestructura de centro de datos de IA llave en mano que ofrece un rendimiento sin concesiones para cada usuario y carga de trabajo. DGX SuperPOD, que puede configurarse con cualquier sistema NVIDIA DGX, ofrece una infraestructura acelerada puntera en su sector con un rendimiento escalable para las cargas de trabajo de entrenamiento e inferencia de IA más exigentes.

NVIDIA AI Enterprise

Plataforma de software nativa de la nube que optimiza la IA de producción con herramientas creadas para desarrolladores.

El paquete de software NVIDIA AI Enterprise incluye las mejores herramientas de ciencia de datos de NVIDIA, modelos preentrenados, marcos optimizados y mucho más, totalmente respaldado por la asistencia empresarial de NVIDIA. NVIDIA AI Enterprise está optimizado para poder ejecutarse como complemento de Mission Control.

Próximos pasos

¿Todo listo para empezar?

Acceda a todo el potencial de las operaciones de IA optimizadas con NVIDIA Mission Control para impulsar las ambiciones en torno a la IA de su empresa.

¿Necesita asistencia para NVIDIA Mission Control?

Obtenga asistencia de expertos, resultados más rápidos y orientación con el soporte y los servicios empresariales de NVIDIA DGX.

Documentación de NVIDIA Mission Control

Acceda a guías del usuario y notas de la versión de NVIDIA Mission Control.