NVIDIA Mission Control

Execute modelos e automatize o essencial.

Visão Geral

Levando a Experiência em Fábricas de IA Mais Avançada do Mundo a Todas as Empresas

O NVIDIA Mission Control™ simplifica todos os aspectos da fábrica de IA, desde o agendamento e a orquestração de workload de desenvolvedor até o monitoramento e a recuperação autônoma, capacitando as equipes de plataforma a operar com eficiência e escalar com confiança com software totalmente compatível. Ele impulsiona os data centers NVIDIA Blackwell e NVIDIA Rubin para as mais novas fronteiras da IA, combinando visibilidade em tempo real com controle preciso sobre desempenho, energia e resfriamento, com resiliência sempre ativa para maximizar o ROI das fábricas de IA. O Mission Control permite que todas as empresas executem IA com a eficiência dos hiperescaladores atuais, acelerando a produção de tokens de IA.

Gerencie e Coordene Fábricas de IA

O NVIDIA Mission Control simplifica as operações de IA, desde a implantação de clusters até a orquestração de cargas de trabalho e a integração do gerenciamento de edifícios, tudo com agilidade, resiliência e eficiência de hiperescala para empresas.

Do Hardware em Escala de Rack à Infraestrutura de IA Programável

Para arquitetos de IA e operadores de plataforma de HPC, o problema não é apenas a montagem e o empilhamento do hardware — é transformar esse rack em um conjunto de recursos seguros, de alto desempenho e fáceis de consumir para usuários finais. Um stack de software validado, como o NVIDIA Mission Control, fornece as ferramentas para agendamento de vários nós, compatível com o Slurm e o Kubernetes.

Tecnologia

Operações e Orquestração de Data Center com IA

Simplifique o modo como as fábricas de IA são implantadas e operadas durante todo o ciclo de vida do cluster.

Otimizações Avançadas de Energia

Execute a 85% de potência com taxa de transferência de desempenho de 93% em ambientes com restrição de energia ou preocupados com custos, com acesso a implementações validadas das inovações mais recentes da NVIDIA em energia.

Como Desenvolver a Integração do Gerenciamento

Melhore o controle de eventos de energia e resfriamento, incluindo a detecção rápida de vazamentos, com a coordenação aprimorada de sistemas e instalações de Data Center, com o suporte de automação e painéis integrados.

Mecanismo de Recuperação Autônoma

Identifique, isole e recupere de problemas dez vezes mais rápido, sem intervenção manual, levando a execuções mais rápidas de treinamento e inferência para maximizar a produtividade do Desenvolvedor e resiliência da infraestrutura integrada.

Verificações de Saúde Contínuas

Valide o desempenho de hardware e clusters durante todo o ciclo de vida da sua infraestrutura com acesso a verificações de integridade com a opção de acionar ações automatizadas com base nas regras predefinidas da NVIDIA.

Orquestração Dinâmica de workload

Aumente a disponibilidade e a utilização de GPU com a tecnologia NVIDIA Run:ai incluída ou integre o Slurm e traga seu próprio Kubernetes com nossa plataforma de gerenciamento de clusters.

Configuração Flexível e Segura

Integre os serviços do NVIDIA Mission Control com soluções confiáveis de ISV para configurações flexíveis e seguras que fornecem isolamentos de espaço de nomes validados e atendem às necessidades da sua empresa.

Últimos Lançamentos

NVIDIA Mission Control 2.3

O NVIDIA Mission Control 2.3 é totalmente integrado em todo o ecossistema da NVIDIA com suporte para NVIDIA GB200 NVL72 e NVIDIA GB300 NVL72. Ele apresenta uma nova autenticação unificada em serviços e uma opção adicional para um plano de controle virtualizado para melhorar a flexibilidade e a escalabilidade. Além disso, o Mission Control agora oferece implantação para ambientes air-gap e fornece verificações de validação de detecção de vazamentos. Os sistemas NVIDIA DGX com arquiteturas NVIDIA Blackwell também têm acesso a todo o escopo dos recursos do Mission Control, incluindo o pacote de mecanismo de recuperação autônoma.

O NVIDIA Mission Control inclui acesso às inovações mais recentes da NVIDIA em otimização de energia em um workflow validado com interfaces gráficas fáceis de usar para monitorar e gerenciar ações no nível de cluster, sistema e workload. Com o Mission Control, os administradores podem acessar o serviço de energia de domínio e definir políticas dinâmicas para todo o cluster, conscientes de tarefas para otimizar a energia.

Benefícios

Por que o NVIDIA Mission Control?

Agilidade Operacional Instantânea

Leve a agilidade para as operações de fábricas de IA com treinamento perfeito de vários nós e orquestração de inferência, flexibilidade para integrar a software de terceiros e automação avançada de energia e resfriamento.

Monitoramento Extensivo

Obtenha visibilidade profunda do tempo de atividade de workload, da infraestrutura de clusters e das instalações com os painéis Grafana integrados e prontos para uso e verificações de integridade sempre ativas que reduzem a fadiga dos alertas e otimizam o desempenho.

Resiliência Incorporada

Redefina a resiliência de um Data Center moderno com um mecanismo de recuperação autônoma de ponta a ponta que abrange desde a detecção de anomalias até o isolamento, passando pela reinicialização rápida de tarefas e remediação de hardware automatizada.

Produção Acelerada de Tokens de IA

Maximize a produção da AI factory com workflows validados de ponta a ponta, operações contínuas para melhorar o potencial de receita e o NVIDIA Enterprise Support para um novo padrão de IA empresarial em escala.

Parceiros

Implantar e Executar Fábricas de IA Com os Principais Provedores de Sistemas

Configure, valide e opere fábricas de IA criadas com a NVIDIA Grace™ Blackwell NVL72 dos principais provedores de sistemas que testaram e validaram o NVIDIA Mission Control para seus sistemas.

Soluções

Tudo Que Você Precisa para uma Fábrica de IA de Nível Mundial

A NVIDIA oferece todas as bases para uma fábrica de IA. Juntos, o NVIDIA Mission Control e o NVIDIA AI Enterprise fornecem infraestrutura de ponta e gerenciamento de workload, além de ferramentas de desenvolvedor para IA de produção, permitindo que as empresas aproveitem o poder transformador da IA com uma escala prática sem precedentes.

NVIDIA DGX SuperPOD

Infraestrutura líder criada especificamente para as demandas exclusivas da IA.

A NVIDIA DGX SuperPOD™ é uma solução de infraestrutura de data center com IA pronta para uso que oferece desempenho excepcional para todos os usuários e cargas de trabalho. Configurável com qualquer sistema NVIDIA DGX™, o DGX SuperPOD fornece infraestrutura acelerada de nível superior com desempenho escalável para as cargas de trabalho de treinamento e inferência de IA mais exigentes.

NVIDIA AI Enterprise

Plataforma de software nativa do cloud que otimiza a IA de produção com ferramentas criadas para desenvolvedores.

O pacote de software NVIDIA AI Enterprise oferece as melhores ferramentas de ciência de dados da NVIDIA, modelos pré-treinados, frameworks otimizados e muito mais, com suporte total da NVIDIA ao nível empresarial. O NVIDIA AI Enterprise é otimizado para ser executado no Mission Control.

Próximos Passos

Que Tal Começar Agora?

Desbloqueie as operações de IA simplificadas com o NVIDIA Mission Control para impulsionar o projeto de IA da sua empresa.

Precisa de Suporte para o NVIDIA Mission Control?

Obtenha suporte especializado, resultados mais rápidos e orientação com o suporte e os serviços empresariais NVIDIA DGX.

Documentação do NVIDIA Mission Control

Acesse guias de usuário e notas de versão do NVIDIA Mission Control.