NVIDIA Run:ai

A plataforma empresarial para cargas de trabalho de IA e orquestração de GPU.

Comece Agora

Documentação | Visão Geral da Solução | Encontre um Parceiro

Visão Geral
Recursos
Desempenho
Soluções
Benefícios
Casos de Uso
Tecnologia
Parceiros
Próximos Passos

Visão Geral
Recursos
Desempenho
Soluções
Benefícios
Casos de Uso
Tecnologia
Parceiros
Próximos Passos

Fale Conosco

Visão Geral

Acelere Workflows de IA com Orquestração Dinâmica

O NVIDIA Run:ai acelera as operações de IA e Machine Learning, abordando os principais desafios de infraestrutura por meio da alocação dinâmica de recursos, suporte abrangente ao ciclo de vida da IA e gerenciamento estratégico de recursos. Ao reunir recursos em ambientes e utilizar orquestração avançada, o NVIDIA Run:ai melhora significativamente a eficiência da GPU e a capacidade do workload. Com suporte para nuvens públicas, nuvens privadas, ambientes híbridos ou data centers locais, a NVIDIA Run:ai fornece flexibilidade e adaptabilidade inigualáveis.

O Que é Orquestração Inteligente?

Saiba como a orquestração de cargas de trabalho nativas de IA maximiza a eficiência da GPU, simplifica o gerenciamento da infraestrutura de IA e dimensiona as cargas de trabalho de IA perfeitamente em ambientes híbridos e multi-cloud.

Leia o Resumo da Solução

O Que É a NVIDIA Run:ai?

A NVIDIA Run:ai acelera as operações de IA com orquestração dinâmica durante todo o ciclo de vida de IA, maximizando a eficiência da GPU, dimensionando cargas de trabalho e integrando-se perfeitamente à infraestrutura de IA híbrida com zero esforço manual.

A NVIDIA Run:ai oferece uma jornada perfeita pelo ciclo de vida de IA, orquestração avançada de cargas de trabalho de IA com orquestração de GPU e um poderoso mecanismo de políticas que transforma o gerenciamento de recursos em um ativo estratégico, garantindo utilização ideal e alinhamento com objetivos de negócios.

NVIDIA Run:ai para Operações de IA Escaláveis

O NVIDIA Run:ai, agora parte do NVIDIA AI Enterprise, simplifica a execução de cargas de trabalho de IA em escala. Ele maximiza a utilização das GPUs, aumenta a taxa de processamento das cargas de trabalho e centraliza políticas e governança para oferecer operações de IA seguras, confiáveis e eficientes em treinamento, experimentação e inferência.

Saiba Mais

Recursos

Workload de IA e Orquestração de GPU Para Criar, Treinar e Implantar Cargas de Trabalho de IA em Escala

Orquestração de Workload Nativo de IA

Centralize e automatize a execução de workloads de IA em ambientes distribuídos, transformando a infraestrutura fragmentada em uma fábrica de IA escalável.

Alocação Dinâmica de GPU

Garanta que cada GPU ofereça valor máximo, combinando dinamicamente recursos à demanda de workload em tempo real.

Governança Orientada por Políticas

Execute cargas de trabalho de IA de forma segura e eficiente em departamentos, projetos e equipes com governança centralizada e orientada por políticas que garante acesso justo, priorizado e confiável aos recursos de GPU.

Arquitetura Aberta

Criado com uma abordagem de API em primeiro lugar, a NVIDIA Run:ai garante a integração perfeita com todos os principais frameworks de IA, ferramentas de machine learning e soluções de terceiros.

Desempenho

Aceleração de IA em Situações Reais: Orquestração de GPU Comprovada em Escala

Agendamento dinâmico e orquestração que aceleram a taxa de transferência de IA, oferecem escalabilidade perfeita e maximizam a utilização da GPU.

10x

Disponibilidade da GPU

20x

Cargas de Trabalho em Execução

Utilização da GPU

Intervenção Manual

Soluções

Soluções de Código Aberto da NVIDIA Run:ai

Agendamento justo e eficiente de workloads de IA em escala no Kubernetes com o KAI Scheduler

Com base no NVIDIA Run:ai, o KAI Scheduler de código aberto se integra a técnicas comuns do Kubernetes, utilizando arquivos YAML para gerenciamento simples e flexível de cargas de trabalho de IA. Ideal para desenvolvedores e pequenas equipes, ele fornece uma solução eficiente para orquestrar recursos de IA.

Agendamento Sem Dificuldades e de Código Aberto para Kubernetes

Serviço Otimizado por Topologia no Kubernetes com Grove

A Grove une os frameworks de inferência de IA e o agendamento no Kubernetes, permitindo a escalabilidade eficiente e a ordem de inicialização declarativa de componentes interdependentes por meio de um recurso personalizado unificado. O Grove gera automaticamente restrições de agendamento que os agendadores do Kubernetes, como o KAI Scheduler, interpretam para implantações com reconhecimento de topologia e agendamento em grupo (gang-scheduling). Um componente modular do NVIDIA Dynamo, o Grove também pode ser executado de forma autônoma ou se integrar a outros Frameworks de inferência.

Descubra como o Grove funciona

Reduza os tempos de carregamento de modelos de minutos a segundos com o NVIDIA Run:ai Model Streamer

O Model Streamer é um SDK Python com um backend C++ de alto desempenho projetado para acelerar o carregamento de modelos em cargas de trabalho de inferência. Ele usa vários threads para ler tensores simultaneamente de qualquer tipo de armazenamento, transferindo-os diretamente para a memória da GPU. Ao saturar a largura de banda de armazenamento disponível, o Model Streamer reduz significativamente o tempo necessário para carregar modelos.

Veja os Resultados do Benchmark

Benefícios

Desbloqueio de Todo o Potencial da Infraestrutura de IA

Criado especificamente para agendamento de IA e gerenciamento de infraestrutura, a NVIDIA Run:ai acelera as cargas de trabalho de IA durante todo o ciclo de vida de IA para tempo de retorno mais rápido.

Maximize a Utilização da GPU, Minimize Custos e Impulsione a Eficiência de IA

A NVIDIA Run:ai reúne e orquestra dinamicamente recursos de GPU em ambientes híbridos. Ao eliminar o desperdício, maximizar a utilização de recursos e alinhar a capacidade de computação com prioridades de negócios, as empresas alcançam ROI superior, custos operacionais reduzidos e escalonamento mais rápido de iniciativas de IA.

Acelere a IA Perfeitamente, Do Desenvolvimento à Implantação

A NVIDIA Run:ai permite transições perfeitas durante todo o ciclo de vida de IA, do desenvolvimento ao treinamento e à implantação. Ao orquestrar recursos e integrar diversas ferramentas de IA em um pipeline unificado, a plataforma reduz gargalos, encurta os ciclos de desenvolvimento e dimensiona soluções de IA para produção mais rapidamente, proporcionando resultados de negócios tangíveis.

Orquestração Centralizada para Controle Completo de IA

A NVIDIA Run:ai fornece visibilidade e controle de ponta a ponta sobre a infraestrutura de IA distribuída, cargas de trabalho e usuários. Sua orquestração centralizada unifica recursos de cloud, locais e ambientes híbridos, capacitando empresas com insights acionáveis, governança orientada por políticas e gerenciamento de recursos detalhado para operações de IA eficientes e escalonáveis.

Integração Flexível em Qualquer Ambiente

A NVIDIA Run:ai suporta fábricas modernas de IA com flexibilidade e disponibilidade inigualáveis. Sua arquitetura aberta integra-se perfeitamente a qualquer ferramenta de machine learning, frameworks ou infraestrutura, seja em clouds públicos, clouds privados, ambientes híbridos ou data centers locais.

Casos de Uso

Aceleração de Cargas de Trabalho de IA com Orquestração Inteligente

Criado especificamente para cargas de trabalho de IA, a NVIDIA Run:ai oferece orquestração inteligente que maximiza a eficiência da computação e dimensiona dinamicamente o treinamento e a inferência de IA.

Relatório da Pesquisa

Estado da IA em Telecomunicações

A pesquisa de 2026 explora como as empresas de telecomunicações estão investindo em, implantando e se beneficiando da IA.

Faça o Download Agora

IA Escalonada
Inferência Fracionária
Mitigando o Início a Frio

Aceleração de IA Empresarial

A NVIDIA Run:ai permite que as empresas dimensionem cargas de trabalho de IA com eficiência, reduzindo custos e melhorando os ciclos de desenvolvimento de IA. Ao alocar dinamicamente recursos de GPU, as empresas podem maximizar a utilização da computação, reduzir o tempo de inatividade e acelerar iniciativas de machine learning. A NVIDIA Run:ai também simplifica as operações de IA, fornecendo uma interface de gerenciamento unificada, permitindo a colaboração perfeita entre cientistas de dados, engenheiros e equipes de IT.

Assista ao Vídeo (08:02)

Maximizando a taxa de transferência de tokens

Execute diversas cargas de trabalho de IA simultaneamente em infraestrutura de GPU compartilhada para aumentar significativamente a taxa de transferência e a utilização totais. Ao alocar fracionariamente GPUs em tarefas de inferência, incorporação e geração, as organizações podem executar mais modelos em paralelo sem disputa de recursos. Em comparação com a execução completa de GPU em um único modelo, as cargas de trabalho mistas oferecem taxa de transferência agregada significativamente maior no nível de GPU, host e cluster, maximizando a eficiência da infraestrutura e acelerando a produção de IA em todas as equipes.

Leia o Blog

Mitigando o Início a Frio de Modelos

Reduza os custos de implantação de modelos sem sacrificar o desempenho, trocando dinamicamente a memória de modelos entre a GPU e o host. A abordagem de troca de memória da GPU da NVIDIA mantém as partes ativas do modelo residentes na GPU, enquanto pagina de forma transparente as porções inativas, permitindo que modelos maiores sejam executados em menos GPUs. Isso reduz os gastos com infraestrutura, reduz a capacidade ociosa e oferece suporte à inferência econômica para implantações de produção, especialmente para cargas de trabalho de grandes modelos de linguagem com uso intensivo de memória.

Leia o Blog

Tecnologia

Entrega de Operações de IA Aceleradas com Orquestração Dinâmica em Toda a NVIDIA

O NVIDIA Run:ai traz orquestração e agendamento avançados para as plataformas de IA da NVIDIA, permitindo que as empresas escalem as operações de IA com complexidade mínima e desempenho máximo.

NVIDIA AI Enterprise

O NVIDIA AI Enterprise acelera e simplifica o desenvolvimento e a implantação de aplicações de IA de produção. Ele reduz o tempo de lançamento no mercado e reduz os custos de infraestrutura, garantindo operações confiáveis, seguras e escaláveis. O NVIDIA AI Enterprise agora inclui o NVIDIA Run:ai.

Saiba Mais

NVIDIA Mission Control

O NVIDIA Mission Control simplifica as operações de IA, oferecendo agilidade instantânea, resiliência de infraestrutura e eficiência de hiperescala. Ele acelera a experimentação de IA para empresas com inteligência de software de pacote completo, que inclui a tecnologia NVIDIA Run:ai.

Saiba Mais

Design Validado do NVIDIA Enterprise AI Factory

A NVIDIA está capacitando as empresas a criar fábricas de IA econômicas, escaláveis e de alto desempenho, equipando-as para atender à próxima revolução industrial.

Saiba Mais

NVIDIA Cloud Accelerator

Crie e opere as principais fábricas de IA em nuvem com o NVIDIA Cloud Accelerator, um portfólio de software de código aberto, modular e componível por design que ajuda os parceiros a criar e operar fábricas de IA em escala de forma confiável, eficiente e segura.

Saiba Mais

Parceiros

Quem São Nossos Parceiros

Entre em contato com seu provedor preferido ou acesse a Rede de Parceiros da NVIDIA para descobrir os principais provedores de ecossistemas que oferecem integrações do NVIDIA Run:ai com suas soluções.