IA Física

NVIDIA Cosmos

Uma plataforma aberta para IA física com world foundation models (WFMs), bibliotecas de processamento de dados de vídeo, avaliação de vídeo e frameworks de pós-treinamento.

Cookbook   |   Documentação   |   Discord

World Foundation Models

Modelos Abertos para Geração e Compreensão do Mundo

Cosmos Predict

Principal modelo de geração de mundo, adaptável a qualquer tarefa ou ambiente de IA física.

Gere mundos de vídeo preditivos de 30 segundos a partir de texto, imagem ou vídeo com modelos 2B/14B, ou realize pós-treinamento com seus dados para criar casos de edge personalizados, políticas em loop fechado e simulações multiview centradas em robôs.

Cosmos Transfer

Modelo de multicontrole para transformação de simulação em fotorrealismo.

Emparelhe com frameworks de simulação de IA física, como CARLA ou NVIDIA Isaac Sim™, para acelerar a geração de dados sintéticos em ambientes e condições de iluminação variadas.

Cosmos Reason

Modelo de linguagem de visão (VLM) líder que permite que robôs e agentes de IA de visão raciocinem como humanos.

Combina conhecimento prévio, física e senso comum para gerar alertas em tempo real e insights práticos em segurança pública, monitoramento de tráfego, logística, inspeção de qualidade e IA física.

Processamento e Avaliação de Dados

Acelere o processamento e a avaliação eficientes de conjuntos de dados.

Cosmos Curator

Filtre, anote e elimine duplicações em grandes volumes de dados de sensores rapidamente rapidamente com o Cosmos Curator.

Cosmos Dataset Search

Consulte conjuntos de dados e recupere cenários instantaneamente com o NVIDIA Cosmos Dataset Search (CDS).

Cosmos Evaluator

Analise e avalie os resultados de vídeo generativo em escala usando o Cosmos Evaluator.

Casos de Uso

Como a Cosmos Acelera a IA em Todos os Setores

Use os WFMs do Cosmos para simular, raciocinar e gerar dados para pipelines downstream em robótica, veículos autônomos e sistemas de visão industrial.

Aprendizagem de Robôs

Crie modelos de mundo personalizados para tarefas subsequentes, ambientes, layouts de câmeras ou sensores e políticas.

  • Realize o pós-treinamento do Cosmos Predict para visões específicas de robôs ou políticas de controle.
  • Gere dados sintéticos em ambientes e condições de iluminação variadas com o Cosmos Transfer
  • Realize o pós-treinamento do Cosmos Reason usando o framework Cosmos RL para criar modelos de visão-linguagem-ação (VLA)
  • Crie um pipeline de aumento e avaliação de dados sintéticos de ponta a ponta usando o Physical AI Data Factory Blueprint, desenvolvido com base no Cosmos

Treinamento de Veículos Autônomos

Gere dados de sensores personalizados, diversos e de alta fidelidade para treinar, testar e validar veículos autônomos com segurança.

  • Amplifique a diversidade dos dados existentes com novos dados de clima, iluminação e geolocalização usando o Cosmos Transfer
  • Expanda para visualizações de vários sensores usando o Cosmos Predict
  • Crie um pipeline de aumento e avaliação de dados sintéticos de ponta a ponta usando o Physical AI Data Factory Blueprint, desenvolvido com base no Cosmos

Agentes de IA para Análise de Vídeo

Aprimore a automação, a segurança e a eficiência operacional em ambientes industriais e urbanos. 

Com o Cosmos Reason, os agentes de IA podem analisar, resumir e interagir com fluxos de vídeo em tempo real ou gravados para:

  • Ofereça respostas a perguntas e alertas em tempo real
  • Forneça perspectivas contextuais ricas
  • Extraia insights a partir de dados de vídeo em larga escala com o NVIDIA Blueprint para pesquisa e resumo de vídeos

Opções de Início

Comece Agora com o NVIDIA Cosmos

1

Que tal começar a construir? Acesse modelos abertos e código diretamente

2

Precisa de mais tempo de planejamento? Experimente os modelos do Cosmos em nosso catálogo hospedado.

3

Precisa de ajuda? Comece rapidamente com nossas receitas de modelos práticos.

IA Confiável

Apoio à Comunidade de IA Física

Os modelos, guardrails e tokenizadores do Cosmos estão disponíveis na Hugging Face e no GitHub, com recursos para enfrentar a escassez de dados no treinamento de modelos de IA física.

Infraestrutura de AI

Obtenha o Melhor Desempenho com a NVIDIA Blackwell

As NVIDIA RTX PRO 6000 Blackwell Series Servers aceleram o desenvolvimento de IA física para robôs, veículos autônomos e agentes de IA em treinamento, geração de dados sintéticos, simulação e inferência.

Obtenha o desempenho máximo para os world foundation models do Cosmos na NVIDIA Blackwell GB200 para cargas de trabalho industriais de pós-treinamento e inferência.

Ecossistema

Adotado pelos Principais Inovadores de IA Física

Os desenvolvedores de modelos dos setores de robótica, veículos autônomos e IA de visão estão usando o Cosmos para acelerar o desenvolvimento da IA física.

Próximos Passos

Junte-se à Comunidade Cosmos.

Conecte-se com especialistas do Cosmos, interaja com outros desenvolvedores, forneça feedback de modelos e acesse a aprendizagem contínua por meio de livestreams e receitas.

Cosmos Cookbook

Um guia abrangente para trabalhar com o ecossistema NVIDIA Cosmos para aplicações reais e específicas de domínio em robótica, simulação, sistemas autônomos e compreensão de cenas físicas.

Crie Agentes de IA para Análise de Vídeo

Use o Cosmos Reason com o NVIDIA Blueprint para pesquisa e resumo de vídeo (VSS) para criar agentes de IA para compreensão de vídeo escalável e em tempo real.

Recursos

O Mais Recente dos Desenvolvedores do Cosmos

Perguntas Frequentes

[22 de janeiro de 2026] Pesquisa lançada sobre o Cosmos Policy, que se baseia no Cosmos Predict-2 para controle visuomotor e planejamento.

[9 de fevereiro de 2026] Suporte a computação, quantização e compatibilidade com CUDA aprimorados para o novo Cosmos Reason 2.

[19 de dezembro de 2025] Suporte a Diffusers para o Cosmos-Predict2.5-2B lançado via Hugging Face, checkpoint do modelo destilado Cosmos-Predict2.5-2B Text2World no Hugging Face e guia de destilação.

[19 de dezembro de 2025] Recursos Image2Image e ImagePrompt lançados para o Cosmos Transfer 2.5. Veja o guia de inferência aqui.

Explore o GitHub para saber mais.

Os WFMs do Cosmos estão disponíveis sob uma Licença de Modelo Aberto da NVIDIA para todos.

Consulte o novo Cosmos Cookbook, que contém receitas passo a passo e roteiros de pós-treinamento para criar, personalizar e implantar rapidamente os world foundation models do Cosmos da NVIDIA para robótica e sistemas autônomos.

Sim, você pode aproveitar o Cosmos para criar, a partir do zero, com seu foundation model ou arquitetura de modelo preferida. Você pode começar usando o Cosmos Curator para pré-processamento de dados de vídeo. Depois, compacte e decodifique seus dados com o tokenizador do Cosmos. Depois de processar os dados, você pode treinar ou ajustar seu modelo. 

Com os microsserviços NVIDIA NIM™, você pode integrar facilmente seus modelos de IA física em suas aplicações na nuvem, data centers e workstations.

Você também pode usar o NVIDIA DGX Cloud para treinar modelos de IA e implantá-los em qualquer lugar, em escala.

Os três são WFMs com funções distintas:

  • O Cosmos Predict gera diversas cenas de vídeo a partir de prompts de texto, imagem ou vídeo, ideais para pós-treinamento em assuntos como robôs ou carros autônomos.
  • O Cosmos Transfer aplica a transferência de estilo de vários controles, mudando a iluminação e os ambientes, em vídeos baseados em física, geralmente criados em simuladores como o NVIDIA Omniverse™.
  • O Cosmos Reason responde a consultas raciocinando sobre entradas de vídeo e imagens. A Cosmos Reason pode gerar novos e diversos textos a partir de um vídeo inicial para o Cosmos Predict, ou criticar e anotar dados sintéticos da Predict e Transfer.

O Omniverse cria simulações 3D realistas de tarefas do mundo real usando diferentes APIs generativas, SDKs e a tecnologia de renderização NVIDIA RTX.

Os desenvolvedores podem inserir simulações do Omniverse como vídeos instrutivos em modelos da Cosmos Transfer para gerar dados sintéticos fotorreais controláveis.

Juntos, o Omniverse fornece o ambiente de simulação antes e depois do treinamento, enquanto o Cosmos fornece os foundation models para gerar dados de vídeo e treinar modelos de IA física.

Saiba mais sobre o NVIDIA Omniverse.