IA Física
Uma plataforma aberta para IA física com world foundation models (WFMs), bibliotecas de processamento de dados de vídeo, avaliação de vídeo e frameworks de pós-treinamento.
World Foundation Models
Principal modelo de geração de mundo, adaptável a qualquer tarefa ou ambiente de IA física.
Gere mundos de vídeo preditivos de 30 segundos a partir de texto, imagem ou vídeo com modelos 2B/14B, ou realize pós-treinamento com seus dados para criar casos de edge personalizados, políticas em loop fechado e simulações multiview centradas em robôs.
Modelo de multicontrole para transformação de simulação em fotorrealismo.
Emparelhe com frameworks de simulação de IA física, como CARLA ou NVIDIA Isaac Sim™, para acelerar a geração de dados sintéticos em ambientes e condições de iluminação variadas.
Modelo de linguagem de visão (VLM) líder que permite que robôs e agentes de IA de visão raciocinem como humanos.
Combina conhecimento prévio, física e senso comum para gerar alertas em tempo real e insights práticos em segurança pública, monitoramento de tráfego, logística, inspeção de qualidade e IA física.
Acelere o processamento e a avaliação eficientes de conjuntos de dados.
Casos de Uso
Crie modelos de mundo personalizados para tarefas subsequentes, ambientes, layouts de câmeras ou sensores e políticas.
Gere dados de sensores personalizados, diversos e de alta fidelidade para treinar, testar e validar veículos autônomos com segurança.
Aprimore a automação, a segurança e a eficiência operacional em ambientes industriais e urbanos.
Com o Cosmos Reason, os agentes de IA podem analisar, resumir e interagir com fluxos de vídeo em tempo real ou gravados para:
Opções de Início
Infraestrutura de AI
As NVIDIA RTX PRO 6000 Blackwell Series Servers aceleram o desenvolvimento de IA física para robôs, veículos autônomos e agentes de IA em treinamento, geração de dados sintéticos, simulação e inferência.
Obtenha o desempenho máximo para os world foundation models do Cosmos na NVIDIA Blackwell GB200 para cargas de trabalho industriais de pós-treinamento e inferência.
Ecossistema
Os desenvolvedores de modelos dos setores de robótica, veículos autônomos e IA de visão estão usando o Cosmos para acelerar o desenvolvimento da IA física.
Recursos
[22 de janeiro de 2026] Pesquisa lançada sobre o Cosmos Policy, que se baseia no Cosmos Predict-2 para controle visuomotor e planejamento.
[9 de fevereiro de 2026] Suporte a computação, quantização e compatibilidade com CUDA aprimorados para o novo Cosmos Reason 2.
[19 de dezembro de 2025] Suporte a Diffusers para o Cosmos-Predict2.5-2B lançado via Hugging Face, checkpoint do modelo destilado Cosmos-Predict2.5-2B Text2World no Hugging Face e guia de destilação.
[19 de dezembro de 2025] Recursos Image2Image e ImagePrompt lançados para o Cosmos Transfer 2.5. Veja o guia de inferência aqui.
Explore o GitHub para saber mais.
Os WFMs do Cosmos estão disponíveis sob uma Licença de Modelo Aberto da NVIDIA para todos.
Consulte o novo Cosmos Cookbook, que contém receitas passo a passo e roteiros de pós-treinamento para criar, personalizar e implantar rapidamente os world foundation models do Cosmos da NVIDIA para robótica e sistemas autônomos.
Sim, você pode aproveitar o Cosmos para criar, a partir do zero, com seu foundation model ou arquitetura de modelo preferida. Você pode começar usando o Cosmos Curator para pré-processamento de dados de vídeo. Depois, compacte e decodifique seus dados com o tokenizador do Cosmos. Depois de processar os dados, você pode treinar ou ajustar seu modelo.
Com os microsserviços NVIDIA NIM™, você pode integrar facilmente seus modelos de IA física em suas aplicações na nuvem, data centers e workstations.
Você também pode usar o NVIDIA DGX Cloud para treinar modelos de IA e implantá-los em qualquer lugar, em escala.
Os três são WFMs com funções distintas:
O Omniverse cria simulações 3D realistas de tarefas do mundo real usando diferentes APIs generativas, SDKs e a tecnologia de renderização NVIDIA RTX.
Os desenvolvedores podem inserir simulações do Omniverse como vídeos instrutivos em modelos da Cosmos Transfer para gerar dados sintéticos fotorreais controláveis.
Juntos, o Omniverse fornece o ambiente de simulação antes e depois do treinamento, enquanto o Cosmos fornece os foundation models para gerar dados de vídeo e treinar modelos de IA física.
Saiba mais sobre o NVIDIA Omniverse.