Geração de dados sintéticos para IA Física

Acelere o desenvolvimento de workflows de IA Física.

Cargas de Trabalho

Simulação/Modelagem/Design
Robótica
IA Generativa

Setores

Todos os setores

Objetivo do Negócio

Inovação

Visão Geral

Por que usar dados sintéticos?

O desenvolvimento de modelos de IA física requer conjuntos de dados cuidadosamente rotulados, de alta qualidade e diversificados para alcançar a precisão e o desempenho desejados. Em muitos casos, os dados são limitados, restritos ou indisponíveis. Coletar e rotular esses dados de situações reais é demorado, caro e dificulta o desenvolvimento de modelos de IA Física.

Os dados sintéticos, gerados por simulação computacional, modelos de IA generativa ou pela combinação de ambos, podem contribuir para resolver esse desafio. Os dados sintéticos podem ser compostos por texto, vídeos e imagens 2D ou 3D em espectros visuais e não visuais, que podem ser usados em conjunto com dados reais para treinar modelos de IA física multimodal. Isso pode economizar muito tempo de treinamento e reduzir bastante os custos.

Rapidez no treinamento de modelos de IA

Supere a lacuna de dados e acelere o desenvolvimento de modelos de IA, reduzindo o custo geral de aquisição e rotulagem de dados necessários para o treinamento de modelos.

Privacidade e segurança

Resolva problemas de privacidade e reduza o viés gerando diversos conjuntos de dados sintéticos para representar o mundo real.

Precisão

Crie modelos de IA generalizados e altamente precisos, treinando com dados diversificados que incluem casos extremos raros, porém cruciais, que de outra forma são impossíveis de coletar.

Escalonável

Gere dados de forma processual com pipelines automatizados que escalam com seu caso de uso em vários setores, incluindo manufatura, automotivo, robótica e muito mais. 

4 Passos para a Geração de Dados Sintéticos

Saiba como criar e orquestrar workflows de SDG de ponta a ponta com o NVIDIA Isaac Sim e o NVIDIA OSMO.

Dados sintéticos para o desenvolvimento de IA Física

Os modelos de IA Física permitem que os sistemas autônomos percebam, entendam, interajam e percorram o mundo físico. Os dados sintéticos são fundamentais para o treinamento e o teste de modelos de IA física.

World Models

Os world foundation models (WFM), ou modelos de mundo, utilizam diversos dados de entrada, incluindo texto, imagens, vídeos e informações de movimento, para gerar e simular mundos virtuais com precisão notável.   

Esses modelos são caracterizados por seus recursos de generalização excepcionais, exigindo ajuste fino mínimo para várias aplicações. Eles servem como mecanismos cognitivos para robôs e veículos autônomos, utilizando seu entendimento profundo da dinâmica real. Para alcançar esse nível de sofisticação, esses modelos dependem de grandes quantidades de dados de treinamento. 

O desenvolvimento de world foundation models se beneficia significativamente da geração de dados sintéticos infinitos por meio de simulações fisicamente precisas. Essa abordagem não apenas acelera o processo de treinamento de modelos, mas também aprimora a capacidade do modelo de generalizar em diversos cenários. As técnicas de randomização de domínio aumentam ainda mais esse processo, permitindo a manipulação de inúmeros parâmetros, como iluminação, fundo, cor, localização e ambiente, variações que seriam quase impossíveis de capturar de forma abrangente apenas com dados reais.

Treinamento de política robótica

A aprendizagem de robôs engloba uma variedade de algoritmos e metodologias que permitem que um robô adquira novas habilidades, incluindo manipulação, locomoção e classificação, em ambientes simulados ou reais. Aprendizagem por reforço, aprendizagem por imitação e política de difusão são as principais metodologias aplicadas para treinar robôs.

Uma habilidade importante para robôs é a manipulação: pegar, classificar e montar itens, semelhante ao que você vê em fábricas. As demonstrações humanas do mundo real são geralmente usadas como dados de entrada para o treinamento. No entanto, a coleta de um conjunto de dados grande e diversificado tem altos custos.

Para superar esse desafio, os desenvolvedores podem utilizar os blueprints NVIDIA Isaac GR00T-Mimic e GR00T-Dreams, criados com base no NVIDIA Cosmos™, para gerar grandes e diversificados conjuntos sintéticos de dados de movimento para treinamento.

O blueprint NVIDIA Isaac GR00T-Dreams gera grandes quantidades de dados de trajetórias sintéticas usando o Cosmos, baseados em uma única imagem e instruções de linguagem. Isso permite que os robôs aprendam novas tarefas em ambientes desconhecidos sem a necessidade de dados específicos de teleoperação.

O blueprint NVIDIA Isaac GR00T-Mimic gera grandes quantidades de dados de trajetórias sintéticas a partir de apenas algumas demonstrações humanas. Isso permite que os robôs melhorem sua manipulação em uma tarefa e um ambiente conhecidos.

Esses conjuntos de dados podem ser usados para treinar os modelos de base aberta do Isaac GR00T no Isaac Lab, permitindo raciocínio humanoide generalizado e aquisição robusta de habilidades.

Teste e validação

Os testes de software-in-loop (SIL) são um estágio crucial para robôs com IA e veículos autônomos, onde o software de controle é avaliado em um ambiente simulado, em vez de em hardware real.

Os dados sintéticos gerados pela simulação garantem a modelagem precisa da física do mundo real, incluindo entradas de sensores, dinâmica de atuadores e interações ambientais. Isso também oferece uma forma de capturar cenários raros que seriam perigosos para coletar no mundo real. Isso garante que o stack de software do robô na simulação se comporte como se fosse no robô físico, permitindo fazer testes e validação minuciosos sem a necessidade de hardware físico.

Os dados sintéticos dessas simulações são alimentados de volta para os cérebros de robôs. O cérebro do robô processa os resultados, decidindo a próxima ação. Esse ciclo continua com a Mega rastreando com precisão o estado e a posição de todos os ativos no gêmeo digital.


Implementação técnica

Geração de dados sintéticos para IA Física

  • Criação de cena: uma cena 3D abrangente serve como base, incorporando ativos essenciais, como prateleiras, caixas e paletes para armazéns, bem como árvores, estradas e edifícios para ambientes externos. Agora os desenvolvedores podem usar o NVIDIA NuRec, um conjunto de APIs e bibliotecas para gerar simulações neurais a partir de dados reais para acelerar o processo de criação de cenas. Esses ambientes podem ser preenchidos e aprimorados dinamicamente usando os microsserviços NVIDIA NIM™ para Universal Scene Description (OpenUSD), permitindo a adição perfeita de diversos objetos e a integração de fundos de HDRI de 360°. Em alguns casos, uma cena 3D pode não ser necessária. O GR00T-Dreams usa os WFMs para gerar novos ambientes.
  • Randomização de domínios: USD Code NIM é um LLM de ponta especializado em OpenUSD para realizar a randomização de domínios. Essa ferramenta poderosa não apenas responde a consultas relacionadas ao OpenUSD, mas também gera código USD Python para fazer alterações na cena, simplificando o processo de alteração programática de vários parâmetros de cena em aplicações de Gêmeo Digital baseadas em OpenUSD que aproveitam as bibliotecas NVIDIA Omniverse™.
  • Geração de dados: o terceiro passo envolve exportar o conjunto inicial de imagens anotadas. As bibliotecas do Omniverse oferecem uma ampla variedade de funcionalidades de anotação pré-criadas, incluindo caixas de limite 2D, segmentação semântica, mapas de profundidade, normais de superfície e muitos outros. A escolha do formato de saída, como caixas delimitadoras ou animações, depende dos requisitos específicos do modelo ou do caso de uso.
  • Aumento de dados: na próxima etapa, os desenvolvedores podem aproveitar os world foundation models (WFMs) do NVIDIA Cosmos, como o Cosmos Transfer, para aumentar ainda mais a imagem do 3D para o real. Isso traz o fotorrealismo necessário às imagens geradas por meio de prompts simples do usuário.
  • Avaliação de dados: os dados sintéticos geralmente podem conter artefatos ou imprecisões. Na última etapa, os desenvolvedores podem usar o Cosmos Evaluator para obter pontuação automatizada e consistente de resultados generativos, para que as equipes possam usar dados sintéticos com confiança antes de inicializar modelos de IA.

Comece Agora

Crie seu próprio pipeline de SDG para simulações de robótica, inspeção industrial e outros casos de uso de IA física com o NVIDIA Isaac Sim™.

Servidor RTX PRO: a Melhor Plataforma para IA Industrial e Física

O Servidor NVIDIA RTX PRO acelera todas as cargas de trabalho de digitalização industrial, simulação de robôs e geração de dados sintéticos.