Generación de datos sintéticos para la IA física

Acelerar el desarrollo de flujos de trabajo de IA física.

Cargas de trabajo

Simulación/modelado/diseño
Robótica
IA generativa

Sectores

Todos los sectores

Objetivo comercial

Innovación

Productos

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Descripción

¿Por qué usar datos sintéticos?

El desarrollo de modelos de IA física requiere conjuntos de datos diversos, de alta calidad y cuidadosamente etiquetados para lograr la precisión y el rendimiento deseados. En muchos casos, hay pocos o ningún dato, o estos están restringidos. La recopilación y el etiquetado de estos datos reales requieren mucho tiempo, son costosos y dificultan el desarrollo de modelos de IA física. 

Los datos sintéticos, generados a partir de una simulación por ordenador, modelos de IA generativa o una combinación de ambos, pueden ayudar a abordar este desafío. Los datos sintéticos pueden incluir texto, vídeos e imágenes 2D o 3D en espectros visuales y no visuales, que se pueden utilizar junto con datos reales para entrenar modelos de IA física multimodal. Esto puede ahorrar una cantidad significativa de tiempo de entrenamiento y reducir considerablemente los costes.

Velocidad de entrenamiento de modelos de IA

Supere la brecha de datos y acelere el desarrollo de modelos de IA al tiempo que reduce el coste general de adquisición y etiquetado de datos necesarios para el entrenamiento de modelos.

Privacidad y seguridad

Aborda los problemas de privacidad y reduce el sesgo que generan diversos conjuntos de datos sintéticos para representar el mundo real.

Precisión

Crea modelos de IA generalizados y altamente precisos entrenando con datos diversos que incluyen casos inusuales, pero cruciales, que de otra manera son imposibles de recopilar.

Escalable

Genere datos relativos al proceso con canalizaciones automatizadas que se adaptan a su caso de uso en diversos sectores, como fabricación, automoción, robótica y mucho más.

Datos sintéticos para el desarrollo de IA física

Los modelos de IA física permiten a los sistemas autónomos percibir, comprender, interactuar con el mundo físico y navegar por él. Los datos sintéticos son fundamentales para entrenar y probar modelos de IA física.

Modelos mundiales

Los modelos mundiales utilizan diversos datos de entrada, incluidos texto, imágenes, vídeos e información de movimiento, para generar y simular mundos virtuales con una precisión extraordinaria.   

Los modelos mundiales se caracterizan por sus excepcionales capacidades de generalización, que requieren un ajuste mínimo para diversas aplicaciones. Sirven como motores cognitivos para robots y vehículos autónomos, aprovechando su comprensión integral de la dinámica del mundo real. Para lograr este nivel de sofisticación, los modelos mundiales dependen de grandes cantidades de datos de entrenamiento. 

El desarrollo de modelos mundiales se beneficia significativamente de la generación de datos sintéticos infinitos a través de simulaciones físicamente precisas. Este enfoque no solo acelera el proceso de entrenamiento de modelos, sino que también mejora la capacidad de generalización de un modelo en diversos escenarios. Las técnicas de aleatorización de dominios refuerzan aún más este proceso al permitir la manipulación de numerosos parámetros, como iluminación, fondo, color, ubicación y entorno, variaciones que serían casi imposibles de capturar de forma exhaustiva únicamente con datos reales.

Entrenamiento de políticas de robots

El aprendizaje robótico abarca una gama de algoritmos y metodologías que permiten a un robot adquirir nuevas habilidades, como manipulación, locomoción y clasificación, en entornos simulados o reales. El aprendizaje por refuerzo, el aprendizaje de imitación y la política de difusión son las metodologías clave aplicadas para entrenar robots.

Una habilidad importante para los robots es la manipulación, es decir, recoger, clasificar y montar artículos, algo similar a lo que se ve en las fábricas. Las demostraciones humanas del mundo real se utilizan normalmente como entrada para el entrenamiento. Sin embargo, la recopilación de un conjunto de datos de gran tamaño y diverso resulta bastante costosa.

Para superar este desafío, los desarrolladores pueden utilizar los blueprints NVIDIA Isaac GR00T-Mimic y GR00T-Dreams, basados en NVIDIA Cosmos™, para generar conjuntos de datos de movimiento sintéticos de gran tamaño y diversos para el entrenamiento.

El blueprint de NVIDIA Isaac GR00T-Dreams genera grandes cantidades de datos de trayectoria sintéticos utilizando Cosmos a partir de una única imagen e instrucciones en lenguaje natural. Esto permite a los robots aprender nuevas tareas en entornos desconocidos sin necesidad de datos específicos de teleoperación.

El blueprint de NVIDIA Isaac GR00T-Mimic genera enormes cantidades de datos de trayectoria sintéticos a partir de tan solo un puñado de demostraciones humanas. Esto permite a los robots mejorar su capacidad de manipulación en tareas y entornos conocidos.

Estos conjuntos de datos se pueden utilizar para entrenar los modelos de base abiertos Isaac GR00T dentro de Isaac Lab, lo que permite un razonamiento humanoide generalizado y una adquisición sólida de habilidades.

Pruebas y validación

Las pruebas de software in loop (SIL) son una etapa crucial para los robots y los vehículos autónomos con tecnología de IA, en las que el software de control se evalúa en un entorno simulado en lugar de en hardware real.

Los datos sintéticos generados a partir de simulación garantizan un modelado preciso de la física del mundo real, incluidas las entradas de sensores, la dinámica de actuadores y las interacciones medioambientales. Esto también proporciona una forma de capturar escenarios raros que son peligrosos de recopilar en el mundo real. Esto garantiza que la pila de software del robot en la simulación se comporte como si fuera el robot físico, lo que permite pruebas y validación exhaustivas sin necesidad de hardware físico.  

Los datos sintéticos de estas simulaciones se vuelven a introducir en el cerebro de los robots. Los cerebros de los robots perciben los resultados y deciden la siguiente acción. Este ciclo continúa con el seguimiento preciso de Mega del estado y la posición de todos los activos en el gemelo digital.

Cómo crear una canalización de SDG habilitada por IA generativa

La IA generativa puede acelerar considerablemente el proceso de generación de datos sintéticos físicamente precisos a escala. Los desarrolladores pueden empezar a utilizar la IA generativa para los SDG con un flujo de trabajo de referencia paso a paso.


Implementación técnica

Generación de datos sintéticos para la IA física

  • Creación de escenas: una escena 3D integral sirve de base e incorpora activos esenciales, como estantes, cajas y pallets para almacenes, así como árboles, carreteras y edificios para entornos exteriores. Los desarrolladores ya pueden utilizar NVIDIA NuRec, un conjunto de API y bibliotecas, para generar simulaciones neuronales a partir de datos reales y acelerar el proceso de creación de escenas. Estos entornos se pueden poblar y mejorar dinámicamente utilizando los microservicios NVIDIA NIM™ para Universal Scene Description (OpenUSD), lo que permite la adición sin problemas de diversos objetos y la integración de fondos HDRI de 360°. En algunos casos, puede que no sea necesaria una escena 3D. GR00T-Dreams aprovecha las capacidades de (WFMs) para generar nuevos entornos.
  • Randomización de dominios: Código USD NIM (USD Code NIM), un LLM de vanguardia especializado en OpenUSD, para realizar la aleatorización de dominios. Esta potente herramienta no solo responde a consultas relacionadas con OpenUSD, sino que también genera código USD Python para realizar cambios en la escena, agilizando el proceso de alteración de varios parámetros de escena dentro de NVIDIA Omniverse.
  • Generación de datos: el tercer paso implica la exportación del conjunto inicial de imágenes anotadas. Omniverse ofrece una amplia gama de anotadores integrados, entre ellos cuadros de delimitación 2D, segmentación semántica, mapas de profundidad, normales de superficie y muchos otros. La elección del formato de salida, como los cuadros de delimitación o las animaciones, depende de los requisitos del modelo o del caso de uso específicos.
  • Aumento de datos: en la etapa final, los desarrolladores pueden aprovechar los Modelos Fundamentales Mundiales (WFMs) de NVIDIA Cosmos, como Cosmos Transfer, para aumentar aún más la imagen de 3D a Real. Esto aporta el fotorrealismo necesario a las imágenes generadas a través de simples indicaciones de usuario.

Empezar

Cree su propia canalización de SDG para simulaciones robóticas, inspección industrial y otros casos de uso de IA física con NVIDIA Isaac Sim.

RTX PRO Server, la mejor plataforma para IA industrial y física

NVIDIA RTX PRO Server acelera todas las cargas de trabajo de digitalización industrial, simulación de robots y generación de datos sintéticos.