Generación de Datos Sintéticos (SDG)

Acelere el desarrollo de workflows de IA física y de agentes.

Cargas de Trabajo

Simulación/Modelado/Diseño
Robótica
IA Generativa

Industrias

Todas las Industrias

Objetivo Comercial

Innovación

Productos

NVIDIA Omniverse Enterprise
IA de NVIDIA
NVIDIA Isaac

Descripción General

¿Por Qué Usar Datos Sintéticos?

Los modelos de IA de entrenamiento requieren conjuntos de datos diversos, de alta calidad y cuidadosamente etiquetados para lograr la exactitud y el desempeño deseados. En muchos casos, los datos son limitados, están restringidos o no están disponibles. Recopilar y etiquetar estos datos del mundo real lleva mucho tiempo y puede ser prohibitivamente costoso, lo que desacelera el desarrollo de varios tipos de modelos, como el lenguaje de visión y los grandes modelos de lenguaje (LLM).

Los datos sintéticos, generados a partir de una simulación por computadora, modelos de IA generativa o una combinación de los dos, pueden ayudar a abordar este desafío. Los datos sintéticos pueden consistir en texto, videos e imágenes 2D o 3D en espectros visuales y no visuales, que se pueden usar junto con datos del mundo real para entrenar modelos de IA física multimodales. Esto puede ahorrar una cantidad significativa de tiempo de entrenamiento y reducir en gran medida los costos.

Los datos sintéticos, generados a través de simulaciones o la IA, abordan el desafío de la escasez de datos al proporcionar texto, videos e imágenes 2D/3D que se pueden usar junto con datos reales para entrenar modelos de IA física multimodales, lo que ahorra tiempo y reduce los costos.

Velocidad de Entrenamiento de Modelos de IA

Supere la brecha de datos y acelere el desarrollo de modelos de IA, a la vez que reduce el costo general de adquisición y etiquetado de datos necesarios para el entrenamiento de modelos.

Privacidad y Seguridad

Aborde los problemas de privacidad y reduzca el sesgo al generar conjuntos de datos sintéticos diversos para representar el mundo real.

Precisión

Cree modelos de IA generalizados y altamente precisos mediante el entrenamiento con datos diversos que incluyen casos excepcionales pero cruciales que de otro modo sería imposible recopilar.

Escalable

Genere datos procedimentalmente con datos de pipeline automatizados que escalan con su caso de uso en la manufactura, la automoción, la robótica y más.

Datos Sintéticos para el Desarrollo de IA Física

Los modelos de IA física permiten a los sistemas autónomos percibir, comprender, interactuar con el mundo físico y explorarlo. Los datos sintéticos son críticos para el entrenamiento y las pruebas de modelos de IA física.

Entrenamiento de Modelos Base

Los world foundation models (WFM) utilizan datos de entrada diversos, como texto, imágenes, videos e información de movimiento, para generar y simular mundos virtuales con una precisión notable.   

Los WFM se caracterizan por sus capacidades de generalización excepcionales, que requieren un ajuste mínimo para varias aplicaciones. Sirven como motores cognitivos para los robots y los vehículos autónomos, aprovechando su comprensión integral de la dinámica del mundo real. Para lograr este nivel de sofisticación, los WFM dependen de grandes cantidades de datos de entrenamiento. 


El desarrollo de los WFM se beneficia significativamente de la generación de datos sintéticos infinitos a través de simulaciones físicamente precisas. Este enfoque no solo acelera el proceso de entrenamiento de los modelos, sino que también mejora la capacidad de los modelos para generalizar en diversos escenarios. Las técnicas de aleatorización de dominios aumentan aún más este proceso al permitir la manipulación de numerosos parámetros, como la iluminación, el fondo, el color, la ubicación y el entorno, variaciones que sería casi imposible capturar de forma integral solo a partir de datos del mundo real. 

Entrenamiento de Políticas de Robots

El aprendizaje de robots es un conjunto de algoritmos y metodologías que ayudan a un robot a aprender nuevas habilidades, como la manipulación, la locomoción y la clasificación, en un entorno simulado o del mundo real. El aprendizaje por refuerzo, el aprendizaje por imitación y la política de difusión son las metodologías clave que se aplican al entrenamiento de robots.  

Una habilidad importante para los robots es la manipulación: recoger cosas, clasificarlas y ponerlas juntas, como se ve en las fábricas. Las demostraciones humanas del mundo real generalmente se usan como entradas para el entrenamiento. Sin embargo, recopilar un conjunto grande y diverso de datos es bastante costoso. Con un puñado de demostraciones humanas, los desarrolladores pueden generar movimientos sintéticos en entornos simulados, lo que acelera el proceso de entrenamiento de los robots.

Para lograr esto, los usuarios primero pueden emplear GR00T-Teleop para recopilar un pequeño conjunto de demostraciones humanas con Apple Vision Pro (AVP). Las demostraciones grabadas se usan para generar un gran conjunto de movimientos sintéticos con GR00T-Mimic. A continuación, usan GR00T-Gen, basado en NVIDIA Omniverse™ y NVIDIA Cosmos™, para la aleatorización de dominios y el aumento de 3D a real para generar un conjunto exponencialmente grande y diverso de datos de entrenamiento para el aprendizaje por imitación. 

Pruebas y Validación

El software en bucle (SIL) es una etapa de prueba crucial para los robots y los vehículos autónomos impulsados por IA, donde el software de control se prueba en un entorno simulado en lugar de en hardware real.

Los datos sintéticos generados a partir de la simulación garantizan una elaboración de modelos de la física del mundo real precisa, incluidas las entradas de sensores, la dinámica de accionadores e interacciones ambientales. Esto también proporciona una forma de capturar escenarios raros que es peligroso recopilar en el mundo real. De este modo se garantiza que la pila de software del robot en la simulación se comporte como lo haría en el robot físico, lo que permite pruebas y validación exhaustivas sin la necesidad de hardware físico.  

Mega es un Omniverse Blueprint para desarrollar, probar y optimizar flotas de IA física y robots a escala en un gemelo digital antes de la implementación en instalaciones del mundo real.

Estos robots simulados pueden llevar a cabo tareas mediante la percepción y el razonamiento en entornos. Son capaces de planificar los próximos movimientos y luego realizar acciones que se simulan en el gemelo digital. Los datos sintéticos de estas simulaciones se envían al cerebro de los robots. El cerebro de los robots percibe los resultados y decide la próxima acción, y este ciclo continúa con Mega haciendo un seguimiento preciso del estado y la posición de todos los recursos en el gemelo digital.

Datos Sintéticos para LLM y Desarrollo de IA Basada en Agente

Los modelos generativos se pueden usar para iniciar y aumentar los procesos de generación de datos sintéticos. Los modelos de texto a 3D permiten la creación de recursos 3D para poblar una escena de simulación 3D. Los modelos de IA generativa de texto a imagen también se pueden usar para modificar y aumentar imágenes existentes, ya sea generadas a partir de simulaciones o recopiladas en el mundo real a través de restauraciones procedimientales (inpainting o outpainting).

Los modelos de IA generativa de texto a texto, como Evian 2 405B y Nemotron-4 340B, se pueden usar para generar datos sintéticos y desarrollar potentes LLM para el área de la salud, las finanzas, la seguridad cibernética, el comercio minorista y las telecomunicaciones. 

Evian 2 405B y Nemotron-4 340B proporcionan una licencia abierta, lo que les brinda a los desarrolladores los derechos para poseer y usar los datos generados en sus aplicaciones académicas y comerciales.

Cómo Desarrollar un Pipeline de SDG Habilitado por IA Generativa

La IA generativa puede acelerar en gran medida el proceso de generación de datos sintéticos físicamente precisos a escala. Los desarrolladores pueden comenzar a usar la IA generativa para SDG con un workflow de referencia paso a paso.


Implementación Técnica

Generación de Datos Sintéticos

Para IA Física

  • Creación de Escenas: Una escena 3D integral sirve como base e incorpora recursos esenciales como estantes, cajas y palés para almacenes o árboles, carreteras y edificios para entornos al aire libre. Los entornos se pueden mejorar dinámicamente con los microservicios NVIDIA NIM™ para Universal Scene Description (OpenUSD), lo que permite agregar con fluidez diversos objetos e integrar fondos HDRI de 360°.
  • Aleatorización de Dominios: Los desarrolladores pueden aprovechar USD Code NIM, un LLM de vanguardia especializado en OpenUSD, para realizar la aleatorización de dominios. Esta potente herramienta no solo responde a consultas relacionadas con OpenUSD, sino que también genera código de USD Python para realizar cambios en la escena, lo que agiliza el proceso de alteración por programación de varios parámetros de escena dentro de NVIDIA Omniverse.
  • Generación de Datos: El tercer paso implica la exportación del conjunto inicial de imágenes anotadas. Omniverse ofrece una amplia gama de anotadores integrados, lo que incluye cajas delimitadoras 2D, segmentación semántica, mapas de profundidad, normales de superficie y muchos más. La elección del formato de salida, como las cajas delimitadoras o las animaciones, depende de los requisitos del modelo o del caso de uso específicos.
  • Aumento de Datos: En la etapa final, los desarrolladores pueden aprovechar los WFM de NVIDIA Cosmos para aumentar aún más la imagen de 3D a real. Esto aporta el fotorrealismo necesario a las imágenes generadas a través de indicaciones simples del usuario.

Para LLM e IA Basada en Agente

  • Modelos de Acceso: Descargue la familia de modelos de código abierto Nemotron-4 340B del catálogo de NVIDIA NGC™ o de Hugging Face. También puede acceder a través de build.nvidia.com como un microservicio de NVIDIA NIM.
  • Generación de Datos Específicos de Dominio: Indíquele al modelo de código abierto Nemotron-4-340B-Instruct que genere su conjunto de datos sintéticos personalizados basado en texto de dominio diverso y que imite las características del mundo real.
  • Evalúe y Filtre: Aplique el modelo Nemotron-4 340B-Reward para calificar las respuestas generadas en función de su utilidad, exactitud, coherencia, complejidad y verbosidad.
  • Aproveche Conjuntos de Datos Sintéticos Relevantes de Alta Calidad: Refine los datos sintéticos mejorándolos de forma iterativa en función de los comentarios del modelo de recompensa, lo que garantiza la exactitud y la relevancia.

Ecosistema de Socios

Ecosistema de Socios de Datos Sintéticos

Vea cómo nuestros socios del ecosistema están desarrollando sus propias aplicaciones y servicios de datos sintéticos basados en tecnologías de NVIDIA.

Empresas de Datos Sintéticos

Service Delivery Partners

Empiece Ahora

Desarrolle su propio pipeline de SDG para simulaciones de robótica, inspección industrial y otros casos de uso de IA física con NVIDIA Isaac Sim.

Servidor RTX PRO: la Mejor Plataforma para IA Industrial y Física

El servidor NVIDIA RTX PRO acelera todas las cargas de trabajo de digitalización industrial, simulación de robots y generación de datos sintéticos.

Casos de Uso Relacionados