Generación de datos sintéticos

Acelere sus flujos de trabajo de IA.

Cargas de trabajo

Visión computarizada/análisis de vídeo

Sectores

Fabricación
Hardware/semiconductor
Automoción/transporte
Ciudades/espacios inteligentes
Robótica

Objetivo empresarial

Innovación

Productos

NVIDIA Omniverse Enterprise
NVIDIA DRIVE
NVIDIA Isaac
NVIDIA Metropolis

¿Qué son los datos sintéticos?

El entrenamiento de cualquier modelo de IA requiere conjuntos de datos cuidadosamente etiquetados y diversos que contengan de miles a decenas de millones de elementos, algunos de los cuales están más allá del espectro visual. La recopilación y el etiquetado de estos datos en el mundo real requieren mucho tiempo y son costosos. Esto puede dificultar el desarrollo de modelos de IA y ralentizar el tiempo necesario para encontrar una solución.

Generados por simulaciones por ordenador, los datos sintéticos se componen de imágenes 2D o texto, y pueden utilizarse junto con datos del mundo real para entrenar modelos de IA para canalizaciones de visión computerizada. El uso de la generación de datos sintéticos (SDG) puede ahorrar una cantidad significativa de tiempo de entrenamiento y reducir enormemente los costes.

Infografía de datos sintéticos

¿Por qué utilizar datos sintéticos?

Ahorro de costes

Supere la brecha de datos y reduzca el coste general de adquirir y etiquetar los datos necesarios para entrenar modelos de IA.

Privacidad y seguridad

Aborde los problemas relacionados con la privacidad y reduzca los sesgos generando diversos conjuntos de datos sintéticos que representan el mundo real.

Precisión

Cree modelos de IA muy precisos y generalizados entrenando con datos que incluyen casos complejos raros pero fundamentales que, de otro modo, serían imposibles de recopilar.

Escalabilidad

Genere datos que se escalan con su caso de uso en los sectores de fabricación, automoción, robótica, etc.

Simulación de robótica

En el campo de la robótica, los datos sintéticos pueden utilizarse para entrenar modelos de IA que se implementan para la percepción del robot, la captación o en robots utilizados para la inspección visual.

Enlaces rápidos

Imagen cortesía de Techman Robot

Inspección industrial

La detección de defectos en piezas fabricadas es extremadamente difícil porque‌ las anomalías suelen ser sutiles. Se pueden crear datos sintéticos basados en defectos reales, como rayones, desconchones o abolladuras, para entrenar modelos de IA que detecten los defectos en una fase temprana del proceso de fabricación.

Imagen cortesía de Delta Electronics

Enlaces rápidos

Imagen cortesía de Edge Impulse

Vehículos autónomos

Implementar un vehículo autónomo para que pueda navegar con seguridad por su entorno requiere cantidades ingentes de datos de entrenamiento, cuya adquisición en la vida real resulta extremadamente cara y peligrosa. Los datos sintéticos en 3D pueden utilizarse para desarrollar y probar soluciones de vehículos autónomos en un entorno de simulación, lo que reduce los tiempos de pruebas y entrenamiento, y abarata los costes.

Generar datos sintéticos

Para generar datos sintéticos, primero debe crear un gemelo digital del entorno en el que va a entrenar el modelo de IA.

Si se entrena un modelo de IA para un robot de almacén, será necesario crear una escena virtual con objetos como conectores de palés y bastidores de almacenamiento. Si se entrena un modelo de IA para la inspección visual en una cadena de montaje, será necesario crear una escena virtual con objetos como una cinta transportadora y el producto que se está fabricando.

Uno de los principales retos a los que se enfrentan los desarrolladores a la hora de crear canalizaciones de datos sintéticos es reducir la brecha entre simulación y realidad. Para crear datos sintéticos que reflejen escenarios del mundo real, tendrá que aleatorizar la escena para reflejar la plétora de escenarios que un modelo de IA podría encontrar. Esto significa modificar aspectos de la escena como la posición de los objetos, la textura y la iluminación. También puede modificar la posición de la cámara y añadir distractores ambientales que puedan afectar al rendimiento del modelo.

Con el SDK NVIDIA Omniverse™ Replicator, los desarrolladores pueden crear canalizaciones personalizadas que permiten a los artistas técnicos crear y aleatorizar datos sintéticos para varios casos de uso de entrenamiento de IA. Omniverse Replicator potencia NVIDIA Isaac Sim™, que permite generar datos sintéticos para aplicaciones de robótica, y la simulación de vehículos autónomos, que permite generar datos sintéticos para acelerar el desarrollo.

Ecosistema de partners de datos sintéticos

Vea cómo nuestro ecosistema está desarrollando sus propias aplicaciones y servicios de datos sintéticos basados en las tecnologías NVIDIA.

Empresas de datos sintéticos

Partners de prestación de servicios

Recursos

Entrenamiento de datos sintéticos

Realice este curso a su propio ritmo para aprender a generar datos sintéticos para el entrenamiento de modelos de visión computerizada.

Documentación de datos sintéticos

Consulte la documentación de Omniverse Replicator para empezar con la generación de datos sintéticos.

Primeros pasos

Cree su propia canalización de generación de datos sintéticos para simulaciones robóticas, inspección industrial y vehículos autónomos con API de Omniverse Cloud o SDK.