Génération de données synthétiques pour l'IA physique

Accélérez le développement des workflows d'IA physique.

Charges de travail

Simulation/modélisation/conception
Robotique
IA générative

Secteurs

Tous les secteurs

Objectif commercial

Innovation

Produits

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Aperçu

Pourquoi utiliser des données synthétiques ?

Le développement des modèles d'IA nécessite des ensembles de données diversifiés, soigneusement étiquetés et de haute qualité pour atteindre la précision et les performances souhaitées. Les données sont, dans de nombreux cas, limitées, restreintes ou indisponibles. La collecte et l'étiquetage de ces données réelles sont longues et coûteuses et entravent le développement de modèles d'IA physique. 

Les données synthétiques, qu'elles soient générées à partir d'une simulation informatique, de modèles d'IA générative ou d'une combinaison des deux, peuvent contribuer à résoudre ce problème. Les données synthétiques peuvent se composer de texte, de vidéos et d'images 2D ou 3D dans des domaines visuels et non visuels, qui peuvent être utilisés conjointement avec des données réelles pour entraîner des modèles d'IA physique multimodaux. Cela permet souvent de gagner beaucoup de temps en matière d'entraînement et de réduire considérablement les coûts.

Vitesse d'entraînement des modèles d'IA

Comblez le manque de données et accélérez le développement des modèles d'IA tout en réduisant le coût global d'acquisition et d'étiquetage des données nécessaires à l'entraînement des modèles.

Confidentialité et sécurité

Résolvez les problèmes de confidentialité et réduisez les biais en générant différents ensembles de données synthétiques pour représenter le monde réel.

Précision

Créez des modèles d'IA généralisés et très précis en les entraînant à partir de données variées, y compris des cas marginaux rares mais cruciaux qui seraient autrement impossibles à collecter.

Évolutivité

Générez des données de manière procédurale grâce à des pipelines automatisés qui s'adaptent à votre cas d'utilisation dans divers secteurs, notamment l'industrie manufacturière, l'automobile, la robotique, etc. 

Données synthétiques pour le développement de l'IA physique

Les modèles d'IA physique permettent aux systèmes autonomes de percevoir, de comprendre, d'interagir avec le monde physique et d'y naviguer. Les données synthétiques sont essentielles pour entraîner et tester les modèles d'IA physique.

Modèles de mondes

Les modèles de fondation de mondes (WFM) utilisent diverses données d'entrée, notamment du texte, des images, des vidéos et des informations sur les mouvements, pour générer et simuler des mondes virtuels avec une précision remarquable. 

Les WFM se caractérisent par leurs capacités de généralisation exceptionnelles et nécessitent un réglage minimal dans différentes applications. Ils jouent le rôle de moteurs cognitifs dans les robots et les véhicules autonomes, en tirant parti de leur compréhension complète des différents dynamiques du monde réel. Pour atteindre ce niveau de sophistication, les WFM s'appuient sur de grandes quantités de données d'entraînement. 

La génération de données synthétiques infinies par le biais de simulations physiquement précises profite grandement au développement des WFM. Cette approche accélère non seulement le processus d'entraînement des modèles, mais améliore également la capacité des modèles à effectuer des généralisations dans différentes situations. Les techniques de randomisation de domaines améliorent encore ce processus en permettant de manipuler de nombreux paramètres tels que l'éclairage, l'arrière-plan, la couleur, l'emplacement et l'environnement, des variations qui seraient presque impossibles à extraire pleinement de données réelles.

Entraînement des politiques de robots

L'apprentissage des robots englobe une gamme d'algorithmes et de méthodologies qui permettent à un robot d'acquérir de nouvelles compétences, notamment en matière de manipulation, de locomotion et de classification, dans des environnements simulés ou réels. L'apprentissage par renforcement, l'apprentissage par imitation et les politiques de diffusion sont les méthodologies clés qui sont appliquées pour entraîner les robots.  

Une compétence importante pour les robots est la manipulation, c'est-à-dire ramasser, trier et assembler des articles, comme l'on peut l'observer dans les usines. Des démonstrations humaines effectuées dans le monde réel sont généralement utilisées comme intrants pour l'entraînement. Cependant, la collecte d'un jeu de données important et diversifié coûte assez cher.

Pour résoudre ce problème, les développeurs peuvent utiliser les modèles NVIDIA Isaac GR00T-Mimic et GR00T-Dreams basés sur NVIDIA Cosmos™ pour produire des jeux de données de mouvement à la fois synthétiques, diversifiés et de grande taille pour l'entraînement. 

Le modèle NVIDIA Isaac GR00T-Dreams génère de grandes quantités de données de trajectoire synthétiques à l'aide de Cosmos, à partir d'une seule image et d'instructions de langage. Les robots peuvent ainsi apprendre de nouvelles tâches dans des environnements inconnus sans avoir besoin de données de téléopération spécifiques.

Le modèle NVIDIA Isaac GR00T-Mimic génère de grandes quantités de données de trajectoire synthétiques à partir d'une poignée de démonstrations humaines. Cela permet aux robots d'améliorer leur manipulation dans une tâche et un environnement connus.

Ces jeux de données peuvent ensuite être utilisés pour entraîner les modèles de fondation ouverts Isaac GR00T au sein d'Isaac Lab, permettant ainsi un raisonnement humanoïde généralisé et une acquisition robuste de compétences.

Tests et validation

L'étape Software-in-loop (SIL) est une étape de test et de validation critique dans le développement de robots et de véhicules autonomes pilotés par l'IA, dans laquelle les logiciels de contrôle sont testés dans un environnement simulé plutôt que sur du matériel réel.

Les données synthétiques générées à partir de simulations garantissent une modélisation précise de la physique du monde réel, y compris les entrées des capteurs, la dynamique des actionneurs et les interactions environnementales. Cela permet également d'inclure des situations rares qui sont dangereuses à gérer dans le monde réel pour la collecte. Cela garantit que la pile logicielle du robot utilisée en simulation se comporte comme elle le ferait dans le robot physique ; il est donc possible de la tester et de la valider soigneusement sans avoir recours à du matériel physique.

Les données synthétiques tirées de ces simulations sont renvoyées dans le cerveau des robots. Les cerveaux des robots perçoivent les résultats et décident de la marche à suivre. Ce cycle se poursuit, Mega suivant avec précision l'état et la position de tous les actifs du jumeau numérique.

Comment développer un pipeline de SDG basé sur l'IA générative

L'IA générative peut considérablement accélérer la génération de données synthétiques physiquement précises à grande échelle. Les développeurs peuvent commencer à utiliser l'IA générative dans la SDG avec un workflow de référence étape par étape.


Implémentation technique

Génération de données synthétiques pour l'IA physique

  • Création de scènes : une scène 3D complète sert de fondation, incluant des éléments essentiels tels que des étagères, des boîtes et des palettes pour les entrepôts, ou des arbres, des routes et des bâtiments dans les environnements extérieurs. Les développeurs peuvent désormais utiliser NVIDIA NuRec, un ensemble d'API et de bibliothèques permettant de générer des simulations neuronales à partir de données réelles afin d'accélérer le processus de création de scènes. Les environnements peuvent être améliorés dynamiquement à l'aide des microservices NVIDIA NIM™ pour OpenUSD (Universal Scene Description), ce qui permet d'ajouter facilement différents objets et d'intégrer des arrière-plans HDRI à 360°. Dans certains cas, une scène 3D peut ne pas être nécessaire. GR00T-Dreams utilise les modèles de fondation mondiale (WFM) pour générer de nouveaux environnements.
  • Randomisation de domaines : USD Code NIM, un LLM de pointe spécialisé dans OpenUSD, pour effectuer la randomisation de domaines. Cet outil puissant répond non seulement aux requêtes liées à OpenUSD, mais génère également du code Python USD pour apporter des modifications à la scène, rationalisant ainsi le processus de modification par programmation de divers paramètres de scène dans NVIDIA Omniverse.
  • Génération de données : la troisième étape consiste à exporter l'ensemble d'images annotées initial. Omniverse propose une grande variété d'annotations intégrées, notamment des zones de délimitation 2D, la segmentation sémantique, les cartes de profondeur, les normes de surface et de nombreuses autres. Le choix du format de sortie, tel que les zones de délimitation ou les animations, dépend des exigences spécifiques du modèle ou du cas d'utilisation.
  • Augmentation des données : lors de la dernière étape, les développeurs peuvent exploiter les modèles NVIDIA Cosmos World Foundation Models (WFM), tels que Cosmos Transfer, pour améliorer encore davantage l'image, de la 3D à la réalité. Cela permet d'offrir aux images générées le photoréalisme nécessaire grâce à de simples invites d'utilisateur.

Démarrage

Développez votre propre pipeline de SDG pour les simulations robotiques, les inspections industrielles et d'autres cas d'utilisation de l'IA physique avec NVIDIA Isaac Sim.

RTX PRO Server, la meilleure plateforme pour l’IA industrielle et physique

NVIDIA RTX PRO Server accélère toutes les charges de travail de numérisation industrielle, de simulation de robots et de génération de données synthétiques.