Génération de données synthétiques

Accélérez vos workflows d'IA.

Charges de travail

Vision par ordinateur / Analyse vidéo

Industries

Production
Matériel/Semi-conducteurs
Automobile/Transports
Villes/espaces connectés
Robotique

Objectif commercial

Innovation

Produits

NVIDIA Omniverse Enterprise
NVIDIA DRIVE
NVIDIA Isaac
NVIDIA Metropolis

Que sont les données synthétiques ?

L’entraînement d'un modèle d’IA requiert de faire appel à des jeux de données diversifiés et soigneusement étiquetés qui peuvent inclure des milliers voire des millions d’éléments, certains se situant même au-delà du spectre visuel. Le processus concret de collecte et d’étiquetage de ces données s’avère le plus souvent aussi chronophage que coûteux, ce qui peut entraver le développement des nouveaux modèles d’IA et impacter les délais de résolution.

Générées par des simulations informatiques, les données synthétiques sont composées d’images en 2D ou de texte et peuvent être utilisée avec des données réelles afin d’entraîner des modèles d’IA pour des pipelines de vision par ordinateur. La génération de données synthétiques (ou SDG, pour "synthetic data generation") permet de réduire le temps d'entraînement tout en diminuant les coûts de manière significative.

Infographie sur les données synthétiques

Pourquoi utiliser les données synthétiques ?

Réduction des coûts

Comblez le manque de données tout en réduisant les coûts d’acquisition et d’étiquetage des données requises pour l’entraînement des modèles d’IA.

Confidentialité et sécurité

Résolvez les problèmes de confidentialité et réduisez les biais en générant des jeux de données synthétiques à la fois variés et réalistes.

Précision

Créez des modèles d’IA généralisés de grande précision, en procédant à la phase d'entraînement avec des données incluant des cas rares mais cruciaux qu’il serait impossible de collecter autrement.

Évolutivité

Générez des données adaptées à vos cas d’utilisation dans des champs d’application tels que la production industrielle, l’automobile ou la robotique.

Simulation robotique

Dans le domaine de la robotique, les données synthétiques peuvent être utilisées afin d'entraîner des modèles d’IA déployés pour des robots de perception et préhension, ou des robots d’inspection visuelle.

Liens rapides

Image fournie par Techman Robot

Inspection industrielle

La détection de défauts sur des pièces manufacturées s’avère extrêmement difficile car les anomalies sont souvent subtiles. Des données synthétiques basées sur des défauts réels comme des rayures, des éclats ou des bosses peuvent être créées pour entraîner des modèles d’IA à détecter des défauts lors des stades initiaux du processus de production.

Image fournie par Delta Electronics

Liens rapides

Image fournie par Edge Impulse

Véhicules autonomes

Déployer un véhicule autonome et lui permettre de circuler en toute sécurité dans son environnement nécessite d’importants volumes de données d’entraînement, dont l’acquisition s’avère extrêmement coûteuse et dangereuse en pratique. Les données synthétiques 3D peuvent être utilisées pour développer et tester des solutions pour véhicules autonomes dans un environnement simulé, ce qui permet de réduire les délais de test et d’entraînement, mais aussi de diminuer les coûts.

Génération de données synthétiques

Pour générer des données synthétiques, il faut commencer par créer un jumeau numérique de l’environnement sur lequel vous allez entraîner votre modèle d’IA.

Si vous entraînez un modèle d’IA pour robot d'entrepôt, vous devrez créer une scène virtuelle contenant des objets tels que des transpalettes ou des rayons de stockage. Si vous entraînez un modèle d'IA pour l'inspection visuelle sur une chaîne d'assemblage, vous devrez créer une scène virtuelle avec des objets tels qu’un tapis roulant et le produit à fabriquer.

Lors de la mise en œuvre de pipelines de données synthétiques, les développeurs sont confrontés à un défi majeur : combler l’écart entre la simulation et la réalité. Pour créer des données synthétiques qui reflètent des situations du monde réel, il faut rendre votre scène aléatoire afin de refléter la pléthore de cas de figure qu’un modèle d’IA est susceptible de rencontrer. Cela implique de modifier divers aspects d’une scène, tels que la position des objets, les textures et l’éclairage. Vous pouvez également changer la position de la caméra et ajouter des distractions environnementales susceptibles d'affecter les performances du modèle.

Avec le SDK NVIDIA Omniverse™ Replicato, les développeurs peuvent créer des pipelines personnalisés qui permettent aux infographistes de créer et de randomiser des données synthétiques pour générer diverses situations d’entraînement de l’IA. Omniverse Replicator alimente NVIDIA Isaac Sim™ vous permettant de générer des données synthétiques pour les applications de robotique et la simulation de véhicules autonomes. Vous pouvez ainsi accélérer votre développement.

Écosystème de partenaires pour les données synthétiques

Découvrez comment nos partenaires développent leurs propres applications et services de données synthétiques en mettant à profit les technologies de NVIDIA.

Sociétés spécialisées dans les données synthétiques

Partenaires en prestation de services

Ressources

Entraînement de données synthétiques

Suivez ce cours à la carte pour apprendre à générer des données synthétiques afin d’entraîner des modèles de vision par ordinateur.

Documentation sur les données synthétiques

Consultez la documentation d’Omniverse Replicator pour vous lancer dans la génération de données synthétiques.

Démarrage

Créez votre propre pipeline de génération de données synthétiques pour les simulations de robotique, l’inspection industrielle et les véhicules autonomes avec les API d'Omniverse Cloud ou ses SDK.