Synthetische Datengenerierung

Beschleunigen Sie Ihre KI-Workflows.

Workloads

Computer Vision/Videoanalytik

Branchen

Fertigung
Hardware/Halbleiter
Automobilindustrie/Transport
Smart Cities/Spaces
Robotik

Geschäftsziel

Innovation

Produkte

NVIDIA Omniverse Enterprise
NVIDIA DRIVE
NVIDIA Isaac
NVIDIA Metropolis

Was sind synthetische Daten?

Für das Training von KI-Modellen sind sorgfältig gekennzeichnete und vielfältige Datensätze erforderlich, die mehrere Tausend bis Millionen von Elementen enthalten, von denen einige außerhalb des visuellen Spektrums liegen. Die Erfassung und Kennzeichnung dieser Daten in der realen Welt sind zeitaufwendig und teuer. Dies kann die Entwicklung von KI-Modellen behindern und die Zeit bis zur Findung einer Lösung verlangsamen.

Die durch Computersimulationen generierten synthetischen Daten bestehen aus 2D-Bildern oder -Text und können in Verbindung mit Daten der realen Welt verwendet werden, um KI-Modelle für Computer Vision-Pipelines zu trainieren. Die Verwendung der synthetischen Datengenerierung (Synthetic Data Generation, SDG) kann viel Trainingszeit sparen und die Kosten erheblich senken.

Infografik zu synthetischen Daten

Gründe für die Verwendung synthetischer Daten?

Kosteneinsparungen

Schließen Sie die Datenlücke und senken Sie die Gesamtkosten für die Erfassung und Kennzeichnung von Daten, die zum Trainieren von KI-Modellen erforderlich sind.

Datenschutz und Sicherheit

Beheben Sie Datenschutzprobleme und reduzieren Sie Verzerrungen, indem Sie diverse synthetische Datensätze generieren, um die reale Welt zu repräsentieren.

Genauigkeit

Erstellen Sie höchst präzise, generalisierte KI-Modelle. Trainieren Sie dazu mit Daten, die seltene, aber wichtige Ausnahmefälle umfassen, die andernfalls nicht erfasst werden könnten.

Skalierbar

Generieren Sie Daten, die sich je nach Anwendungsfall in den Bereichen Fertigung, Automobilindustrie, Robotik usw. skalieren lassen.

Robotiksimulation

In der Robotik können synthetische Daten zum Trainieren von KI-Modellen verwendet werden, die für die Roboterwahrnehmung, das Greifen oder bei Robotern für die visuelle Inspektion eingesetzt werden.

Quick-Links

Bild mit freundlicher Genehmigung von Techman Robot

Industrielle Inspektion

Die Erkennung von Defekten in gefertigten Teilen ist extrem schwierig, da ‌die Anomalien oft subtil sind. Mithilfe von synthetischen Daten, die auf tatsächlichen Fehler wie Kratzern, Splittern oder Beulen basieren, lassen sich KI-Modelle so trainieren, dass Fehler frühzeitig im Fertigungsprozess erkannt werden.

Bild mit freundlicher Genehmigung von Delta Electronics

Quick-Links

Bild mit freundlicher Genehmigung von Edge Impulse

Autonome Fahrzeuge

Damit ein autonomes Fahrzeug sicher in seiner Umgebung navigieren kann, sind riesige Mengen an Trainingsdaten erforderlich, deren Erfassung im realen Leben extrem teuer und gefährlich ist. Mithilfe von synthetischen 3D-Daten können Lösungen für autonome Fahrzeuge in einer Simulationsumgebung entwickelt und getestet werden, wodurch die Test- und Trainingszeiten sowie die Kosten gesenkt werden.

Generieren synthetischer Daten

Zum Generieren von synthetischen Daten müssen Sie zunächst einen digitalen Zwilling der Umgebung erstellen, in der Sie Ihr KI-Modell trainieren.

Zum Trainieren eines KI-Modells für einen Lagerrobotermüssen Sie eine virtuelle Szene mit Objekten wie Hubwagen und Lagerregalen erstellen. Zum Trainieren eines KI-Modells für die visuelle Inspektion an einem Fließband müssen Sie eine virtuelle Szene mit Objekten wie einem Förderband und dem zu produzierenden Produkt erstellen.

Eine der größten Herausforderungen für Entwickler bei der Entwicklung synthetischer Datenpipelines ist das Schließen der Sim-to-Real-Lücke. Um synthetische Daten zu erstellen, die reale Szenarien widerspiegeln, müssen Sie Ihre Szene randomisieren, um die Vielzahl von Szenarien widerzuspiegeln, denen ein KI-Modell begegnen kann. Demnach werden bestimmte Aspekte der Szene, z. B. die Position von Objekten, Textur und Beleuchtung, geändert. Möglicherweise möchten Sie auch die Kameraposition ändern und störende Umgebungseffekte hinzufügen, die sich auf die Leistung des Modells auswirken können.

Mit NVIDIA Omniverse™ Replicator SDK können Entwickler benutzerdefinierte Pipelines erstellen, mit denen technische Künstler synthetische Daten für verschiedene Anwendungsfälle beim KI-Training erstellen und randomisieren können. Omniverse Replicator unterstützt NVIDIA Isaac Sim™, sodass Sie synthetische Daten für Robotikanwendungen und die Simulation für autonome Fahrzeuge generieren und somit letztendlich synthetische Daten für eine beschleunigte Entwicklung generieren können.

Partner-Ökosystem für synthetische Daten

Sehen Sie, wie unser Ökosystem seine eigenen auf NVIDIA-Technologien basierenden synthetischen Datenanwendungen und -dienste entwickelt.

Unternehmen im Bereich synthetische Daten

Partner für Servicebereitstellung

Ressourcen

Training mit synthetischen Daten

In diesem selbstbestimmten Kurs lernen Sie, wie Sie synthetische Daten zum Trainieren von Computer Vision-Modellen generieren.

Dokumentation zu synthetischen Daten

Informationen zu den ersten Schritten mit der Generierung synthetischer Daten finden Sie in der Dokumentation zu Omniverse Replicator.

Erste Schritte

Erstellen Sie Ihre eigene Pipeline zur Generierung synthetischer Daten für Robotiksimulationen, industrielle Inspektionen und autonome Fahrzeuge mit Omniverse Cloud-APIs oder SDKs.