Generierung synthetischer Daten für physische KI

Beschleunigen Sie die Entwicklung von Workflows für physische KI.

Workloads

Simulation/Modellierung/Design
Robotik
Generative KI

Branchen

Alle Branchen

Geschäftsziel

Innovation

Produkte

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Überblick

Warum synthetische Daten verwenden?

Die Entwicklung physischer KI-Modelle erfordert sorgfältig gekennzeichnete, hochwertige, vielfältige Datenbestände, um die gewünschte Genauigkeit und Leistung zu erzielen. In vielen Fällen sind die Daten begrenzt, eingeschränkt oder nicht verfügbar. Das Erfassen und Kennzeichnen dieser realen Daten ist zeitaufwendig, kostspielig und behindert die Entwicklung physischer KI-Modelle. 

Synthetische Daten – generiert aus einer Computersimulation, generativen KI-Modellen oder einer Kombination aus beidem – können helfen, diese Herausforderung zu meistern. Synthetische Daten können Text, Videos sowie 2D- oder 3D-Bilder sowohl visueller als auch nicht-visueller Art umfassen, die in Verbindung mit realen Daten verwendet werden können, um multimodale physische KI-Modelle zu trainieren. Dadurch können die Trainingszeit und die Kosten erheblich gesenkt werden.

Geschwindigkeit des KI-Modelltrainings

Überwinden Sie die Datenlücke und beschleunigen Sie die Entwicklung von KI-Modellen, während Sie gleichzeitig die Gesamtkosten für die Erfassung und Kennzeichnung von Daten senken, die für das Modelltraining erforderlich sind.

Datenschutz und Sicherheit

Behandeln Sie Datenschutzprobleme und reduzieren Sie Verzerrungen, indem Sie vielfältige synthetische Datensätze generieren, die die reale Welt widerspiegeln.

Genauigkeit

Entwickeln Sie hochpräzise, generalisierte KI-Modelle, indem Sie mit verschiedenen Daten trainieren, die seltene, aber wichtige Ausnahmefälle enthalten, die sonst nicht erfasst werden können.

Skalierbar

Generieren Sie Daten prozedural mit automatisierten Pipelines, die sich an Ihren Anwendungsfall in verschiedenen Branchen anpassen lassen, darunter Fertigung, Automobilindustrie, Robotik und mehr. 

Synthetische Daten für die Entwicklung physischer KI

Physische KI-Modelle ermöglichen es autonomen Systemen, die physische Welt wahrzunehmen, zu verstehen, mit ihr zu interagieren und sich in ihr zu bewegen. Synthetische Daten sind entscheidend für das Training und das Testen physischer KI-Modelle.

Weltmodelle

Weltmodelle nutzen verschiedene Eingabedaten, darunter Text, Bilder, Videos und Bewegungsinformationen, um virtuelle Welten mit bemerkenswerter Genauigkeit zu generieren und zu simulieren.   

Weltmodelle zeichnen sich durch außergewöhnliche Generalisierungsfähigkeiten aus, die nur minimale Feinabstimmung für verschiedene Anwendungen erfordern. Sie dienen als kognitive Antriebskräfte für Roboter und autonome Fahrzeuge und nutzen dabei ihr umfassendes Verständnis der Dynamik der realen Welt. Um diesen Grad der Komplexität zu erreichen, sind Weltmodelle auf umfangreiche Mengen an Trainingsdaten angewiesen. 

Die Entwicklung von Weltmodellen profitiert erheblich von der Generierung unendlicher synthetischer Daten durch physisch genaue Simulationen. Dieser Ansatz beschleunigt nicht nur den Modelltrainingsprozess, sondern verbessert auch die Generalisierungsfähigkeit eines Modells in verschiedenen Szenarien. Techniken zur Domänenrandomisierung verbessern diesen Prozess weiter, indem sie die Manipulation zahlreicher Parameter wie Beleuchtung, Hintergrund, Farbe, Standort und Umgebung ermöglichen – Variationen, deren umfassende Erfassung allein anhand realer Daten nahezu unmöglich wäre.

Training von Roboterrichtlinien

Das Roboterlernen umfasst eine Reihe von Algorithmen und Methoden, die es einem Roboter ermöglichen, neue Fähigkeiten wie Manipulation, Fortbewegung und Klassifizierung in simulierten oder realen Umgebungen zu erwerben. Bestärkendes Lernen, Imitationslernen und Diffusionspolitik sind die wichtigsten Methoden, die zum Trainieren von Robotern angewendet werden.

Eine wichtige Fähigkeit für Roboter ist die Manipulation – das Aufnehmen, Sortieren und Zusammenbauen von Gegenständen – ähnlich wie man es in Fabriken beobachten kann. In der Regel werden reale menschliche Demonstrationen als Input für das Training verwendet. Das Erfassen eines großen und vielfältigen Datensatzes ist jedoch mit erheblichen Kosten verbunden.

Um diese Herausforderung zu bewältigen, können Entwickler die NVIDIA Isaac Blueprints GR00T-Mimic und GR00T-Dreams nutzen, die auf NVIDIA Cosmos™ basieren, um umfangreiche, vielfältige synthetische Bewegungsdatensätze für das Training zu generieren.

Der NVIDIA Isaac GR00T-Dreams-Blueprint generiert mithilfe von Cosmos riesige Mengen synthetischer Trajektoriendaten, die durch ein einzelnes Bild und Sprachbefehle ausgelöst werden. Dadurch können Roboter neue Aufgaben in ungewohnten Umgebungen erlernen, ohne dass spezifische Teleoperationsdaten erforderlich sind.

Der NVIDIA Isaac GR00T-Mimic-Blueprint generiert riesige Mengen an synthetischen Trajektoriendaten aus nur einer Handvoll menschlicher Demonstrationen. Dadurch können Roboter ihre Manipulationsfähigkeiten für bekannte Aufgaben und Umgebungen verbessern.

Diese Datensätze können dann zum Trainieren der offenen Isaac GR00T-Foundation-Modelle in Isaac Lab verwendet werden, was ein generalisiertes humanoides Schlussfolgern und den Erwerb robuster Fähigkeiten ermöglicht.

Testen und Validieren

Software-in-Loop-Tests (SIL) sind eine entscheidende Phase für KI-gestützte Roboter und autonome Fahrzeuge, bei denen die Steuerungssoftware in einer simulierten Umgebung statt auf realer Hardware evaluiert wird.

Synthetische Daten, die aus der Simulation generiert werden, gewährleisten eine genaue Modellierung der realen Physik, einschließlich Sensoreingaben, Aktuator-Dynamik und Umweltinteraktionen. Dies bietet auch eine Möglichkeit, seltene Szenarien zu erfassen, deren Erfassung in der realen Welt gefährlich wäre. Dadurch wird sichergestellt, dass sich der Roboter-Softwarestack in der Simulation genauso verhält wie auf dem physischen Roboter, was eine gründliche Prüfung und Validierung ohne physische Hardware ermöglicht.  

Synthetische Daten aus diesen Simulationen werden in das Robotergehirn zurückgeführt. Die Robotergehirne nehmen die Ergebnisse wahr und entscheiden über die nächste Aktion. Dieser Zyklus setzt sich fort, wobei Mega den Zustand und die Position aller Assets im digitalen Zwilling präzise verfolgt.

Erstellung einer generativen KI-fähigen SDG-Pipeline

Generative KI kann den Prozess der Erzeugung physikalisch genauer synthetischer Daten in großem Umfang erheblich beschleunigen. Entwickler können mit einem schrittweisen Referenz-Workflow beginnen, generative KI für SDG zu nutzen.


Technische Umsetzung

Generieren synthetischer Daten für physische KI

  • Szenenerstellung: Als Grundlage dient eine umfassende 3D-Szene mit wesentlichen Elementen wie Regalen, Kisten und Paletten für Lagerhäuser sowie Bäumen, Straßen und Gebäuden für Außenumgebungen. Entwickler können jetzt NVIDIA NuRec verwenden, eine Reihe von APIs und Bibliotheken zur Generierung neuronaler Simulationen aus realen Daten, um den Prozess der Szenenerstellung zu beschleunigen. Diese Umgebungen können mithilfe von NVIDIA NIM™ Microservices für Universal Scene Description (OpenUSD) befüllt und dynamisch verbessert werden, wodurch das nahtlose Hinzufügen verschiedener Objekte und die Integration von 360°-HDRI Hintergründen ermöglicht wird. In einigen Fällen ist möglicherweise keine 3D-Szene erforderlich. GR00T-Dreams nutzt World Foundation Models (WFMs), um neue Umgebungen zu generieren.
  • Domänenrandomisierung: USD Code NIM, ein hochmodernes LLM, das auf OpenUSD spezialisiert ist, führt die Domänenrandomisierung durch. Dieses leistungsstarke Tool beantwortet nicht nur OpenUSD-bezogene Abfragen, sondern erzeugt auch USD-Python-Code, um Änderungen in der Szene vorzunehmen, wodurch der Prozess der programmgesteuerten Änderung verschiedener Szenenparameter innerhalb von NVIDIA Omniverse optimiert wird.
  • Datengenerierung: Der dritte Schritt umfasst den Export des ersten Satzes annotierter Bilder. Omniverse bietet eine Vielzahl von integrierten Annotatoren, darunter 2D-Begrenzungsrahmen, semantische Segmentierung, Tiefenkarten, Oberflächennormalen und viele andere. Die Wahl des Ausgabeformats, wie z. B. Begrenzungsrahmen oder Animationen, hängt von den spezifischen Modellanforderungen oder dem Anwendungsfall ab.
  • Datenanreicherung: In der letzten Phase können Entwickler NVIDIA Cosmos World Foundation Models (WFMs) wie Cosmos Transfer nutzen, um das Bild von 3D auf Real weiter anzureichern. Dadurch erhalten die generierten Bilder durch einfache Benutzer-Prompts den erforderlichen Fotorealismus.

Erste Schritte

Erstellen Sie mit NVIDIA Isaac Sim Ihre eigene SDG-Pipeline für Robotersimulationen, industrielle Inspektion und andere Anwendungsfälle für physische KI.

RTX PRO Server – die beste Plattform für industrielle und physische KI

NVIDIA RTX PRO Server beschleunigen alle Workloads für industrielle Digitalisierung, Robotersimulation und die synthetische Datengenerierung.