Generazione di dati sintetici per l'IA fisica

Accelera lo sviluppo dei flussi di lavoro dell'IA fisica.

Carichi di lavoro

Simulazione/Modellazione/Design
Robotica
IA generativa

Settori

Tutti i settori

Obiettivo aziendale

Innovazione

Prodotti

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Panoramica

Perché utilizzare dati sintetici?

Lo sviluppo di modelli di IA fisica richiede set di dati attentamente etichettati, di alta qualità e diversificati per ottenere l'accuratezza e le prestazioni desiderate. In molti casi, i dati sono limitati, riservati o non disponibili. Raccogliere ed etichettare questi dati del mondo reale è dispendioso in termini di tempo, è costoso e ostacola lo sviluppo dei modelli di IA fisica. 

I dati sintetici, generati tramite simulazioni al computer, modelli di IA generativa o una combinazione di entrambi, possono contribuire a superare questa sfida. I dati sintetici possono includere testo, video e immagini 2D o 3D in spettri sia visivi che non visivi, che possono essere utilizzati in combinazione con i dati del mondo reale per addestrare i modelli di IA fisica multimodale. In questo modo, è possibile ridurre significativamente i tempi di addestramento e abbattere i costi in modo considerevole.

Velocità di addestramento dei modelli IA

Colma il divario di dati e accelera lo sviluppo dei modelli di IA, riducendo al contempo i costi complessivi di acquisizione ed etichettatura dei dati necessari per l'addestramento dei modelli.

Privacy e sicurezza

Affronta i problemi di privacy e riduci i pregiudizi generando diversi set di dati sintetici per rappresentare il mondo reale.

Accuratezza

Crea modelli IA generalizzati e altamente accurati, addestrando con vari dati che includono casi particolari rari, ma cruciali, che altrimenti non sarebbe possibile raccogliere.

Scalabile

Genera dati procedurali con pipeline automatizzate scalabili con il tuo caso d'uso in vari settori, tra cui produzione, industria automobilistica, robotica e altro ancora. 

Dati sintetici per lo sviluppo dell'IA fisica

I modelli di IA fisica permettono ai sistemi autonomi di percepire, comprendere, interagire e navigare nel mondo reale. I dati sintetici sono essenziali per l'addestramento e il collaudo dei modelli di IA fisica.

Modelli del mondo

I modelli del mondo utilizzano diversi dati di input, tra cui testo, immagini, video e informazioni sul movimento, per generare e simulare mondi virtuali con una precisione notevole.   

I modelli del mondo sono caratterizzati dalle loro eccezionali capacità di generalizzazione, che richiedono un ottimizzazione minimo per varie applicazioni. Agiscono come motori cognitivi per robot e veicoli autonomi, sfruttando una comprensione approfondita delle dinamiche del mondo reale. Per ottenere questo livello di sofisticazione, i modelli del mondo si basano su grandi quantità di dati di addestramento. 

Lo sviluppo dei modelli del mondo beneficia significativamente della generazione di dati sintetici infiniti attraverso simulazioni fisicamente accurate. Questo approccio non solo accelera il processo di addestramento dei modelli, ma migliora anche la capacità di un modello di generalizzare in diversi scenari. Le tecniche di randomizzazione del dominio aumentano ulteriormente questo processo consentendo la manipolazione di numerosi parametri come l'illuminazione, lo sfondo, il colore, la posizione e l'ambiente: variazioni che sarebbero quasi impossibili da catturare completamente dai soli dati del mondo reale.

Addestramento della policy sui robot

L'apprendimento robotico comprende una gamma di algoritmi e metodologie che consentono a un robot di acquisire nuove competenze, tra cui la manipolazione, la locomozione e la classificazione, in ambienti simulati o reali. L'apprendimento per rinforzo, l'apprendimento per imitazione e la politica di diffusione sono le metodologie chiave applicate per l'addestramento dei robot.

Un'abilità importante per i robot è la manipolazione, ovvero il prelievo, l'ordinamento e l'assemblaggio di oggetti, simile a quello che si osserva nelle fabbriche. Le dimostrazioni umane del mondo reale vengono comunemente utilizzate come dati di input per l'addestramento dei modelli. Tuttavia, la raccolta di un set di dati di grandi dimensioni e diversificato è piuttosto costosa.

Per superare questa sfida, gli sviluppatori possono utilizzare i blueprint NVIDIA Isaac GR00T-Mimic e GR00T-Dreams, basati su NVIDIA Cosmos™, per generare set di dati di movimento sintetico di grandi dimensioni e diversificati per l'addestramento.

Il blueprint NVIDIA Isaac GR00T-Dreams genera una grande quantità di dati sintetici sulle traiettorie utilizzando Cosmos, a partire da una singola immagine e istruzioni linguistiche. Ciò consente ai robot di apprendere nuove attività in ambienti sconosciuti senza la necessità di dati specifici per la teleoperazione.

Il blueprint NVIDIA Isaac GR00T-Mimic genera grandi quantità di dati sintetici sulla traiettoria da una manciata di dimostrazioni umane. Ciò consente ai robot di migliorare la loro manipolazione in un'attività e in un ambiente noti.

Questi set di dati possono quindi essere utilizzati per addestrare i modelli di base aperti Isaac GR00T all'interno di Isaac Lab, consentendo il ragionamento umanoide generalizzato e una solida acquisizione di competenze.

Test e convalida

Il test software-in-loop (SIL) è una fase cruciale per i robot basati sull'IA e i veicoli autonomi, in cui il software di controllo viene valutato in un ambiente simulato anziché su hardware reale.

I dati sintetici generati tramite simulazione garantiscono una modellazione accurata della fisica del mondo reale, inclusi gli ingressi dei sensori, la dinamica degli attuatori e le interazioni ambientali. In questo modo è possibile simulare scenari rari o pericolosi, difficili da acquisire nel mondo reale. In questo modo ci si assicura che lo stack software del robot in simulazione replichi fedelmente il comportamento del robot fisico, consentendo test e convalide approfondite senza la necessità di hardware fisico.  

I dati sintetici generati da queste simulazioni vengono reintegrati nei cervelli robotici. I cervelli dei robot percepiscono i risultati, decidendo l'azione successiva. Questo ciclo continua con Mega che monitora con precisione lo stato e la posizione di tutte le risorse nel gemello digitale.

Come creare una pipeline SDG basata sull'IA generativa

L'IA generativa può accelerare significativamente la creazione su larga scala di dati sintetici fisicamente accurati. Gli sviluppatori possono iniziare a sfruttare l'IA generativa per SDG attraverso un flusso di lavoro di riferimento dettagliato.


Implementazione tecnica

Generare dati sintetici per l'IA fisica

  • Creazione di scene: una scena 3D completa funge da base, incorporando risorse essenziali come scaffali, scatole e pallet per i magazzini, nonché alberi, strade ed edifici per gli ambienti esterni. Gli sviluppatori possono ora utilizzare NVIDIA NuRec, un insieme di API e librerie per generare simulazioni neurali dai dati del mondo reale per accelerare il processo di creazione delle scene. Questi ambienti possono essere popolati e migliorati dinamicamente utilizzando i microservizi NVIDIA NIM™ per Universal Scene Description (OpenUSD), consentendo l'aggiunta fluida di oggetti diversi e l'integrazione degli sfondi HDRI a 360°. In alcuni casi, una scena 3D potrebbe non essere necessaria. GR00T-Dreams sfrutta WFMs per generare nuovi ambienti.
  • Randomizzazione del dominio: USD Code NIM, un LLM all'avanguardia specializzato in OpenUSD, per eseguire la randomizzazione del dominio. Questo potente strumento non solo fornisce risposte su OpenUSD, ma genera anche codice USD in Python per modificare la scena, semplificando l'alterazione programmatica di vari parametri all'interno di NVIDIA Omniverse.
  • Generazione di dati: la terza fase prevede l'esportazione del set iniziale di immagini annotate. Omniverse mette a disposizione un'ampia gamma di annotatori integrati, tra cui scatole di delimitazione 2D, segmentazione semantica, mappe di profondità, normali di superficie e molto altro. La selezione del formato di output, come scatole di delimitazione o animazioni, dipende dai requisiti specifici del modello e dal caso d'uso.
  • Aumento dei dati: nella fase finale, gli sviluppatori possono sfruttare i modelli di base di NVIDIA Cosmos World (WFM) come Cosmos Transfer per aumentare ulteriormente l'immagine dal 3D al reale. In questo modo si garantisce il livello di fotorealismo necessario per le immagini generate, basandosi su semplici indicazioni fornite dall'utente.

Inizia

Crea la tua pipeline SDG per simulazioni robotiche, ispezioni industriali e altri casi d'uso dell'IA fisica con NVIDIA Isaac Sim.

RTX PRO Server: la migliore piattaforma per l'IA industriale e fisica

NVIDIA RTX PRO Server accelera ogni carico di lavoro di digitalizzazione industriale, simulazione di robot e generazione di dati sintetici.