Generazione di dati sintetici (SDG)

Accelera lo sviluppo di flussi di lavoro di IA fisica e per agenti.

Carichi di lavoro

Simulazione/Modellazione/Design
Robotica
IA generativa

Settori

Tutti i settori

Obiettivo aziendale

Innovazione

Prodotti

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Panoramica

Perché utilizzare dati sintetici?

Il training dei modelli di IA richiede set di dati accuratamente etichettati, di alta qualità e diversificati, al fine di garantire l'accuratezza e le prestazioni desiderate. In molti casi, i dati sono limitati, riservati o non disponibili. La raccolta e l'etichettatura di dati reali richiedono tempo e possono risultare onerose, rallentando lo sviluppo di diversi tipi di modelli, tra cui i modelli linguistici visivi e i modelli linguistici di grandi dimensioni (LLM).

I dati sintetici, generati tramite simulazioni al computer, modelli di IA generativa o una combinazione di entrambi, possono contribuire a superare questa sfida. I dati sintetici possono includere testi, video e immagini 2D o 3D, sia nello spettro visivo che non visivo, e possono essere utilizzati insieme ai dati reali per il training di modelli di IA fisica multimodali. In questo modo, è possibile ridurre significativamente i tempi di training e abbattere i costi in modo considerevole.

I dati sintetici, generati tramite simulazioni o IA, mitigano la scarsità di dati fornendo testi, video e immagini 2D/3D, che possono essere integrati con dati reali per il training di modelli di IA fisica multimodali, riducendo tempi e costi.

Velocità di training dei modelli IA

Colma il divario di dati e accelera lo sviluppo dei modelli di IA, riducendo al contempo i costi complessivi di acquisizione ed etichettatura dei dati necessari per il training.

Privacy e sicurezza

Affrontare i problemi di privacy e ridurre i pregiudizi generando diversi set di dati sintetici per rappresentare il mondo reale.

Accuratezza

Creare modelli IA generalizzati e altamente accurati, addestrando con vari dati che includono casi d'angolo rari, ma cruciali, che altrimenti non sarebbe possibile raccogliere.

Scalabile

Genera dati in modo procedurale attraverso pipeline automatizzate, adattabili al proprio caso d'uso nei settori della produzione, automobilistico, robotica e altri ancora.

Dati sintetici per lo sviluppo dell'IA fisica

I modelli di IA fisica permettono ai sistemi autonomi di percepire, comprendere, interagire e navigare nell'ambiente reale. I dati sintetici sono essenziali per il training e il testing dei modelli di IA fisica.

Training dei modelli di base

I modelli fondamentali mondiali (MFM) utilizzano una varietà di dati di input, tra cui testo, immagini, video e informazioni sul movimento, per generare e simulare mondi virtuali con una notevole precisione.

I WFM si distinguono per una straordinaria capacità di generalizzazione, che consente una messa a punto minima per adattarsi a diverse applicazioni. Agiscono come motori cognitivi per robot e veicoli autonomi, sfruttando una comprensione approfondita delle dinamiche del mondo reale. Per raggiungere questo livello di sofisticazione, i MFM si basano su grandi quantità di dati per l'addestramento.


Lo sviluppo di WFM beneficia significativamente dalla generazione di dati sintetici illimitati tramite simulazioni fisicamente accurate. Questo approccio non solo accelera il training dei modelli, ma ne potenzia anche la capacità di generalizzazione in una varietà di scenari. Le tecniche di randomizzazione del dominio aumentano ulteriormente questo processo consentendo la manipolazione di numerosi parametri come l'illuminazione, lo sfondo, il colore, la posizione e l'ambiente: variazioni che sarebbero quasi impossibili da catturare completamente dai soli dati del mondo reale.

Training della policy di robot

L'apprendimento robotico è un insieme di algoritmi e metodologie che consentono ai robot di acquisire nuove abilità, come manipolazione, locomozione e classificazione, operando in ambienti simulati o reali. L'apprendimento per rinforzo, l'apprendimento per imitazione e la politica di diffusione sono le metodologie chiave applicate per l'addestramento dei robot.

Una competenza fondamentale per i robot è la manipolazione, che include operazioni come raccogliere, ordinare e assemblare oggetti, attività essenziali in contesti industriali e manifatturieri. Le dimostrazioni umane del mondo reale vengono comunemente utilizzate come dati di input per il training dei modelli. Tuttavia, la raccolta di un dataset ampio e diversificato comporta costi elevati.

Per superare questa sfida, i team di sviluppo possono utilizzare i blueprint NVIDIA Isaac GR00T-Mimic e GR00T-Dreams, basati su NVIDIA Cosmos™, per produrre set di dati di movimento sintetici e diversificati per l'addestramento.

Il blueprint NVIDIA Isaac GR00T-Dreams genera una grande quantità di dati sintetici sulle traiettorie utilizzando Cosmos, a partire da una singola immagine e istruzioni linguistiche. Ciò consente ai robot di apprendere nuove attività in ambienti sconosciuti senza la necessità di dati specifici per la teleoperazione.

Questi set di dati possono quindi essere utilizzati per addestrare i modelli di fondazione aperti Isaac GR00T N all'interno di Isaac Lab, rendendo possibile il ragionamento umanoide generalizzato e una solida acquisizione delle competenze.

Test e convalida

Il software-in-loop (SIL) rappresenta una fase di test cruciale per robot e veicoli autonomi basati su IA, in cui il software di controllo viene valutato all'interno di un ambiente simulato anziché su hardware fisico.

I dati sintetici generati tramite simulazione garantiscono una modellazione accurata della fisica del mondo reale, inclusi gli ingressi dei sensori, la dinamica degli attuatori e le interazioni ambientali. In questo modo è possibile simulare scenari rari o pericolosi, difficili da acquisire nel mondo reale, garantendo un training più sicuro ed efficace. In questo modo si assicura che lo stack software del robot in simulazione replichi fedelmente il comportamento del robot fisico, consentendo test e convalide approfondite senza la necessità di hardware fisico.

Mega, un Omniverse Blueprint per sviluppare, testare e ottimizzare flotte di IA fisica e di robot su vasta scala, trasformando le flotte in gemelli digitali prima di distribuirle nelle strutture reali.

Questi robot simulati possono eseguire attività percependo e ragionando all'interno degli ambienti. Sono in grado di pianificare i movimenti successivi ed eseguire azioni simulate all'interno del digital twin. I dati sintetici generati da queste simulazioni vengono reintegrati nei cervelli robotici. Il cervello robotico interpreta i risultati e decide l'azione successiva, innescando un ciclo continuo in cui Mega monitora con precisione lo stato e la posizione di tutti gli asset nel digital twin.

Dati sintetici per lo sviluppo di LLM e IA per agenti

I modelli generativi possono essere utilizzati per avviare e aumentare i processi di generazione di dati sintetici. I modelli da testo a 3D consentono la creazione di risorse 3D per popolare una scena di simulazione 3D. I modelli di IA generativi da testo a immagine possono essere utilizzati anche per modificare e aumentare le immagini esistenti, generate da simulazioni o raccolte nel mondo reale attraverso l'inpainting o l'outpainting procedurale.

I modelli di IA generativa da testo a testo, come Evian 2 405B e Nemotron-4 340B, possono essere utilizzati per generare dati sintetici per creare potenti Modelli di Linguaggio di Grandi Dimensioni (LLM) per il settore sanitario, la finanza, la sicurezza informatica, la vendita al dettaglio e le telecomunicazioni.

Evian 2 405B e Nemotron-4 340B offrono una licenza aperta, concedendo agli sviluppatori il diritto di possedere e utilizzare i dati generati nelle proprie applicazioni, sia in ambito accademico che commerciale.

Come creare una pipeline SDG basata sull'IA generativa

L'IA generativa può accelerare significativamente la creazione su larga scala di dati sintetici fisicamente accurati. Gli sviluppatori possono iniziare a sfruttare l'IA generativa per SDG attraverso un flusso di lavoro di riferimento dettagliato.


Implementazione tecnica

Generazione di dati sintetici

Per l'IA fisica

  • Creazione di scene: una scena 3D completa costituisce la base, integrando elementi essenziali come scaffali, scatole e pallet per ambienti di magazzino, oppure alberi, strade ed edifici per scenari esterni. Gli ambienti possono essere arricchiti dinamicamente tramite i microservizi NVIDIA NIM™ per Universal Scene Description (OpenUSD), permettendo l'integrazione fluida di oggetti diversi e l'aggiunta di sfondi HDRI a 360°.
  • Randomizzazione del dominio: gli sviluppatori possono utilizzare USD Code NIM, una LLM all'avanguardia specializzata in OpenUSD, per implementare la randomizzazione del dominio. Questo potente strumento non solo fornisce risposte su OpenUSD, ma genera anche codice USD in Python per modificare la scena, semplificando l'alterazione programmatica di vari parametri all'interno di NVIDIA Omniverse.
  • Generazione di dati: la terza fase consiste nell'esportazione del set iniziale di immagini annotate. Omniverse mette a disposizione un'ampia gamma di annotatori integrati, tra cui scatole di delimitazione 2D, segmentazione semantica, mappe di profondità, normali di superficie e molto altro. La selezione del formato di output, come scatole di delimitazione o animazioni, dipende dai requisiti specifici del modello e dal caso d'uso.
  • Data augmentation: nella fase finale, gli sviluppatori possono utilizzare i WFM di NVIDIA Cosmos per migliorare ulteriormente la qualità dell'immagine, trasformandola da 3D a quella reale. In questo modo si garantisce il livello di fotorealismo necessario per le immagini generate, basandosi su semplici indicazioni fornite dall'utente.

Per LLM e IA per agenti

  • Modelli di accesso: scarica la famiglia di modelli open-source Nemotron-4 340B dal catalogo NVIDIA NGC™ o da Hugging Face. Puoi inoltre accedervi tramite build.nvidia.com come microservizio NVIDIA NIM.
  • Generazione di dati specifici per il dominio: il modello open-source Nemotron-4-340B-Instruct può generare set di dati sintetici personalizzati, basati su testo e adattati a diversi domini, riproducendo fedelmente le caratteristiche del mondo reale.
  • Valuta e filtra: utilizza il modello Nemotron-4 340B-Reward per analizzare le risposte generate, valutandole in base a criteri quali utilità, correttezza, coerenza, complessità e verbosità.
  • Sfrutta set di dati sintetici di alta qualità e rilevanza: ottimizza iterativamente i dati sintetici in base al feedback del modello di ricompensa, assicurando massima accuratezza e pertinenza.

Ecosistema dei partner

Ecosistema dei partner di dati sintetici

Scopri come i nostri partner dell'ecosistema stanno sviluppando le proprie applicazioni e servizi di dati sintetici basati sulle tecnologie NVIDIA.

Aziende di dati sintetici

Partner per i servizi

Inizia

Crea la tua pipeline SDG per simulazioni robotiche, ispezioni industriali e altri casi d'uso dell'IA fisica con NVIDIA Isaac Sim.

RTX PRO Server: la migliore piattaforma per l'IA industriale e fisica

NVIDIA RTX PRO Server accelera ogni carico di lavoro di digitalizzazione industriale, simulazione di robot e generazione di dati sintetici.

Casi d'uso correlati