IA fisica
Sviluppa modelli di fondazione del mondo per far progredire l'IA fisica.
Panoramica
NVIDIA Cosmos™ è una piattaforma con modelli di base del mondo (WFM) aperti, guardrail e librerie di elaborazione dati per accelerare lo sviluppo di IA fisica per veicoli autonomi, robot e agenti IA per l'analisi video.
Modelli
Modelli pre-addestrati aperti e completamente personalizzabili per la generazione e la comprensione di mondi.
Prevedere gli stati futuri di ambienti dinamici per la pianificazione di robot e agenti IA.
Questo modello per la generazione di mondi produce fino a 30 secondi di video ad alta fedeltà da prompt multimodali.
Accelera la generazione di dati sintetici in vari ambienti e condizioni di illuminazione.
Questo modello multicontrollo trasforma input 3D o spaziali da framework di simulazione fisica IA, come CARLA o NVIDIA Isaac Sim™, in video ad alta fedeltà completamente controllati.
Consenti ai robot e agli agenti di IA visiva di ragionare come gli umani.
Questo modello linguistico visivo (VLM) multimodale sfrutta le conoscenze precedenti, la comprensione della fisica e il senso comune per comprendere il mondo reale e interagire con esso.
Accelera l'elaborazione e la generazione efficienti di set di dati.
Filtra, annota e deduplica rapidamente grandi quantità di dati dei sensori necessari per lo sviluppo di IA fisica con Cosmos Curator.
Puoi anche eseguire query su questi set di dati e recuperare scenari istantaneamente con NVIDIA Cosmos Dataset Search (CDS).
Casi d'uso
Utilizza i WFM di Cosmos per simulare, fare ragionamenti e generare dati per le pipeline downstream di robotica, veicoli autonomi e sistemi di visione industriale.
I robot hanno bisogno di dati di addestramento vasti e diversificati per percepire e interagire efficacemente con l'ambiente. I WFM Cosmos risolvono questo problema in diversi modi:
I dati dei sensori diversificati e ad alta fedeltà sono fondamentali per addestrare, testare e convalidare in modo sicuro i veicoli autonomi. Ma è difficile, richiede tempo ed è costoso da scalare.
Con i WFM Cosmos post-addestrati sui dati del veicolo, puoi:
Migliora l'automazione, la sicurezza e l'efficienza operativa in ambienti industriali e urbani.
Con Cosmos Reason, gli agenti IA possono analizzare, riepilogare e interagire con stream video in tempo reale o registrati per:
Opzioni per iniziare
Infrastruttura IA
I server NVIDIA RTX PRO 6000 Serie Blackwell accelerano lo sviluppo dell'IA fisica per robot, veicoli autonomi e agenti IA per addestramento, generazione di dati sintetici, simulazione e inferenza.
Sblocca il massimo delle prestazioni per i modelli di base di Cosmos su NVIDIA Blackwell GB200 per i carichi di lavoro industriali di post-addestramento e inferenza.
Ecosistema
Gli sviluppatori di modelli nei settori della robotica, dei veicoli autonomi e dell'IA visiva utilizzano Cosmos per accelerare lo sviluppo dell'IA fisica.
Risorse
I WFM di Cosmos sono disponibili per tutti mediante una licenza NVIDIA Open Model.
Fai riferimento al nuovo Cosmos Cookbook che contiene ricette passo-passo e script di post-addestramento per creare, personalizzare e distribuire rapidamente i modelli di base del mondo Cosmos di NVIDIA per la robotica e i sistemi autonomi.
Sì, puoi utilizzare Cosmos per creare da zero con il tuo modello di fondazione o l'architettura di modello preferiti. Puoi iniziare con Cosmos Curator per la pre-elaborazione dei dati video. Quindi comprimi e decodifica i tuoi dati con il tokenizzatore Cosmos. Una volta elaborati i dati, puoi addestrare o perfezionare il modello.
Utilizzando i microservizi NVIDIA NIM™, puoi integrare facilmente i modelli di IA fisica nelle applicazioni cloud, nei data centers e nelle workstation.
Puoi anche utilizzare NVIDIA DGX Cloud per addestrare i modelli IA e distribuirli ovunque su larga scala.
Tutti e tre sono dei WFM con ruoli distinti:
Cosmos Reason può generare prompt di testo nuovi e diversi da un video iniziale per Cosmos Predict, o esaminare e annotare i dati sintetici generati da Cosmos Predict e Cosmos Transfer.
Omniverse crea simulazioni 3D realistiche di attività del mondo reale utilizzando diverse API generative, SDK e la tecnologia di rendering NVIDIA RTX.
Gli sviluppatori possono immettere le simulazioni Omniverse come video di istruzioni nei modelli Cosmos Transfer per generare dati sintetici fotorealistici controllabili.
Insieme, Omniverse fornisce ambienti di simulazione pre- e post-addestramento, mentre Cosmos fornisce modelli di fondazione per generare dati video e addestrare i modelli di IA fisica.
Scopri di più su NVIDIA Omniverse.