IA fisica
Sviluppa modelli di fondazione del mondo per far progredire l'IA fisica.
Panoramica
NVIDIA Cosmos™ è una piattaforma all'avanguardia con modelli di fondazione del mondo (WFM) generativi, tokenizzatori avanzati, guardrail e una pipeline di elaborazione e selezione dei dati accelerata. È progettata per favorire l'addestramento dei modelli del mondo e accelerare lo sviluppo dell'IA fisica per veicoli autonomi e robot.
Modelli aperti
Modelli generativi multimodali pre-addestrati e pronti all'uso da parte degli sviluppatori, per la generazione di mondi o il ragionamento oppure per il post-addestramento finalizzato allo sviluppo di modelli di IA fisica specializzati.
Un modello di previsione all'avanguardia in grado di generare fino a 30 secondi di video continui da ingressi multimodali con velocità, fedeltà e massima corrispondenza ai prompt.
Modello multicontrollo per scalare rapidamente una singola simulazione o un video spaziale in vari ambienti e condizioni di illuminazione.
Accelera gli input 3D da framework di simulazione fisica IA, come CARLA o NVIDIA Isaac Sim™, per consentire l'aumento dei dati completamente controllabile e pipeline di generazione di dati sintetici.
Modello di linguaggio visivo completamente personalizzabile (VLM) che eccelle nella comprensione del mondo fisico come gli esseri umani utilizzando il ragionamento strutturato su video e immagini.
Pensato per alimentare gli agenti IA per l'analisi video al run-time con la comprensione spazio-temporale delle operazioni urbane e industriali, per selezionare i dati di training per la robotica e i veicoli autonomi (AV) e favorire il processo decisionale dei robot.
NVIDIA Cosmos Curator è un framework che consente agli sviluppatori di filtrare, annotare e deduplicare rapidamente grandi quantità di dati dei sensori necessari per lo sviluppo di IA fisica, creando set di dati personalizzati per soddisfare le esigenze dei modelli.
Accelera l'elaborazione e la generazione efficiente dei set di dati.
Scenari di utilizzo
Utilizza i modelli di base del mondo Cosmos per simulare, ragionare e generare dati per progetti di robotica, veicoli autonomi e sistemi di visione industriale.
I robot hanno bisogno di dati di training vasti e diversi per percepire e interagire efficacemente con gli ambienti. Con Cosmos WFM, gli sviluppatori possono generare dati sintetici controllabili e ad alta fedeltà per addestrare i modelli di percezione e di policy dei robot.
I dati dei sensori ad alta fedeltà sono fondamentali per eseguire in sicurezza il training, i test e la convalida dei veicoli autonomi. Con i WFM Cosmos post-addestrati sui dati dei veicoli, gli sviluppatori possono ampliare la diversità dei dati esistenti con nuove modalità meteorologiche, di illuminazione e di geolocalizzazione, o espanderli in visualizzazioni multisensore, risparmiando tempo e costi significativi.
Questi agenti IA possono analizzare, riassumere e interagire con flussi video in tempo reale o registrati per migliorare l'automazione, la sicurezza e l'efficienza operativa in ambienti industriali e urbani.
Cosmos Reason è un modello di linguaggio visivo personalizzabile (VLM) che alimenta gli agenti AI per l'analisi video con una comprensione avanzata e una capacità di ragionamento spazio-temporale per il mondo fisico. Questi agenti IA forniscono risposte a domande in tempo reale, avvisi rapidi e approfondimenti contestuali, alimentando sistemi più intelligenti e reattivi in implementazioni edge e cloud.
IA affidabile
I modelli Cosmos, i guardrail e i tokenizer sono disponibili su Hugging Face e GitHub, con risorse per affrontare la carenza di dati nell'allenamento dei modelli fisici di IA.
Infrastruttura IA
I server NVIDIA RTX PRO 6000 serie Blackwell accelerano lo sviluppo di IA fisica per robot, veicoli autonomi e agenti IA attraverso il training, la generazione di dati sintetici, la simulazione e l'inferenza.
Sblocca le prestazioni massime dei modelli di base del mondo Cosmos su NVIDIA Blackwell GB200 per carichi di lavoro di post-raining e inferenza industriali.
Ecosistema
Gli sviluppatori di modelli nei settori della robotica, dei veicoli autonomi e dell'IA visiva utilizzano Cosmos per accelerare lo sviluppo dell'IA fisica.
Risorse
Inizia consultando la documentazione. I modelli fondamentali del mondo Cosmos sono pubblicamente disponibili su Hugging Face con script per l'inferenza e il post-training su GitHub. Gli sviluppatori e le sviluppatrici possono inoltre utilizzare il tokenizzatore Cosmos da /NVIDIA/cosmos-tokenizer su GitHub e Hugging Face.
I WFM di Cosmos sono disponibili su licenza NVIDIA Open Model, per tutti.
Gli script PyTorch sono disponibili pubblicamente per tutti i modelli Cosmos per il post-training. Leggi la documentazione per informazioni dettagliate sul post-addestramento.
Sì, puoi utilizzare Cosmos per creare da zero con il tuo modello di fondazione o l'architettura di modello preferiti. Puoi iniziare utilizzando NeMo Curator per la pre-elaborazione dei dati video. Quindi comprimi e decodifica i tuoi dati con il tokenizzatore Cosmos. Una volta elaborati i dati, puoi addestrare o ottimizzare il modello utilizzando NVIDIA NeMo.
Utilizzando i microservizi NVIDIA NIM™, puoi integrare facilmente i modelli di IA fisica nelle applicazioni cloud, nei data centers e nelle workstation.
Puoi anche utilizzare NVIDIA DGX Cloud per addestrare i modelli IA e distribuirli ovunque su larga scala.
Tutti e tre sono modelli WFM con ruoli distinti:
Cosmos Reason può generare nuovi e diversi messaggi di testo da un video iniziale per Cosmos Predict, o criticare e annotare dati sintetici da Predict e Transfer.
Omniverse crea simulazioni 3D realistiche di attività del mondo reale utilizzando diverse API generative, SDK e la tecnologia di rendering NVIDIA RTX.
Gli sviluppatori possono immettere le simulazioni Omniverse come video di istruzioni nei modelli Cosmos Transfer per generare dati sintetici fotorealistici controllabili.
Insieme, Omniverse fornisce ambienti di simulazione pre- e post- addestramento, mentre Cosmos fornisce modelli di fondazione per generare dati video e addestrare i modelli di IA fisica.
Scopri di più su NVIDIA Omniverse.