IA fisica

NVIDIA Cosmos

Una piattaforma aperta per l'IA fisica con world foundation models (WFM), librerie di elaborazione dei dati video, valutazione video e framework di post-addestramento.

Cookbook   |   Documentazione   |   Discord

Modelli di base del mondo

Modelli aperti per la generazione e la comprensione del mondo

Cosmos Predict

Modello di generazione leader al mondo, adattabile a qualsiasi attività o ambiente di IA fisica.

Genera mondi video predittivi di 30s da testi, immagini o video con i modelli 2B/14B o post-addestra i tuoi dati per creare casi edge personalizzati, politiche a ciclo chiuso e simulazioni multiview incentrate sui robot.

Cosmos Transfer

Modello multicontrollo per la trasformazione da simulazione a fotoreale.

Abbinalo ai framework di simulazione di IA fisica, come CARLA o NVIDIA Isaac Sim™, per accelerare la generazione di dati sintetici in vari ambienti e condizioni di illuminazione.

Cosmos Reason

Il principale modello linguistico visivo (VLM) che consente ai robot e agli agenti di IA visiva di ragionare come gli umani.

Combina le conoscenze precedenti, la fisica e il buon senso per fornire avvisi in tempo reale e informazioni utili nei settori della sicurezza pubblica, del monitoraggio del traffico, della logistica, dell'ispezione della qualità e di IA fisica.

Elaborazione dei dati e valutazione

Accelera l'elaborazione e la valutazione efficienti dei set di dati.

Cosmos Curator

Filtra, annota e deduplica rapidamente grandi quantità di dati dei sensori con Cosmos Curator.

Ricerca nel set di dati Cosmos

Esegui query sui set di dati e recupera gli scenari immediatamente con NVIDIA Cosmos Dataset Search (CDS).

Cosmos Evaluator

Esamina e valuta gli output video generativi su larga scala utilizzando Cosmos Evaluator.

Casi d'uso

Come Cosmos accelera l'IA in diversi settori

Utilizza i WFM di Cosmos per simulare, fare ragionamenti e generare dati per le pipeline downstream di robotica, veicoli autonomi e sistemi di visione industriale.

Robot Learning

Crea modelli del mondo personalizzati per attività a valle, ambienti, layout di telecamere o sensori e politiche.

  • Post-addestramento di Cosmos Predict per visualizzazioni o politiche di controllo specifiche per robot
  • Genera dati sintetici in ambienti e condizioni di illuminazione con Cosmos Transfer
  • Post-addestramento di Cosmos Reason utilizzando il framework Cosmos RL per creare modelli vision-language-action (VLA)
  • Crea una pipeline completa di aumento e valutazione dei dati sintetici utilizzando il physical AI Data Factory Blueprint basato su Cosmos

Addestramento dei veicoli autonomi

Genera dati dei sensori personalizzati, diversificati e ad alta fedeltà per l'addestramento, il test e la convalida di veicoli autonomi in modo sicuro.

  • Amplifica la diversità dei dati esistenti con nuovi dati su meteo, illuminazione e geolocalizzazione utilizzando Cosmos Transfer
  • Espandi le viste multi-sensore con Cosmos Predict
  • Crea una pipeline completa di aumento e valutazione dei dati sintetici utilizzando il physical AI Data Factory Blueprint basato su Cosmos

Agenti IA per l'analisi video e Analytics

Migliora l'automazione, la sicurezza e l'efficienza operativa in ambienti industriali e urbani. 

Con Cosmos Reason, gli agenti IA possono analizzare, riepilogare e interagire con stream video in tempo reale o registrati per:

  • Rispondere a domande e fornire avvisi in tempo reale
  • Fornire informazioni contestuali avanzate
  • Estrai informazioni dai dati video su larga scala con NVIDIA Blueprint per la ricerca e il riepilogo di video

Opzioni per iniziare

Inizia a usare NVIDIA Cosmos

1

Pronto a creare? Accedi direttamente ai modelli e al codice aperti.

2

Non sei ancora pronto a creare? Prova i modelli Cosmos nel nostro catalogo in hosting.

3

Serve aiuto? Inizia subito con le nostre ricette pratiche per i modelli.

IA affidabile

Supportare la community dell'IA fisica

I modelli Cosmos, i guardrail e i tokenizzatori sono disponibili su Hugging Face e GitHub, con risorse per affrontare la scarsità di dati nell'addestramento dei modelli di IA fisica.

Infrastruttura IA

Ottieni le migliori prestazioni con NVIDIA Blackwell

I server NVIDIA RTX PRO 6000 Serie Blackwell accelerano lo sviluppo dell'IA fisica per robot, veicoli autonomi e agenti IA per addestramento, generazione di dati sintetici, simulazione e inferenza.

Sblocca il massimo delle prestazioni per i modelli di base di Cosmos su NVIDIA Blackwell GB200 per i carichi di lavoro industriali di post-addestramento e inferenza.

Ecosistema

Adottato dai principali innovatori di IA fisica

Gli sviluppatori di modelli nei settori della robotica, dei veicoli autonomi e dell'IA visiva utilizzano Cosmos per accelerare lo sviluppo dell'IA fisica.

Prossimi passi

Unisciti alla community di Cosmos

Entra in contatto con gli esperti di Cosmos, interagisci con gli altri sviluppatori, fornisci feedback sui modelli e accedi alla formazione continua con livestream e ricette specifiche.

Cosmos Cookbook

Una guida completa per lavorare con l'ecosistema NVIDIA Cosmos per le applicazioni del mondo reale e specifiche per dominio quali robotica, simulazioni, sistemi autonomi e comprensione fisica della scena.

Creare agenti IA per l'analisi video

Utilizza Cosmos Reason con NVIDIA Blueprint per la ricerca e il riepilogo video (VSS) per creare agenti IA per la comprensione dei video scalabile e in tempo reale.

Risorse

Ultime notizie dagli sviluppatori Cosmos

Domande frequenti

[22 gennaio 2026] Rilasciata la ricerca su Cosmos Policy basata su Cosmos Predict-2 per il controllo e la pianificazione visuomotoria.

[9 febbraio 2026] Supporto di calcolo, quantizzazione e compatibilità CUDA migliorati per il nuovo Cosmos Reason 2.

[19 dicembre 2025] Rilasciato il supporto Diffusers per Cosmos-Predict2.5-2B tramite Hugging Face, il checkpoint distillato Cosmos-Predict2.5-2B Text2World su Hugging Face e la guida alla distillazione.

[19 dicembre 2025] Rilasciate le capacità di Image2Image e ImagePrompt per Cosmos Transfer 2.5. Vedi la guida all'inferenza qui.

Esplora GitHub per saperne di più.

I WFM di Cosmos sono disponibili per tutti mediante una licenza NVIDIA Open Model.

Fai riferimento al nuovo Cosmos Cookbook che contiene ricette passo-passo e script di post-addestramento per creare, personalizzare e distribuire rapidamente i modelli di fondazione del mondo Cosmos di NVIDIA per la robotica e i sistemi autonomi.

Sì, puoi utilizzare Cosmos per creare da zero con il tuo modello di fondazione o l'architettura di modello preferiti. Puoi iniziare con Cosmos Curator per la pre-elaborazione dei dati video. Quindi comprimi e decodifica i tuoi dati con il tokenizzatore Cosmos. Una volta elaborati i dati, puoi addestrare o perfezionare il modello. 

Utilizzando i microservizi NVIDIA NIM™, puoi integrare facilmente i modelli di IA fisica nelle applicazioni cloud, nei data centers e nelle workstation.

Puoi anche utilizzare NVIDIA DGX Cloud per addestrare i modelli IA e distribuirli ovunque su larga scala.

Tutti e tre sono dei WFM con ruoli distinti:

  • Cosmos Predict genera diverse scene video da prompt di testo, immagini o video ed è l'ideale per il post-addestramento, ad esempio, di robot o auto a guida autonoma.
  • Cosmos Transfer applica il trasferimento di stili multi-controllo, modificando l'illuminazione e gli ambienti, su video basati sulla fisica, spesso creati in simulatori come NVIDIA Omniverse™.
  • Cosmos Reason risponde alle query ragionando sugli input di video e immagini. Cosmos Reason può generare prompt di testo nuovi e diversi da un video iniziale per Cosmos Predict, o esaminare e annotare i dati sintetici generati da Cosmos Predict e Cosmos Transfer.

Omniverse crea simulazioni 3D realistiche di attività del mondo reale utilizzando diverse API generative, SDK e la tecnologia di rendering NVIDIA RTX.

Gli sviluppatori possono immettere le simulazioni Omniverse come video di istruzioni nei modelli Cosmos Transfer per generare dati sintetici fotorealistici controllabili.

Insieme, Omniverse fornisce ambienti di simulazione pre- e post-addestramento, mentre Cosmos fornisce modelli di fondazione per generare dati video e addestrare i modelli di IA fisica.

Scopri di più su NVIDIA Omniverse.