Physical AI

NVIDIA Cosmos

Sviluppa la physical AI più rapidamente con i principali modelli di base del mondo e i framework aperti per l'elaborazione dei dati, l'addestramento e la valutazione.

Prova ora   |   Video   |   Blog

Cosmos 3

Il modello di base aperto di physical AI

Il primo omni-modello con ragionamento nativo, generazione di mondo e azioni. Basato su Mixture-of-Transformers.

Potenzia il ragionamento della visione artificiale

Utilizzalo come un modello linguistico visivo (VLM) per ragionare su oggetti, interazioni e intenzioni in scenari complessi del mondo reale. 

Per gli avvisi in tempo reale e le didascalie dense per l'ispezione di qualità, la sicurezza pubblica, il monitoraggio del traffico, la logistica e la guida autonoma.

Crea modelli di politiche

Accelera l'apprendimento delle politiche robotiche con NVIDIA Cosmos™ 3 come base per i World Action Models (WAM). 

Post-addestra il modello di base del mondo generalizzato su dati specializzati di telecamere e embodiment. Il modello di politiche adatta le azioni pre-apprese ad attività, domini e comportamenti specifici su larga scala.

Simula mondi

Eseguilo come un simulatore di mondo controllabile e basato sulla fisica per prevedere più approcci, valutare i risultati in un ciclo chiuso e convergere sul comportamento corretto. 

Espandi il loop ad ambienti, attività e condizioni per migliorare continuamente senza rischi nel mondo reale.

Scala i dati video sintetici

Genera infiniti futuri plausibili da testo, immagini, video, suono ambientale e input di azione. 

Utilizza la generazione video come immaginazione per addestrare la physical AI senza essere vincolati da ciò che è stato catturato fisicamente.

Power Vision AI Reasoning

Use as a vision language model (VLM) to reason over objects, interactions, and intent across complex real-world scenarios. 

For real-time alerts and dense captioning across quality inspection, public safety, traffic monitoring, logistics, and autonomous driving.

Build Policy Models

Accelerate robot policy learning with Cosmos 3 as the backbone for World Action Models (WAMs). 

Post-train the generalized world foundation model on specialized camera and embodiment data. The policy model adapts pre-learned actions to specific tasks, domains, and behaviors at scale.

Simulate Worlds

Run as a controllable, physics-grounded world simulator to predict multiple approaches, evaluate outcomes in a closed loop, and converge on the right behavior. 

Scale the loop across environments, tasks, and conditions to continuously improve without real-world risk.

Scale Synthetic Video Data

Generate infinite plausible futures from text, image, video, ambient sound and action input. 

Use video generation as imagination to train physical AI without being constrained by what's been physically captured.

Video

Presentazione di Cosmos

Ascolta Jensen Huang, fondatore e CEO di NVIDIA, presentare NVIDIA Cosmos 3 al COMPUTEX 2026, il modello di base più avanzato al mondo progettato per aiutare gli sviluppatori a creare sistemi autonomi in grado di comprendere, simulare e agire nel mondo reale.

Opzioni per iniziare

Inizia a usare NVIDIA Cosmos

1

Pronto a creare? Accedi direttamente ai modelli e al codice aperti.

2

Non sei ancora pronto a creare? Prova i modelli Cosmos nel nostro catalogo in hosting.

3

Serve aiuto? Inizia subito con le nostre ricette pratiche per i modelli.

Sviluppa con Cosmos

Crea basandoti sulla stessa tecnologia che alimenta Cosmos 3. Apri framework e competenze in modo che gli sviluppatori di tutto il mondo possano personalizzare, estendere e contribuire alla physical AI.

Selezione e gestione dei dati

Filtra, annota e deduplica rapidamente grandi quantità di dati dei sensori con Cosmos Curator.

Esamina e valuta gli output video generativi su larga scala utilizzando Cosmos Evaluator.

Addestramento e accelerazione

Crea, post-addestra o distribuisci rapidamente modelli del mondo utilizzando framework aperti di post-addestramento, valutazione e ottimizzazione e script e competenze di inferenza.

Competenze degli agenti per la generazione di dati sintetici

Trasforma gli agenti di codifica in esperti di dati sintetici per lo sviluppo di physical AI.

Casi d'uso

Come Cosmos accelera l'IA in diversi settori

Utilizza i WFM di Cosmos per simulare, fare ragionamenti e generare dati per le pipeline downstream di robotica, veicoli autonomi e sistemi di visione industriale.

Apprendimento robotico

Crea una politica di apprendimento robotico che consenta agli embodied agent di operare in ambienti del mondo reale in condizioni sia note che ignote.

  • Esegui il post-addestramento di Cosmos 3 su attività specifiche per l'embodiment, ambienti, disposizione di telecamere o sensori e politiche
  • Esegui simulazioni a loop chiuso fisicamente accurate
  • Crea una pipeline completa di aumento e valutazione dei dati sintetici utilizzando le competenze degli agenti basate su Cosmos

Addestramento dei veicoli autonomi

Genera dati dei sensori personalizzati, diversificati e ad alta fedeltà per addestrare, testare e convalidare in modo sicuro i veicoli autonomi. 

  • Amplifica la diversità dei dati esistenti con nuovi dati su meteo, illuminazione e geolocalizzazione
  • Post-addestramento per l'espansione nelle visualizzazione multi-sensore
  • Crea una pipeline completa di aumento e valutazione dei dati sintetici utilizzando le competenze degli agenti basate su Cosmos

Agenti IA per l'analisi video

Migliora l'automazione, la sicurezza e l'efficienza operativa in ambienti industriali e urbani. 

Con Cosmos, gli agenti IA possono analizzare, riepilogare e interagire con stream video in tempo reale o registrati per:

  • Fornire avvisi contestuali in tempo reale
  • Parlare con i tuoi video ed estrarre informazioni dai feed delle telecamere dal vivo o dalle librerie video su larga scala
  • Crea agenti IA per l'analisi video con NVIDIA Metropolis Blueprint per la ricerca e il riepilogo video
  • Genera dati di addestramento sintetici per aumentare ulteriormente l'accuratezza della comprensione

Prestazioni

Esecuzione consigliata su NVIDIA AI

Cosmos 3 offre prestazioni ottimali sull'hardware NVIDIA. I server NVIDIA RTX PRO™ 6000 Serie Blackwell accelerano lo sviluppo della physical AI per robot, veicoli autonomi e agenti IA per addestramento, generazione di dati sintetici, simulazione e inferenza.

Sblocca il massimo delle prestazioni per i modelli di base di Cosmos su NVIDIA Blackwell GB200 per i carichi di lavoro industriali di post-addestramento e inferenza.

Ecosistema

Adottato dai principali innovatori di physical AI

Gli sviluppatori di modelli nei settori della robotica, dei veicoli autonomi e dell'IA visiva utilizzano Cosmos per accelerare lo sviluppo della physical AI.

Prossimi passi

Unisciti alla community di Cosmos

Entra in contatto con gli esperti di Cosmos, interagisci con gli altri sviluppatori, fornisci feedback sui modelli e accedi alla formazione continua con livestream e ricette specifiche.

Cosmos Cookbook

Una guida completa per lavorare con l'ecosistema NVIDIA Cosmos per le applicazioni del mondo reale e specifiche per dominio quali robotica, simulazioni, sistemi autonomi e comprensione fisica della scena.

Creare agenti IA per l'analisi video

Utilizza Cosmos Reason con NVIDIA Blueprint per la ricerca e il riepilogo video (VSS) per creare agenti IA per la comprensione dei video scalabile e in tempo reale.

Risorse

Ultime notizie dagli sviluppatori Cosmos

Domande frequenti

Cosmos 3 è basato sull'architettura Mixture of Transformers. I moduli di ragionamento e del generatore utilizzano transformer diversi per prestazioni e generazione efficienti. Il modello prima ragiona e poi genera, risultando in un'accuratezza fisica leader in tutte le capacità. Scopri di più sull'architettura qui.

I WFM di Cosmos sono disponibili per tutti mediante una licenza NVIDIA Open Model.

Cosmos 3 è disponibile al pubblico con script di post-addestramento su GitHub per ogni modalità e modulo. Inoltre, NVIDIA TAO 7 fornisce una suite di competenze e strumenti per gli agenti per l'ottimizzazione dei modelli di visione artificiale, tra cui Cosmos 3, con agenti di codifica e prompt in linguaggio naturale. 

Sì, puoi utilizzare Cosmos per creare da zero con il tuo modello di base o l'architettura di modello preferiti. Puoi iniziare con Cosmos Curator per la pre-elaborazione dei dati video. Quindi comprimi e decodifica i tuoi dati con il tokenizzatore Cosmos. Una volta elaborati i dati, puoi addestrare o perfezionare il modello. 

Utilizzando i microservizi NVIDIA NIM™, puoi integrare facilmente i tuoi modelli di physical AI nelle applicazioni cloud, nei data center e nelle workstation.

Puoi anche utilizzare NVIDIA DGX Cloud per addestrare i modelli IA e distribuirli ovunque su larga scala.

Cosmos 3 è un omni-modello in grado di generare testi, immagini, video, suoni e azioni. Cosmos 2.5 e Cosmos 2 invece mantenevano la percezione e la generazione come modelli separati e le modalità si limitavano a testo, immagini e video.

Omniverse crea simulazioni 3D realistiche di attività del mondo reale utilizzando diverse API generative, SDK e la tecnologia di rendering NVIDIA RTX.

Gli sviluppatori possono immettere le simulazioni Omniverse come video di istruzioni nei modelli Cosmos Transfer per generare dati sintetici fotorealistici e controllabili.

Insieme, Omniverse fornisce ambienti di simulazione pre- e post-addestramento, mentre Cosmos fornisce modelli di base per generare dati video e addestrare i modelli di physical AI.

Scopri di più su NVIDIA Omniverse.