IA physique
Une plateforme ouverte pour l'IA physique avec des modèles de fondation de monde (WFM), des bibliothèques de traitement des données vidéo, l'évaluation vidéo et des frameworks de post-entraînement.
Modèles de fondation de monde
Modèle de génération de monde de premier plan, adaptable à n'importe quelle tâche ou environnement d'IA physique.
Générez des mondes vidéo prédictifs sur 30 s à partir de texte, d'images ou de vidéos avec des modèles 2B/14B, ou effectuez un post-entraînement sur vos données pour créer des cas à l'Edge personnalisés, des politiques en boucle fermée et des simulations multivues centrées sur les robots.
Modèle multicontrôle pour la transformation de la simulation vers le photoréalisme.
Associez-le à des frameworks de simulation d'IA physique, tels que CARLA ou NVIDIA Isaac Sim™, pour accélérer la génération de données synthétiques dans divers environnements et conditions d'éclairage.
Modèle de langage de vision (VLM) de pointe permettant aux robots et aux agents d'IA de vision de raisonner comme les humains.
Combine les connaissances préalables, la physique et le bon sens pour générer des alertes en temps réel et des informations exploitables dans les domaines de la sécurité publique, de la surveillance du trafic, de la logistique, de l'inspection qualité et de l'IA physique.
Accélérez le traitement et l'évaluation efficaces des jeux de données.
Cas d'utilisation
Créez des modèles de monde personnalisés pour des tâches, des environnements, des dispositions de caméras ou de capteurs et des politiques en aval.
Générez des données de capteurs personnalisées, diversifiées et haute fidélité pour entraîner, tester et valider des véhicules autonomes en toute sécurité.
Renforcez l’automatisation, la sécurité et l’efficacité opérationnelle dans les environnements industriels et urbains.
Avec Cosmos Reason, les agents d'IA peuvent analyser, synthétiser et interagir avec des flux vidéo en temps réel ou enregistrés afin de :
Options de démarrage
Infrastructure d’IA
Les serveurs NVIDIA RTX PRO 6000 de la série Blackwell accélèrent le développement de l'IA physique des robots, des véhicules autonomes et des agents d'IA dans l'entraînement, la génération de données synthétiques, la simulation et l'inférence.
Débloquez des performances maximales des modèles de fondation de monde Cosmos sur NVIDIA Blackwell GB200 pour les charges de travail de post-entraînement et d'inférence industriels.
Écosystème
Les développeurs de modèles dans les secteurs de la robotique, des véhicules autonomes et de la vision par l'IA utilisent Cosmos pour accélérer le développement de l'IA physique.
Ressources
[22 janvier 2026] Publication de la recherche sur Cosmos Policy qui s'appuie sur Cosmos Predict-2 pour le contrôle et la planification visuomoteurs.
[9 février 2026] Amélioration de la prise en charge du calcul, de la quantification et de la compatibilité avec CUDA pour le nouveau Cosmos Reason 2.
[19 décembre 2025] Publication de la prise en charge des diffusers de Cosmos-Predict2.5-2B via Hugging Face et le point de contrôle distillé de Cosmos-Predict2.5-2B Text2World sur Hugging Face et le guide de Distillation.
[19 décembre 2025] Publication des capacités Image2Image et ImagePrompt pour Cosmos Transfer 2.5. Consultez le guide d'inférence ici.
Découvrez GitHub pour en savoir plus.
Les WFM de Cosmos sont disponibles dans le cadre d'une licence de modèle ouvert de NVIDIA pour tous.
Référez-vous au nouveau Cosmos Cookbook qui contient des recettes étape par étape et des scripts de post-entraînement pour développer, personnaliser et déployer rapidement les modèles de fondation de monde Cosmos de NVIDIA pour la robotique et les systèmes autonomes.
Oui, vous pouvez exploiter Cosmos pour développer à partir de zéro avec votre modèle de fondation ou votre architecture de modèle préféré. Vous pouvez commencer par utiliser Cosmos Curator pour le prétraitement des données vidéo. Ensuite, compressez et décodez vos données avec le générateur de jetons Cosmos. Une fois que vous avez traité vos données, vous pouvez entraîner ou ajuster votre modèle.
Grâce aux microservices NVIDIA NIM™, vous pouvez facilement intégrer vos modèles d'IA physique à vos applications dans le Cloud, les Data Centers et les stations de travail.
Vous pouvez également utiliser NVIDIA DGX Cloud pour entraîner des modèles d'IA et les déployer n'importe où à grande échelle.
Les trois sont des WFM avec des rôles distincts :
Omniverse crée des simulations 3D réalistes de tâches réelles à l'aide de différentes API génératives, de kits de développement logiciel et de la technologie de rendu NVIDIA RTX.
Les développeurs peuvent entrer des simulations Omniverse sous forme de vidéos d'instructions dans les modèles Cosmos Transfer pour générer des données synthétiques photoréalistes contrôlables.
Omniverse fournit l'environnement de simulation avant et après l'entraînement, tandis que Cosmos fournit les modèles de base pour générer des données vidéo et entrainer des modèles d'IA physique.
En savoir plus sur NVIDIA Omniverse.