IA physique
Développez des modèles de fondation de monde pour faire progresser l'IA physique.
Aperçu
NVIDIA Cosmos™ est une plateforme avec des modèles de fondation en monde ouvert (WFM), des garde-fous et des bibliothèques de traitement des données pour accélérer le développement de l’IA physique pour les véhicules autonomes, les robots et les agents d'IA d'analyse vidéo.
Modèles
Modèles ouverts et entièrement personnalisables pré-entraînés pour la génération et la compréhension du monde.
Prédisez les états futurs d’environnements dynamiques pour la planification de robotique et d’agents d’IA.
Ce modèle multimodal permet de générer jusqu’à 30 secondes de vidéo haute fidélité à partir d’invites multimodales.
Accélérez la génération de données synthétiques dans divers environnements et conditions d'éclairage.
Ce modèle multi-commandes transforme les entrées 3D ou spatiales à partir de frameworks de simulation d'IA physique, tels que CARLA ou NVIDIA Isaac Sim™, en vidéos entièrement contrôlées et haute fidélité.
Permettez aux robots et aux agents de vision avec l'IA de raisonner comme des humains.
Ce modèle de langage de vision multimodal (VLM) s’appuie sur des connaissances préalables, des connaissances physiques approfondies et du bon sens pour comprendre le monde réel et interagir avec lui.
Accélérez le traitement et la génération efficaces des jeux de données.
Filtrez, annotez et dédupliquez rapidement d’importants volumes de données de capteurs nécessaires au développement de l’IA physique avec Cosmos Curator.
Vous pouvez également interroger instantanément ces jeux de données et récupérer des scénarios avec NVIDIA Cosmos Dataset Search (CDS).
Cas d'utilisation
Les robots ont besoin de données d'entraînement vastes et diversifiées pour percevoir et interagir efficacement avec leur environnement. Les WFM de Cosmos résolvent ce problème de plusieurs manières :
Les données de capteurs diversifiées et haute fidélité sont essentielles pour entraîner, tester et valider en toute sécurité les véhicules autonomes. Mais cette mise à niveau est aussi chronophage que coûteuse.
Grâce aux modèles de WFM Cosmos post-entraînés sur les données du véhicule, vous pouvez :
Renforcez l’automatisation, la sécurité et l’efficacité opérationnelle dans les environnements industriels et urbains.
Avec Cosmos Reason, les agents d'IA peuvent analyser, synthétiser et interagir avec des flux vidéo en temps réel ou enregistrés afin de :
Options de démarrage
Infrastructure d’IA
Les serveurs NVIDIA RTX PRO 6000 de la série Blackwell accélèrent le développement de l'IA physique des robots, des véhicules autonomes et des agents d'IA dans l'entraînement, la génération de données synthétiques, la simulation et l'inférence.
Débloquez des performances maximales des modèles de fondation de monde Cosmos sur NVIDIA Blackwell GB200 pour les charges de travail de post-entraînement et d'inférence industriels.
Écosystème
Les développeurs de modèles dans les secteurs de la robotique, des véhicules autonomes et de la vision par l'IA utilisent Cosmos pour accélérer le développement de l'IA physique.
Ressources
Les WFM de Cosmos sont disponibles dans le cadre d'une licence de modèle ouvert de NVIDIA pour tous.
Référez-vous au nouveau Cosmos Cookbook qui contient des recettes étape par étape et des scripts de post-entraînement pour développer, personnaliser et déployer rapidement les modèles de fondation de monde Cosmos de NVIDIA pour la robotique et les systèmes autonomes.
Oui, vous pouvez exploiter Cosmos pour développer à partir de zéro avec votre modèle de fondation ou votre architecture de modèle préféré. Vous pouvez commencer par utiliser Cosmos Curator pour le prétraitement des données vidéo. Ensuite, compressez et décodez vos données avec Cosmos tokenizer. Une fois que vous avez traité vos données, vous pouvez entraîner ou ajuster votre modèle.
Grâce aux microservices NVIDIA NIM™, vous pouvez facilement intégrer vos modèles d'IA physique à vos applications dans le Cloud, les Data Centers et les stations de travail.
Vous pouvez également utiliser NVIDIA DGX Cloud pour entraîner des modèles d'IA et les déployer n'importe où à grande échelle.
Les trois sont des WFM avec des rôles distincts :
Cosmos Reason peut générer de nouvelles invites textuelles diversifiées à partir d'une vidéo de départ pour Cosmos Predict, ou critiquer et annoter des données synthétiques à partir de Predict et de Transfer.
Omniverse crée des simulations 3D réalistes de tâches réelles à l'aide de différentes API génératives, de kits de développement logiciel et de la technologie de rendu NVIDIA RTX.
Les développeurs peuvent entrer des simulations Omniverse sous forme de vidéos d'instructions dans les modèles Cosmos Transfer pour générer des données synthétiques photoréalistes contrôlables.
Omniverse fournit l'environnement de simulation avant et après l'entraînement, tandis que Cosmos fournit les modèles de base pour générer des données vidéo et entrainer des modèles d'IA physique.
En savoir plus sur NVIDIA Omniverse.