Physische KI
Eine offene Plattform für physische KI mit World-Foundation-Modellen (WFMs), Videodatenverarbeitungsbibliotheken, Videobewertung und Frameworks für das Nachtrainieren.
World-Foundation-Modelle
Führendes Weltgenerierungsmodell, anpassbar an jede physische KI-Aufgabe oder Umgebung.
Generieren Sie mit 2B/14B-Modellen 30-sekündige prädiktive Videowelten aus Text, Bildern oder Videos. Führen Sie ein Nachtraining mit Ihren Daten durch, um benutzerdefinierte Sonderfälle, geschlossene Regelkreise und roboterzentrierte Mehransicht-Simulationen zu erstellen.
Multicontrol-Modell für die Transformation von der Simulation zum Fotorealismus.
Kombinieren Sie mit physischen KI-Simulationsframeworks wie CARLA oder NVIDIA Isaac Sim™, um die Generierung synthetischer Daten in verschiedenen Umgebungen und Lichtverhältnissen zu beschleunigen.
Führendes Vision Language Model (VLM), das es Robotern und Vision-AI-Agenten ermöglicht, wie Menschen zu denken.
Kombiniert Vorwissen, Physik und Common Sense für Echtzeit-Warnungen und umsetzbare Erkenntnisse in den Bereichen öffentliche Sicherheit, Verkehrsüberwachung, Logistik, Qualitätsprüfung und physische KI.
Beschleunigen Sie die effiziente Verarbeitung und Bewertung von Datensätzen.
Anwendungsbeispiele
Erstellen Sie benutzerdefinierte Weltmodelle für nachgelagerte Aufgaben, Umgebungen, Kamera- oder Sensoranordnungen und Richtlinien.
Generieren Sie benutzerdefinierte, vielfältige und hochpräzise Sensordaten für das sichere Trainieren, Testen und Validieren autonomer Fahrzeuge.
Verbessern Sie Automatisierung, Sicherheit und betriebliche Effizienz in industriellen und städtischen Umgebungen.
Mit Cosmos Reason können KI-Agenten Echtzeit- oder aufgezeichnete Videostreams analysieren, zusammenfassen und mit ihnen interagieren, um:
Einstiegsoptionen
KI-Infrastruktur
Die Server der NVIDIA RTX PRO 6000 Blackwell-Serie beschleunigen die Entwicklung physischer KI für Roboter, autonome Fahrzeuge und KI-Agenten – ob beim Trainieren, Generieren synthetischer Daten, Simulieren oder Inferenzieren.
Nutzen Sie Spitzenleistung für Cosmos-World-Foundation-Modelle auf NVIDIA Blackwell GB200 für industrielles Nachtrainieren und Inferenz-Workloads.
Ökosystem
Modellentwickler aus den Bereichen Robotik, autonome Fahrzeuge und Vision-KI nutzen Cosmos, um die Entwicklung physischer KI zu beschleunigen.
Ressourcen
[22. Januar 2026] Forschungsergebnisse zur Cosmos Policy veröffentlicht, die auf Cosmos Predict-2 für die visuelle Steuerung und Planung basieren.
[9. Februar 2026] Verbesserte Rechenunterstützung, Quantisierung und CUDA-Kompatibilität für das neue Cosmos Reason 2.
[19. Dezember 2025] Veröffentlichung der Cosmos-Predict2.5-2B-Diffusers-Unterstützung über Hugging Face, des destillierten Cosmos-Predict2.5-2B Text2World-Checkpoints auf Hugging Face und des Destillationsleitfadens.
[19. Dezember 2025] Image2Image- und ImagePrompt-Funktionen für Cosmos Transfer 2.5 wurden veröffentlicht. Sehen Sie hier den Inferenz-Leitfaden.
Entdecken Sie mehr auf GitHub.
Cosmos WFMs sind unter einer NVIDIA Open-Model-Lizenz für alle verfügbar.
Das neue Cosmos Cookbook enthält Schritt-für-Schritt-Anleitungen und Skripte für das Nachtrainieren, damit Sie Cosmos World-Foundation-Modelle von NVIDIA für Robotik und autonome Systeme schnell entwickeln, anpassen und bereitstellen können.
Ja, Sie können Cosmos verwenden, um mit Ihrem bevorzugten Foundation-Modell oder Ihrer Modellarchitektur Modelle von Grund auf neu zu erstellen. Sie können zunächst Cosmos Curator für die Vorverarbeitung von Videodaten verwenden. Anschließend komprimieren und dekodieren Sie Ihre Daten mit Cosmos Tokenizer. Sobald Sie die Daten verarbeitet haben, können Sie Ihr Modell trainieren oder feinabstimmen.
Mit NVIDIA NIM™ Microservices können Sie Ihre physischen KI-Modelle einfach in Ihre Anwendungen integrieren, die sich über Cloud, Rechenzentren und Workstations erstrecken.
Sie können auch NVIDIA DGX Cloud nutzen, um KI-Modelle zu trainieren und in großem Umfang überall bereitzustellen.
Alle drei sind WFMs mit unterschiedlichen Aufgaben:
Omniverse erstellt mit verschiedenen generativen APIs, SDKs und NVIDIA RTX-Rendering-Technik realistische 3D-Simulationen von Aufgaben in der realen Welt.
Entwickler können Omniverse-Simulationen als Instruktionsvideos in Cosmos Transfer-Modelle eingeben, um steuerbare fotorealistische synthetische Daten zu generieren.
Omniverse stellt die Simulationsumgebung vor und nach dem Training bereit, während Cosmos die Foundation-Modelle für die Generierung von Videodaten und das Trainieren physischer KI-Modelle zur Verfügung stellt.
Erfahren Sie mehr über NVIDIA Omniverse.