Physische KI
Entwickeln Sie World-Foundation-Modelle für physische KI.
Überblick
NVIDIA Cosmos™ ist eine Plattform mit World-Foundation-Modellen(WFMs), Guardrails und Datenverarbeitungsbibliotheken zur beschleunigten Entwicklung von physischer KI für autonome Fahrzeuge (AVs), Roboter und KI-Agenten für die Videoanalyse.
Modelle
Offene und vollständig anpassbare, vorab trainierte Modelle zur Generierung und zum Verständnis von Welten.
Prognostizieren Sie zukünftige Zustände dynamischer Umgebungen für die Planung von Robotik und KI-Agenten.
Dieses Weltgenerationsmodell erzeugt bis zu 30 Sekunden hochpräzises Video aus multimodalen Prompts.
Beschleunigen Sie die Generierung synthetischer Daten in verschiedenen Umgebungen und unter unterschiedlichen Lichtverhältnissen
Dieses Multicontrol-Modell wandelt 3D- oder räumliche Eingaben aus physischen KI-Simulationsframeworks wie CARLA oder NVIDIA Isaac Sim™ in vollständig kontrollierte High-Fidelity-Videos um.
Ermöglichen Sie es Robotern und KI-Agenten, wie Menschen zu schlussfolgern.
Dieses multimodale VLM-Modell (Vision Language Model) nutzt Vorwissen, physikalisches Verständnis und gesundes Urteilsvermögen, um die reale Welt zu erfassen und mit ihr zu interagieren.
Beschleunigen Sie die effiziente Verarbeitung und Generierung von Datensätzen.
Mit Cosmos Curator können Sie schnell große Mengen an Sensordaten, die für die Entwicklung physischer KI erforderlich sind, filtern, kommentieren und deduplizieren.
Sie können diese Datensätze auch sofort abfragen und Szenarien mit NVIDIA Cosmos Dataset Search (CDS) abrufen.
Anwendungsbeispiele
Roboter benötigen umfangreiche, vielfältige Trainingsdaten, um ihre Umgebungen effektiv wahrnehmen und mit ihnen interagieren zu können. Cosmos-WFMs lösen dieses Problem auf verschiedene Arten:
Vielfältige, hochpräzise Sensordaten sind für das sichere Trainieren, Testen und Validieren autonomer Fahrzeuge unerlässlich. Die Skalierung ist jedoch schwierig, zeitaufwendig und kostspielig.
Mit nachträglich mit Fahrzeugdaten trainierten Cosmos WFMs können Sie:
Verbessern Sie Automatisierung, Sicherheit und betriebliche Effizienz in industriellen und städtischen Umgebungen.
Mit Cosmos Reason können KI-Agenten Echtzeit- oder aufgezeichnete Videostreams analysieren, zusammenfassen und mit ihnen interagieren, um:
Einstiegsoptionen
KI-Infrastruktur
Die Server der NVIDIA RTX PRO 6000 Blackwell-Serie beschleunigen die Entwicklung physischer KI für Roboter, autonome Fahrzeuge und KI-Agenten – ob beim Trainieren, Generieren synthetischer Daten, Simulieren oder Inferenzieren.
Nutzen Sie Spitzenleistung für Cosmos-World-Foundation-Modelle auf NVIDIA Blackwell GB200 für industrielles Nachtrainieren und Inferenz-Workloads.
Technologieumfeld
Modellentwickler aus den Bereichen Robotik, autonome Fahrzeuge und Vision-KI nutzen Cosmos, um die Entwicklung physischer KI zu beschleunigen.
Ressourcen
Beginnen Sie mit der Dokumentation. Cosmos WFMs sind bei Hugging Face, Skripte für Inferenz und Nachtrainieren bei GitHub frei verfügbar.
Das neue Cosmos-Kochbuch enthält Schritt-für-Schritt-Rezepte und Skripte für das Nachtrainieren, damit Sie Cosmos World-Foundation-Modelle von NVIDIA für Robotik und autonome Systeme schnell entwickeln, anpassen und bereitstellen können.
PyTorch-Skripte sind für alle Cosmos-Modelle für das Nachtrainieren frei verfügbar. Das neue Cosmos-Kochbuch enthält Schritt-für-Schritt-Rezepte und Skripte für das Nachtrainieren, damit Sie Cosmos World-Foundation-Modelle von NVIDIA für Robotik und autonome Systeme schnell entwickeln, anpassen und bereitstellen können.
Ja, Sie können Cosmos verwenden, um mit Ihrem bevorzugten Foundation-Modell oder Ihrer Modellarchitektur Modelle von Grund auf neu zu erstellen. Sie können zunächst Cosmos Curator für die Vorverarbeitung von Videodaten verwenden. Anschließend komprimieren und dekodieren Sie Ihre Daten mit dem Cosmos-Tokenizer. Sobald Sie die Daten verarbeitet haben, können Sie Ihr Modell trainieren oder feinabstimmen.
Mit NVIDIA NIM™ Microservices können Sie Ihre physischen KI-Modelle einfach in Ihre Anwendungen integrieren, die sich über Cloud, Rechenzentren und Workstations erstrecken.
Sie können auch NVIDIA DGX Cloud nutzen, um KI-Modelle zu trainieren und in großem Umfang überall bereitzustellen.
Alle drei sind WFMs mit unterschiedlichen Aufgaben:
Cosmos Reason kann neue und vielfältige Text-Prompts aus einem Startvideo für Cosmos Predict generieren oder synthetische Daten aus Predict und Transfer bewerten und kommentieren.
Omniverse erstellt mit verschiedenen generativen APIs, SDKs und NVIDIA RTX-Rendering-Technik realistische 3D-Simulationen von Aufgaben in der realen Welt.
Entwickler können Omniverse-Simulationen als Instruktionsvideos in Cosmos Transfer-Modelle eingeben, um steuerbare fotorealistische synthetische Daten zu generieren.
Omniverse stellt die Simulationsumgebung vor und nach dem Training bereit, während Cosmos die Foundation-Modelle für die Generierung von Videodaten und das Trainieren physischer KI-Modelle zur Verfügung stellt.
Erfahren Sie mehr über NVIDIA Omniverse.