Physische KI
Entwickeln Sie World-Foundation-Modelle für physische KI.
Überblick
NVIDIA Cosmos™ ist eine Plattform, die speziell für physische KI entwickelt wurde und über modernste generative World-Foundation-Modelle, Sicherheits- und Kontrollmechanismen sowie eine Pipeline zur beschleunigten Verarbeitung und Kuration von Daten verfügt. Entwickler nutzen Cosmos, um die Entwicklung physischer KI für autonome Fahrzeuge (AVs), Roboter und KI-Agenten für Videoanalysen zu beschleunigen.
Offene Modelle
Vortrainierte multimodale generative Modelle, die Entwickler sofort für Weltgenerierung oder Reasoning verwenden bzw. nachtrainieren können, um physische KI-Modelle zu erarbeiten.
Ein hochmodernes Vorhersagemodell für den Weltzustand, das aus multimodalen Eingaben mit überlegener Geschwindigkeit, Genauigkeit und Prompt-Einhaltung bis zu 30 Sekunden kontinuierliches Video generieren kann. Nutzen Sie fortschrittliche Prognosen und Szenarioplanung für Robotik und KI-Agenten, indem Sie zukünftige Zustände von dynamischen Umgebungen vorhersagen.
Das Multicontrol-Modell skaliert eine einzelne Simulation oder ein räumliches Video rasch über verschiedene Umgebungen und Lichtverhältnisse hinweg. Beschleunigen Sie 3D-Eingaben aus Frameworks für physische KI-Simulationen (wie CARLA oder NVIDIA Isaac Sim™), um vollständig steuerbare Pipelines zur Datenaugmentation und Generierung synthetischer Daten zu ermöglichen.
Ein offenes, anpassbares Vision Language Model (VLM) mit Reasoning für physische KI erlaubt es Robotern und Vision-KI-Agenten, wie Menschen zu schlussfolgern. Es kann Vorwissen, physikalisches Verständnis und gesunden Menschenverstand nutzen, um die reale Welt zu verstehen und mit ihr zu interagieren.
NVIDIA Cosmos Curator ist ein Framework, mit dem Entwickler große Mengen an Sensordaten, die für die Entwicklung physischer KI erforderlich sind, rasch filtern, kommentieren und deduplizieren können. So entstehen maßgeschneiderte Datensätze, die Modellanforderungen gerecht werden. Mit NVIDIA Cosmos Dataset Search (CDS) können Entwickler solche Datensätze unmittelbar abfragen und Szenarien für gezieltes Nachtrainieren abrufen.
Beschleunigen Sie das effiziente Verarbeiten und Generieren von Datensätzen.
Anwendungsbeispiele
Nutzen Sie Cosmos WFMs, um Daten für nachgelagerte Pipelines in den Bereichen Robotik, autonome Fahrzeuge und industrielle Vision-Systeme zu simulieren, zu analysieren und zu generieren.
Roboter benötigen umfangreiche, vielfältige Trainingsdaten, um ihre Umgebungen effektiv wahrnehmen und mit ihnen interagieren zu können. Mit Cosmos WFMs können Entwickler steuerbare, hochpräzise synthetische Daten generieren, um Roboterwahrnehmungs- und Richtlinienmodelle zu trainieren.
Vielfältige, hochpräzise Sensordaten sind für das sichere Trainieren, Testen und Validieren autonomer Fahrzeuge unerlässlich. Mit Cosmos WFMs, die mit Fahrzeugdaten nachtrainiert wurden, können Entwickler die bestehende Datenvielfalt mit neuen Daten zu Wetter, Lichtverhältnissen und geografischen Verhältnissen erweitern oder Multi-Sensor-Ansichten nutzen – und so erheblich Zeit und Geld sparen.
Diese KI-Agenten können Echtzeit- oder aufgezeichnete Videostreams analysieren, zusammenfassen und mit ihnen interagieren, um Automatisierung, Sicherheit und betriebliche Effizienz in industriellen und städtischen Umgebungen zu verbessern. Cosmos Reason unterstützt KI-Agenten für Videoanalysen, um Fragen in Echtzeit zu beantworten sowie schnelle Warnungen und umfangreiche kontextbezogene Erkenntnisse zu liefern. Das Ergebnis: intelligentere und reaktionsschnellere Systeme in Edge- und Cloud-Umgebungen.
Vertrauenswürdige KI
Cosmos-Modelle, Sicherheitsmechanismen und Tokenizer sind bei Hugging Face und GitHub verfügbar und bieten Ressourcen zur Bewältigung der Datenknappheit beim Trainieren physischer KI-Modelle.
KI-Infrastruktur
Die Server der NVIDIA RTX PRO 6000 Blackwell-Serie beschleunigen die Entwicklung physischer KI für Roboter, autonome Fahrzeuge und KI-Agenten – ob beim Trainieren, Generieren synthetischer Daten, Simulieren oder Inferenzieren.
Nutzen Sie Spitzenleistung für Cosmos-World-Foundation-Modelle auf NVIDIA Blackwell GB200 für industrielles Nachtrainieren und Inferenz-Workloads.
Technologieumfeld
Modellentwickler aus den Bereichen Robotik, autonome Fahrzeuge und Vision-KI nutzen Cosmos, um die Entwicklung physischer KI zu beschleunigen.
Ressourcen
Beginnen Sie mit der Dokumentation. Cosmos WFMs sind bei Hugging Face, Skripte für Inferenz und Nachtrainieren bei GitHub frei verfügbar.
Cosmos WFMs sind unter einer NVIDIA Open-Model-Lizenz für alle verfügbar.
PyTorch-Skripte sind für alle Cosmos-Modelle für das Nachtrainieren frei verfügbar. Das neue Cosmos-Kochbuch enthält Schritt-für-Schritt-Rezepte und Skripte für das Nachtrainieren, damit Sie Cosmos World-Foundation-Modelle von NVIDIA für Robotik und autonome Systeme schnell entwickeln, anpassen und bereitstellen können.
Ja, Sie können Cosmos verwenden, um mit Ihrem bevorzugten Foundation-Modell oder Ihrer Modellarchitektur Modelle von Grund auf neu zu erstellen. Sie können zunächst NeMo Curator für die Vorverarbeitung von Videodaten nutzen. Anschließend komprimieren und dekodieren Sie Ihre Daten mit Cosmos Tokenizer. Sobald Sie die Daten verarbeitet haben, können Sie Ihr Modell mit NVIDIA NeMo trainieren oder optimieren.
Mit NVIDIA NIM™ Microservices können Sie Ihre physischen KI-Modelle einfach in Ihre Anwendungen integrieren, die sich über Cloud, Rechenzentren und Workstations erstrecken.
Sie können auch NVIDIA DGX Cloud nutzen, um KI-Modelle zu trainieren und in großem Umfang überall bereitzustellen.
Alle drei sind WFMs mit unterschiedlichen Aufgaben:
Cosmos Reason kann neue und vielfältige Text-Prompts aus einem Startvideo für Cosmos Predict generieren oder synthetische Daten aus Predict und Transfer bewerten und kommentieren.
Omniverse erstellt mit verschiedenen generativen APIs, SDKs und NVIDIA RTX-Rendering-Technik realistische 3D-Simulationen von Aufgaben in der realen Welt.
Entwickler können Omniverse-Simulationen als Instruktionsvideos in Cosmos Transfer-Modelle eingeben, um steuerbare fotorealistische synthetische Daten zu generieren.
Omniverse stellt die Simulationsumgebung vor und nach dem Training bereit, während Cosmos die Foundation-Modelle für die Generierung von Videodaten und das Trainieren physischer KI-Modelle zur Verfügung stellt.
Erfahren Sie mehr über NVIDIA Omniverse.