IA Física
Desarrolle world foundation models para el avance de la IA física.
Descripción General
NVIDIA Cosmos™ es una plataforma con modelos fundacionales del mundo (WFM) abiertos, barreras de seguridad y bibliotecas de procesamiento de datos para acelerar el desarrollo de la IA física para vehículos autónomos (AV), robots y agentes de IA de análisis de video.
Modelos
Modelos preentrenados abiertos y completamente personalizables para la generación y comprensión de mundos.
Predice estados futuros de entornos dinámicos para la robótica y la planificación de agentes de IA.
Este modelo de generación de mundos produce hasta 30 segundos de video de alta fidelidad a partir de indicaciones multimodales.
Acelerar la generación de datos sintéticos en varios entornos y condiciones de iluminación.
Este modelo de multicontrol transforma las entradas 3D o espaciales de los frameworks de simulación de IA física, como CARLA o NVIDIA Isaac Sim™, en videos de alta fidelidad completamente controlados.
Permite que los robots y los agentes de IA de visión razonen como humanos.
Este modelo de lenguaje de visión multimodal (VLM) aprovecha el conocimiento previo, la comprensión de la física y el sentido común para comprender el mundo real e interactuar con él.
Acelere el procesamiento y la generación eficientes de conjuntos de datos.
Filtre, anote y deduplique rápidamente grandes cantidades de datos de sensores necesarios para el desarrollo de IA física con Cosmos Curator.
También puede consultar estos conjuntos de datos al instante y recuperar escenarios con NVIDIA Cosmos Dataset Search (CDS).
Casos de Uso
Los robots necesitan datos de entrenamiento vastos y diversos para percibir e interactuar de manera efectiva con sus entornos. Los WFM de Cosmos resuelven esto de múltiples maneras:
Los datos de sensores diversos y de alta fidelidad son fundamentales para el entrenamiento, las pruebas y la validación de los vehículos autónomos de forma segura. Pero es difícil, lento y costoso de escalar.
Con los modelos fundacionales del mundo (WFM) de Cosmos posentrenados con datos de vehículos, usted puede:
Mejore la automatización, la seguridad y la eficiencia operativa en entornos industriales y urbanos.
Con Cosmos Reason, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de video en tiempo real o grabadas para lo siguiente:
Opciones de Inicio
Infraestructura de IA
Los servidores NVIDIA RTX PRO 6000 Serie Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en entrenamiento, generación de datos sintéticos, simulación e inferencia.
Obtenga el máximo desempeño en los modelos base del mundo de Cosmos con NVIDIA Blackwell GB200, para cargas de trabajo industriales de posentrenamiento e inferencia.
Ecosistema
Los desarrolladores de modelos de las industrias de robótica, vehículos autónomos y IA de visión están usando Cosmos para acelerar el desarrollo de la IA física.
Recursos
Los WFM de Cosmos están disponibles bajo una Licencia de Modelo Abierto de NVIDIA para todos.
Consulte el nuevo Libro de Cocina de Cosmos, que contiene recetas paso a paso y scripts de posentrenamiento para desarrollar, personalizar e implementar rápidamente los modelos fundacionales del mundo Cosmos de NVIDIA para robótica y sistemas autónomos.
Sí, puede aprovechar Cosmos para desarrollar desde cero con su arquitectura de modelos o modelo base preferido. Puede comenzar usando Cosmos Curator para el preprocesamiento de datos de video. A continuación, comprima y decodifique sus datos con Cosmos tokenizer. Una vez que haya procesado los datos, puede entrenar o ajustar su modelo.
Mediante los microservicios NVIDIA NIM™ puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, data centers y workstations.
También puede usar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a gran escala.
Los tres son WFM con distintos roles:
Cosmos Reason puede generar instrucciones de texto nuevas y diversas a partir de un video de inicio en Cosmos Predict, o evaluar y anotar datos sintéticos de Predict y Transfer.
Omniverse crea simulaciones 3D realistas de tareas del mundo real mediante el uso de diferentes API generativas, SDK y la tecnología de renderización NVIDIA RTX.
Los desarrolladores pueden ingresar simulaciones de Omniverse como videos de instrucciones a los modelos Cosmos Transfer para generar datos sintéticos fotorrealistas y controlables.
En conjunto, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos base para generar datos de video y entrenar modelos de IA física.
Más información sobre NVIDIA Omniverse.