IA física
Una plataforma abierta para la IA física con modelos de mundo básicos (WFM), bibliotecas de procesamiento de datos de vídeo, evaluación de vídeo y marcos de posentrenamiento.
Modelos de mundo básicos
Modelo de generación de mundos líder, adaptable a cualquier tarea o entorno de IA física.
Genere mundos de vídeo predictivos de 30 segundos a partir de texto, imagen o vídeo con modelos 2B/14B, o haga un posentrenamiento con sus datos para crear casos perimetrales personalizados, políticas de bucle cerrado y simulaciones de múltiples vistas centradas en robots.
Modelo multicontrol para la simulación hasta la transformación fotorrealista.
Combínalo con marcos de simulación de IA física, como CARLA o NVIDIA Isaac Sim™, para acelerar la generación de datos sintéticos en varios entornos y condiciones de iluminación.
Modelo de lenguaje de visión (VLM) puntero que permite a los robots y a los agentes de IA de visión razonar como los humanos.
Combina conocimientos previos, la física y el sentido común para generar alertas en tiempo real y conclusiones prácticas en los ámbitos de la seguridad pública, la supervisión del tráfico, la logística, la inspección de calidad y la IA física.
Acelere el procesamiento y la evaluación eficientes de conjuntos de datos.
Casos de uso
Desarrolle modelos de mundo personalizados para tareas secundarias, entornos, configuraciones de cámaras o sensores y políticas.
Genere datos de sensores personalizados, diversos y de alta fidelidad para entrenar, probar y validar vehículos autónomos de forma segura.
Mejore la automatización, la seguridad y la eficiencia operativa tanto en entornos industriales como en urbanos.
Con Cosmos Reason, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de vídeo en tiempo real o grabadas para:
Opciones iniciales
Infraestructura de IA
Los servidores de la serie NVIDIA RTX PRO 6000 Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en el entrenamiento, la generación de datos sintéticos, la simulación y la inferencia.
Libere el rendimiento máximo para los modelos fundamentales de Cosmos en NVIDIA Blackwell GB200 para cargas de trabajo industriales posteriores al entrenamiento e inferencia.
Ecosistema
Los desarrolladores de modelos de los sectores de la robótica, los vehículos autónomos y la visión artificial utilizan Cosmos para acelerar el desarrollo de la IA física.
Recursos
[22 de enero de 2026] Investigación publicada en Cosmos Policy que se basa en Cosmos Predict-2 para el control y la planificación visomotores.
[9 de febrero de 2026] Soporte para computación, cuantificación y compatibilidad con CUDA mejorados para el nuevo Cosmos Reason 2.
[19 de diciembre de 2025] Se ha lanzado el soporte para Cosmos-Predict2.5-2B Diffusers a través de Hugging Face, el punto de control destilado de Cosmos-Predict2.5-2B Text2World en Hugging Face y la guía de destilación.
[19 de diciembre de 2025] Se lanzaron las capacidades de Image2Image e ImagePrompt para Cosmos Transfer 2.5. Consulte la guía de inferencia aquí.
Explore GitHub para obtener más información.
Los WFM de Cosmos están disponibles con una licencia de modelo abierto de NVIDIA para todos.
Consulte el nuevo Cosmos Cookbook, que contiene recetas paso a paso y scripts de posentrenamiento para crear, personalizar e implementar rápidamente los modelos de mundo básicos de Cosmos de NVIDIA para la robótica y los sistemas autónomos.
Sí, puede aprovechar Cosmos para crear desde cero con su modelo o arquitectura de modelos preferidos. Puede empezar por utilizar Cosmos Curator para el preprocesamiento de datos de vídeo. Luego comprima y descodifique sus datos con el tokenizador Cosmos. Una vez que haya procesado los datos, podrá entrenar o perfeccionar su modelo.
Utilizando los microservicios NVIDIA NIM™, puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, los centros de datos y las estaciones de trabajo.
También puede utilizar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a escala.
Los tres son unos WFM con roles distintos:
Omniverse crea simulaciones 3D realistas de tareas del mundo real utilizando diferentes API generativas, SDK y la tecnología de renderizado NVIDIA RTX.
Los desarrolladores pueden introducir simulaciones de Omniverse como vídeos instructivos en modelos de Cosmos Transfer para generar datos sintéticos fotorrealistas controlables.
Juntos, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos fundacionales para generar datos de vídeo y entrenar modelos de IA física.
Más información sobre NVIDIA Omniverse.