IA física

NVIDIA Cosmos

Una plataforma abierta para la IA física con modelos de mundo básicos (WFM), bibliotecas de procesamiento de datos de vídeo, evaluación de vídeo y marcos de posentrenamiento.

Modelos de mundo básicos

Modelos abiertos para la generación y la comprensión de mundos

Cosmos Predict

Modelo de generación de mundos líder, adaptable a cualquier tarea o entorno de IA física.

Genere mundos de vídeo predictivos de 30 segundos a partir de texto, imagen o vídeo con modelos 2B/14B, o haga un posentrenamiento con sus datos para crear casos perimetrales personalizados, políticas de bucle cerrado y simulaciones de múltiples vistas centradas en robots.

Cosmos Transfer

Modelo multicontrol para la simulación hasta la transformación fotorrealista.

Combínalo con marcos de simulación de IA física, como CARLA o NVIDIA Isaac Sim™, para acelerar la generación de datos sintéticos en varios entornos y condiciones de iluminación.

Cosmos Reason

Modelo de lenguaje de visión (VLM) puntero que permite a los robots y a los agentes de IA de visión razonar como los humanos.

Combina conocimientos previos, la física y el sentido común para generar alertas en tiempo real y conclusiones prácticas en los ámbitos de la seguridad pública, la supervisión del tráfico, la logística, la inspección de calidad y la IA física.

Procesamiento y evaluación de datos

Acelere el procesamiento y la evaluación eficientes de conjuntos de datos.

Cosmos Curator

Filtre, anote y deduplique rápidamente vastas cantidades de datos de sensores con Cosmos Curator.

Búsqueda en conjuntos de datos de Cosmos

Consulte conjuntos de datos al instante y recupere escenarios con NVIDIA Cosmos Dataset Search (CDS, siglas en inglés de búsqueda de conjuntos de datos).

Cosmos Evaluator

Revise y califique los resultados de vídeo generativo a escala con Cosmos Evaluator.

Casos de uso

Cómo Cosmos acelera la IA en todos los sectores

Utilice los WFM de Cosmos para simular, razonar y generar datos para procesos posteriores en robótica, vehículos autónomos y sistemas de visión industrial.

Aprendizaje de robots

Desarrolle modelos de mundo personalizados para tareas secundarias, entornos, configuraciones de cámaras o sensores y políticas.

  • Posentrenar Cosmos Predict para vistas específicas de robots o políticas de control
  • Genere datos sintéticos en todos los entornos y condiciones de iluminación con Cosmos Transfer
  • Posentrene Cosmos Reason utilizando el entorno de trabajo de Cosmos RL para generar modelos de visión-lenguaje-acción (VLA)
  • Cree una canalización de aumento y evaluación de datos sintéticos de extremo a extremo usando el blueprint de fábrica de datos de IA física basado en Cosmos

Entrenamiento de vehículos autónomos

Genere datos de sensores personalizados, diversos y de alta fidelidad para entrenar, probar y validar vehículos autónomos de forma segura.

  • Amplifique la diversidad de datos existentes con nuevos datos meteorológicos, de iluminación y de geolocalización con Cosmos Transfer.
  • Amplíe a vistas multisensor con Cosmos Predict.
  • Cree una canalización de aumento y evaluación de datos sintéticos de extremo a extremo usando el blueprint de fábrica de datos de IA física basado en Cosmos

Agentes de IA para análisis de video

Mejore la automatización, la seguridad y la eficiencia operativa tanto en entornos industriales como en urbanos. 

Con Cosmos Reason, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de vídeo en tiempo real o grabadas para:

  • Ofrezca alertas y respuestas a preguntas en tiempo real.
  • Proporcione información contextual enriquecida.
  • Extraiga información de datos de vídeo a gran escala con NVIDIA Blueprint para la búsqueda y el resumen de vídeos

Opciones iniciales

Empezar con NVIDIA Cosmos

1

¿Preparado para crear? Acceda a modelos abiertos y a código directamente.

2

¿Todavía no está preparado para crear? Pruebe los modelos de Cosmos en nuestro catálogo alojado.

3

¿Necesita ayuda? Empiece rápidamente con nuestras recetas de modelo prácticas.

IA de confianza

Apoyo a la comunidad de IA física

Los modelos, las barreras de protección y los tokenizadores de Cosmos están disponibles en Hugging Face y GitHub, con recursos para abordar la escasez de datos en el entrenamiento de modelos de IA física.

Infraestructura de IA

Obtenga el mejor rendimiento con NVIDIA Blackwell

Los servidores de la serie NVIDIA RTX PRO 6000 Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en el entrenamiento, la generación de datos sintéticos, la simulación y la inferencia.

Libere el rendimiento máximo para los modelos fundamentales de Cosmos en NVIDIA Blackwell GB200 para cargas de trabajo industriales posteriores al entrenamiento e inferencia.

Ecosistema

Adoptado por los principales innovadores en el campo de la IA física

Los desarrolladores de modelos de los sectores de la robótica, los vehículos autónomos y la visión artificial utilizan Cosmos para acelerar el desarrollo de la IA física.

Próximos pasos

Únase a la comunidad de Cosmos

Conecte con expertos de Cosmos, interactúe con otros desarrolladores, proporcione comentarios sobre modelos y acceda a un aprendizaje continuo a través de transmisiones en directo y recetas.

Libro de cocina de Cosmos

Una guía integral para trabajar con el ecosistema de NVIDIA Cosmos para aplicaciones específicas de dominio del mundo real en robótica, simulación, sistemas autónomos y comprensión de escenas físicas.

Cree agentes de IA para análisis de vídeo

Utilice Cosmos Reason con el plano de NVIDIA para la búsqueda y resumen de vídeos (VSS) para crear agentes de IA para una comprensión de vídeo escalable en tiempo real.

Recursos

Lo último de los desarrolladores de Cosmos

Preguntas frecuentes

[22 de enero de 2026] Investigación publicada en Cosmos Policy que se basa en Cosmos Predict-2 para el control y la planificación visomotores.

[9 de febrero de 2026] Soporte para computación, cuantificación y compatibilidad con CUDA mejorados para el nuevo Cosmos Reason 2.

[19 de diciembre de 2025] Se ha lanzado el soporte para Cosmos-Predict2.5-2B Diffusers a través de Hugging Face, el punto de control destilado de Cosmos-Predict2.5-2B Text2World en Hugging Face y la guía de destilación.

[19 de diciembre de 2025] Se lanzaron las capacidades de Image2Image e ImagePrompt para Cosmos Transfer 2.5. Consulte la guía de inferencia aquí.

Explore GitHub para obtener más información.

Los WFM de Cosmos están disponibles con una licencia de modelo abierto de NVIDIA para todos.

Consulte el nuevo Cosmos Cookbook, que contiene recetas paso a paso y scripts de posentrenamiento para crear, personalizar e implementar rápidamente los modelos de mundo básicos de Cosmos de NVIDIA para la robótica y los sistemas autónomos. 

Sí, puede aprovechar Cosmos para crear desde cero con su modelo o arquitectura de modelos preferidos. Puede empezar por utilizar Cosmos Curator para el preprocesamiento de datos de vídeo. Luego comprima y descodifique sus datos con el tokenizador Cosmos. Una vez que haya procesado los datos, podrá entrenar o perfeccionar su modelo. 

Utilizando los microservicios NVIDIA NIM™, puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, los centros de datos y las estaciones de trabajo.

También puede utilizar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a escala.

Los tres son unos WFM con roles distintos:

  • Cosmos Predict genera diversas escenas de vídeo a partir de indicaciones de texto, imagen o vídeo, ideales para el entrenamiento posterior en temas como robots o coches autónomos.
  • Cosmos Transfer aplica la transferencia de estilo multicontrol, que cambia la iluminación y los entornos, en vídeos basados en la física, a menudo creados en simuladores como NVIDIA Omniverse™.
  • Cosmos Reason responde a las consultas al razonar sobre las entradas de vídeo e imagen. Cosmos Reason puede generar nuevas y diversas indicaciones de texto a partir de un vídeo de partida para Cosmos Predict, o criticar y anotar los datos sintéticos de Predict y Transfer.

Omniverse crea simulaciones 3D realistas de tareas del mundo real utilizando diferentes API generativas, SDK y la tecnología de renderizado NVIDIA RTX.

Los desarrolladores pueden introducir simulaciones de Omniverse como vídeos instructivos en modelos de Cosmos Transfer para generar datos sintéticos fotorrealistas controlables.

Juntos, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos fundacionales para generar datos de vídeo y entrenar modelos de IA física.

Más información sobre NVIDIA Omniverse.