IA Física

NVIDIA Cosmos

Una plataforma abierta para la IA física con modelos fundacionales del mundo (WFM), bibliotecas de procesamiento de datos de video, evaluación de video y frameworks de posentrenamiento.

Modelos Fundacionales del Mundo

Modelos Abiertos para la Generación y la Comprensión del Mundo

Cosmos Predict

Modelo de generación de mundo líder, adaptable a cualquier tarea o entorno de IA física.

Genere mundos de video predictivos de 30 s a partir de texto, imagen o video con modelos de 2B/14B, o realice un post-entrenamiento con sus datos para crear casos de Edge personalizados, políticas de bucle cerrado y simulaciones de múltiples vistas centradas en robots.

Cosmos Transfer

Modelo de multicontrol para la transformación de simulación a fotorrealismo.

Combine con frameworks de simulación de IA física como CARLA o NVIDIA Isaac Sim™ para acelerar la generación de datos sintéticos en diversos entornos y condiciones de iluminación.

Cosmos Reason

Un modelo de lenguaje de visión (VLM) líder que permite a los robots y a los agentes de IA de visión razonar como humanos.

Combina el conocimiento previo, la física y el sentido común para generar alertas en tiempo real y obtener información procesable en seguridad pública, monitoreo del tráfico, logística, inspección de calidad e IA física.

Procesamiento y Evaluación de Datos

Acelere el procesamiento y la evaluación eficientes de conjuntos de datos.

Cosmos Curator

Filtre, anote y deduplique rápidamente grandes cantidades de datos de sensores con Cosmos Curator.

Búsqueda de Conjuntos de Datos de Cosmos

Consulte conjuntos de datos y recupere escenarios al instante con NVIDIA Cosmos Dataset Search (CDS).

Evaluador de Cosmos

Revise y califique las salidas de video generativo a escala con Cosmos Evaluator.

Casos de Uso

Cómo Cosmos Acelera la IA en Todas las Industrias

Utilice los Modelos de Flujo de Trabajo (WFM) de Cosmos para simular, razonar y generar datos para pipelines posteriores en robótica, vehículos autónomos y sistemas de visión industrial.

Aprendizaje Robótico

Desarrolle modelos del mundo personalizados para tareas posteriores, entornos, diseños de cámaras o sensores y políticas.

  • Post-entrene Cosmos Predict para vistas o políticas de control específicas para robots
  • Genere datos sintéticos a través de diversos entornos y condiciones de iluminación con Cosmos Transfer
  • Realice el post-entrenamiento de Cosmos Reason con el framework Cosmos RL para crear modelos de visión-lenguaje-acción (VLA)
  • Cree un pipeline integral de aumento y evaluación de datos sintéticos mediante el Blueprint de Fábrica de Datos de IA Física basado en Cosmos

Entrenamiento de Vehículos Autónomos

Genere datos de sensores personalizados, diversos y de alta fidelidad para entrenar, probar y validar vehículos autónomos de forma segura.

  • Amplifique la diversidad de datos existente con nuevos datos meteorológicos, de iluminación y de geolocalización mediante Cosmos Transfer.
  • Expanda las vistas de múltiples sensores con Cosmos Predict.
  • Cree un pipeline integral de aumento y evaluación de datos sintéticos mediante el Blueprint de Fábrica de Datos de IA Física basado en Cosmos

Agentes de IA para Análisis de Video

Mejore la automatización, la seguridad y la eficiencia operativa en entornos industriales y urbanos. 

Con Cosmos Reason, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de video en tiempo real o grabadas para lo siguiente:

  • Ofrezca respuestas a preguntas y alertas en tiempo real.
  • Proporcione información contextual rica.
  • Extraiga información de datos de video a gran escala con NVIDIA Blueprint para la búsqueda y el resumen de videos

Opciones de Inicio

Comience a Usar NVIDIA Cosmos

1

¿Todo listo para desarrollar? Acceda directamente a modelos y código abiertos.

2

¿Aún no está listo para desarrollar? Pruebe los modelos de Cosmos en nuestro catálogo alojado.

3

¿Necesita ayuda? Comience rápidamente con nuestras recetas de modelos prácticos.

IA Fiable

Apoyo a la Comunidad de IA Física

Hay modelos, barreras de seguridad y tokenizadores de Cosmos disponibles en Hugging Face y GitHub, con recursos para hacerle frente a la escasez de datos en el entrenamiento de modelos de IA física.

Infraestructura de IA

Obtenga el Mejor Desempeño con NVIDIA Blackwell

Los servidores NVIDIA RTX PRO 6000 Serie Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en entrenamiento, generación de datos sintéticos, simulación e inferencia.

Obtenga el máximo desempeño en los modelos base del mundo de Cosmos con NVIDIA Blackwell GB200, para cargas de trabajo industriales de posentrenamiento e inferencia.

Ecosistema

Adoptado por los Principales Innovadores de la IA física

Los desarrolladores de modelos de las industrias de robótica, vehículos autónomos y IA de visión están usando Cosmos para acelerar el desarrollo de la IA física.

Próximos Pasos

Únase a la Comunidad de Cosmos

Conéctese con expertos de Cosmos, interactúe con otros desarrolladores, proporcione comentarios de modelos y acceda al aprendizaje continuo a través de transmisiones en vivo y recetas.

Cookbook de Cosmos

Una guía integral para trabajar con el ecosistema NVIDIA Cosmos para aplicaciones del mundo real y específicas de dominio en robótica, simulación, sistemas autónomos y comprensión de entornos físicos.

Desarrolle Agentes de IA de Análisis de Video

Use Cosmos Reason con NVIDIA Blueprint para la búsqueda y resumen de videos (VSS) para desarrollar agentes de IA para la comprensión de videos en forma escalable y en tiempo real.

Recursos

Lo Último de los Desarrolladores de Cosmos

Preguntas Frecuentes

[22 de enero de 2026] Se publicó una investigación sobre Cosmos Policy que se basa en Cosmos Predict-2 para el control y la planificación visuomotriz.

[9 de febrero de 2026] Compatibilidad con computación, cuantificación y compatibilidad con CUDA mejoradas para el nuevo Cosmos Reason 2.

[19 de diciembre de 2025] Se lanzó el soporte de Cosmos-Predict2.5-2B Diffusers a través de Hugging Face, el punto de control destilado de Cosmos-Predict2.5-2B Text2World en Hugging Face y la guía de destilación.

[19 de diciembre de 2025] Se lanzaron las capacidades de Image2Image e ImagePrompt para Cosmos Transfer 2.5. Vea la guía de inferencia aquí.

Explore GitHub para obtener más información.

Los WFM de Cosmos están disponibles bajo una Licencia de Modelo Abierto de NVIDIA para todos.

Consulte el nuevo Libro de Cocina de Cosmos, que contiene recetas paso a paso y scripts de posentrenamiento para desarrollar, personalizar e implementar rápidamente los modelos fundacionales del mundo Cosmos de NVIDIA para robótica y sistemas autónomos.

Sí, puede aprovechar Cosmos para desarrollar desde cero con su arquitectura de modelos o modelo base preferido. Puede comenzar usando Cosmos Curator para el preprocesamiento de datos de video. A continuación, comprima y decodifique sus datos con Cosmos tokenizer. Una vez que haya procesado los datos, puede entrenar o ajustar su modelo.

Mediante los microservicios NVIDIA NIM™ puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, data centers y workstations.

También puede usar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a gran escala.

Los tres son WFM con distintos roles:

  • Cosmos Predict genera diversas escenas de video a partir de prompts de texto, imagen o video, lo que es ideal para el posentrenamiento en temas como robots o automóviles de conducción autónoma.
  • Cosmos Transfer aplica una transferencia de estilo de control múltiple (cambiando la iluminación y los entornos) en videos basados en la física, a menudo creados en simuladores como NVIDIA Omniverse™.
  • Cosmos Reason responde a las consultas razonando sobre entradas de video e imágenes. Cosmos Reason puede generar instrucciones de texto nuevas y diversas a partir de un video de inicio en Cosmos Predict, o evaluar y anotar datos sintéticos de Predict y Transfer.

Omniverse crea simulaciones 3D realistas de tareas del mundo real mediante el uso de diferentes API generativas, SDK y la tecnología de renderización NVIDIA RTX.

Los desarrolladores pueden ingresar simulaciones de Omniverse como videos de instrucciones a los modelos Cosmos Transfer para generar datos sintéticos fotorrealistas y controlables.

En conjunto, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos base para generar datos de video y entrenar modelos de IA física.

Más información sobre NVIDIA Omniverse.