IA Física

NVIDIA Cosmos

Desarrolle IA física más rápido con modelos fundacionales del mundo líderes y frameworks de procesamiento, entrenamiento y evaluación de datos abiertos.

Pruebe Ahora   |   Video   |   Blog

Cosmos 3

El Modelo Fundacional Abierto de IA Física

El primer omnimodelo con razonamiento nativo y generación de mundo y acciones. Basado en Mixture-of-Transformers.

Potencie el Razonamiento de IA de Visión

Úselo como modelo de lenguaje de visión (VLM) para razonar sobre objetos, interacciones e intención en escenarios complejos del mundo real. 

Para alertas en tiempo real y subtitulado denso en inspección de calidad, seguridad pública, monitoreo del tráfico, logística y conducción autónoma.

Desarrolle Modelos de Políticas

Acelere el aprendizaje de políticas por parte de robots con NVIDIA Cosmos™ 3 como la columna vertebral de los Modelos de Acción Mundial (WAM). 

Posentrene el modelo fundacional generalizado del mundo con datos de cámaras y personificación especializados. El modelo de políticas adapta acciones preaprendidas a tareas, dominios y comportamientos específicos a escala.

Simule Mundos

Ejecútelo como un simulador de mundos controlable y basado en la física para predecir enfoques múltiples, evaluar resultados en un bucle cerrado y converger en el comportamiento correcto. 

Escale el bucle en todos los entornos, tareas y condiciones para mejorar continuamente sin los riesgos del mundo real.

Escale Datos de Video Sintético

Genere futuros verosímiles a partir de texto, imágenes, video, sonido ambiental y entradas de acción. 

Use la generación de video como imaginación para entrenar la IA física sin que lo limite lo que se ha capturado físicamente.

Power Vision AI Reasoning

Use as a vision language model (VLM) to reason over objects, interactions, and intent across complex real-world scenarios. 

For real-time alerts and dense captioning across quality inspection, public safety, traffic monitoring, logistics, and autonomous driving.

Build Policy Models

Accelerate robot policy learning with Cosmos 3 as the backbone for World Action Models (WAMs). 

Post-train the generalized world foundation model on specialized camera and embodiment data. The policy model adapts pre-learned actions to specific tasks, domains, and behaviors at scale.

Simulate Worlds

Run as a controllable, physics-grounded world simulator to predict multiple approaches, evaluate outcomes in a closed loop, and converge on the right behavior. 

Scale the loop across environments, tasks, and conditions to continuously improve without real-world risk.

Scale Synthetic Video Data

Generate infinite plausible futures from text, image, video, ambient sound and action input. 

Use video generation as imagination to train physical AI without being constrained by what's been physically captured.

Video

Presentamos Cosmos

Escuche al fundador y director ejecutivo de NVIDIA, Jensen Huang, cuando presente en COMPUTEX 2026 a NVIDIA Cosmos 3, el modelo fundacional más avanzado del mundo que se diseñó para ayudar a los desarrolladores a construir sistemas autónomos que puedan comprender, simular y actuar en el mundo real.

Opciones de Inicio

Comience a Usar NVIDIA Cosmos

1

¿Todo listo para desarrollar? Acceda directamente a modelos y código abiertos.

2

¿Aún no está listo para desarrollar? Pruebe los modelos de Cosmos en nuestro catálogo alojado.

3

¿Necesita ayuda? Comience rápidamente con nuestras recetas de modelos prácticos.

Desarrolle con Cosmos

Aproveche la misma tecnología que impulsa Cosmos 3. Frameworks y habilidades abiertos para que los desarrolladores de todo el mundo puedan personalizar, extender y contribuir a la IA física.

Selección de Datos

Filtre, anote y deduplique rápidamente grandes cantidades de datos de sensores con Cosmos Curator.

Revise y califique las salidas de video generativo a escala con Cosmos Evaluator.

Entrenamiento y Aceleración

Desarrolle, posentrene o implemente rápidamente modelos del mundo mediante el uso de posentrenamiento abierto, evaluación, frameworks de optimización, y secuencias de comandos y habilidades de inferencia.

Habilidades Agénticas para la Generación de Datos Sintéticos

Convierta los agentes de codificación en expertos en datos sintéticos para el desarrollo de la IA física.

Casos de Uso

Cómo Cosmos Acelera la IA en Todas las Industrias

Utilice los Modelos de Flujo de Trabajo (WFM) de Cosmos para simular, razonar y generar datos para pipelines posteriores en robótica, vehículos autónomos y sistemas de visión industrial.

Aprendizaje Robótico

Desarrolle una política de aprendizaje de robots que permita a los agentes incorporados operar en entornos del mundo real en condiciones vistas y no vistas.

  • Posentrene a Cosmos 3 en tareas específicas según la personificación, el entorno, los diseños de cámara o sensor y las políticas
  • Ejecute simulaciones de bucle cerrado físicamente precisas
  • Cree un pipeline integral de aumento y evaluación de datos sintéticos mediante las habilidades de los agentes basadas en Cosmos

Entrenamiento de Vehículos Autónomos

Genere datos de sensores personalizados, diversos y de alta fidelidad para entrenar, probar y validar vehículos autónomos de forma segura. 

  • Amplifique la diversidad de datos existente con nuevos datos meteorológicos, de iluminación y de geolocalización
  • Posentrénelo para expandir las vistas de múltiples sensores
  • Cree un pipeline integral de aumento y evaluación de datos sintéticos mediante las habilidades de los agentes basadas en Cosmos

Agentes de IA para Análisis de Video

Mejore la automatización, la seguridad y la eficiencia operativa en entornos industriales y urbanos. 

Con Cosmos, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de video en tiempo real o grabadas para:

  • Ofrecer alertas contextuales en tiempo real
  • Hablar con sus videos y extraer información de transmisiones de cámaras en vivo o bibliotecas de video a gran escala
  • Desarrolle agentes de IA de análisis de video con NVIDIA Metropolis Blueprint para la búsqueda y el resumen de videos
  • Genere datos de entrenamiento sintéticos para aumentar aún más la exactitud de la comprensión

Desempeño

Se Ejecuta Mejor con la IA de NVIDIA

Cosmos 3 está optimizado para ofrecer el mejor desempeño con hardware NVIDIA. Los servidores NVIDIA RTX PRO™ 6000 Serie Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en entrenamiento, generación de datos sintéticos, simulación e inferencia.

Obtenga el máximo desempeño en los modelos base del mundo de Cosmos con NVIDIA Blackwell GB200, para cargas de trabajo industriales de posentrenamiento e inferencia.

Ecosistema

Adoptado por los Principales Innovadores de la IA física

Los desarrolladores de modelos de las industrias de robótica, vehículos autónomos y IA de visión están usando Cosmos para acelerar el desarrollo de la IA física.

Próximos Pasos

Únase a la Comunidad de Cosmos

Conéctese con expertos de Cosmos, interactúe con otros desarrolladores, proporcione comentarios de modelos y acceda al aprendizaje continuo a través de transmisiones en vivo y recetas.

Cookbook de Cosmos

Una guía integral para trabajar con el ecosistema NVIDIA Cosmos para aplicaciones del mundo real y específicas de dominio en robótica, simulación, sistemas autónomos y comprensión de entornos físicos.

Desarrolle Agentes de IA de Análisis de Video

Use Cosmos Reason con NVIDIA Blueprint para la búsqueda y resumen de videos (VSS) para desarrollar agentes de IA para la comprensión de videos en forma escalable y en tiempo real.

Recursos

Lo Último de los Desarrolladores de Cosmos

Preguntas Frecuentes

Cosmos 3 se basa en la arquitectura Mixture of Transformers. Los módulos de razonamiento y generadores usan diferentes transformadores para una generación y un desempeño eficientes. Por lo tanto, el modelo razona primero y luego genera, lo que resulta en una precisión física líder en todas las capacidades. Más información sobre la arquitectura aquí.

Los WFM de Cosmos están disponibles bajo una Licencia de Modelo Abierto de NVIDIA para todos.

Cosmos 3 está disponible abiertamente con secuencias de comandos de posentrenamiento en GitHub para cada modalidad y módulo. Además, NVIDIA TAO 7 proporciona un conjunto de habilidades y herramientas agénticas para ajustar modelos de IA de visión, como Cosmos 3, con agentes de codificación y prompts en lenguaje natural.

Sí, puede aprovechar Cosmos para desarrollar desde cero con su arquitectura de modelos o modelo base preferido. Puede comenzar usando Cosmos Curator para el preprocesamiento de datos de video. A continuación, comprima y decodifique sus datos con Cosmos tokenizer. Una vez que haya procesado los datos, puede entrenar o ajustar su modelo.

Mediante los microservicios NVIDIA NIM™ puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, data centers y workstations.

También puede usar NVIDIA DGX Cloudpara entrenar modelos de IA e implementarlos a escala en cualquier lugar.

Cosmos 3 es un omnimodelo que puede generar en texto, imagen, video, sonido y acción. Cosmos 2.5 y Cosmos 2, en cambio, mantenían la percepción y la generación como modelos separados y las modalidades se limitaban a texto, imagen y video.

Omniverse crea simulaciones 3D realistas de tareas del mundo real mediante el uso de diferentes API generativas, SDK y la tecnología de renderización NVIDIA RTX.

Los desarrolladores pueden ingresar simulaciones de Omniverse como videos instructivos en los modelos de Cosmos Transfer para generar datos sintéticos controlables y fotorrealistas.

En conjunto, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos base para generar datos de video y entrenar modelos de IA física.

Más información sobre NVIDIA Omniverse.