IA Física
Una plataforma abierta para la IA física con modelos fundacionales del mundo (WFM), bibliotecas de procesamiento de datos de video, evaluación de video y frameworks de posentrenamiento.
Modelos Fundacionales del Mundo
Modelo de generación de mundo líder, adaptable a cualquier tarea o entorno de IA física.
Genere mundos de video predictivos de 30 s a partir de texto, imagen o video con modelos de 2B/14B, o realice un post-entrenamiento con sus datos para crear casos de Edge personalizados, políticas de bucle cerrado y simulaciones de múltiples vistas centradas en robots.
Modelo de multicontrol para la transformación de simulación a fotorrealismo.
Combine con frameworks de simulación de IA física como CARLA o NVIDIA Isaac Sim™ para acelerar la generación de datos sintéticos en diversos entornos y condiciones de iluminación.
Un modelo de lenguaje de visión (VLM) líder que permite a los robots y a los agentes de IA de visión razonar como humanos.
Combina el conocimiento previo, la física y el sentido común para generar alertas en tiempo real y obtener información procesable en seguridad pública, monitoreo del tráfico, logística, inspección de calidad e IA física.
Acelere el procesamiento y la evaluación eficientes de conjuntos de datos.
Casos de Uso
Desarrolle modelos del mundo personalizados para tareas posteriores, entornos, diseños de cámaras o sensores y políticas.
Genere datos de sensores personalizados, diversos y de alta fidelidad para entrenar, probar y validar vehículos autónomos de forma segura.
Mejore la automatización, la seguridad y la eficiencia operativa en entornos industriales y urbanos.
Con Cosmos Reason, los agentes de IA pueden analizar, resumir e interactuar con transmisiones de video en tiempo real o grabadas para lo siguiente:
Opciones de Inicio
Infraestructura de IA
Los servidores NVIDIA RTX PRO 6000 Serie Blackwell aceleran el desarrollo de la IA física para robots, vehículos autónomos y agentes de IA en entrenamiento, generación de datos sintéticos, simulación e inferencia.
Obtenga el máximo desempeño en los modelos base del mundo de Cosmos con NVIDIA Blackwell GB200, para cargas de trabajo industriales de posentrenamiento e inferencia.
Ecosistema
Los desarrolladores de modelos de las industrias de robótica, vehículos autónomos y IA de visión están usando Cosmos para acelerar el desarrollo de la IA física.
Recursos
[22 de enero de 2026] Se publicó una investigación sobre Cosmos Policy que se basa en Cosmos Predict-2 para el control y la planificación visuomotriz.
[9 de febrero de 2026] Compatibilidad con computación, cuantificación y compatibilidad con CUDA mejoradas para el nuevo Cosmos Reason 2.
[19 de diciembre de 2025] Se lanzó el soporte de Cosmos-Predict2.5-2B Diffusers a través de Hugging Face, el punto de control destilado de Cosmos-Predict2.5-2B Text2World en Hugging Face y la guía de destilación.
[19 de diciembre de 2025] Se lanzaron las capacidades de Image2Image e ImagePrompt para Cosmos Transfer 2.5. Vea la guía de inferencia aquí.
Explore GitHub para obtener más información.
Los WFM de Cosmos están disponibles bajo una Licencia de Modelo Abierto de NVIDIA para todos.
Consulte el nuevo Libro de Cocina de Cosmos, que contiene recetas paso a paso y scripts de posentrenamiento para desarrollar, personalizar e implementar rápidamente los modelos fundacionales del mundo Cosmos de NVIDIA para robótica y sistemas autónomos.
Sí, puede aprovechar Cosmos para desarrollar desde cero con su arquitectura de modelos o modelo base preferido. Puede comenzar usando Cosmos Curator para el preprocesamiento de datos de video. A continuación, comprima y decodifique sus datos con Cosmos tokenizer. Una vez que haya procesado los datos, puede entrenar o ajustar su modelo.
Mediante los microservicios NVIDIA NIM™ puede integrar fácilmente sus modelos de IA física en sus aplicaciones en la nube, data centers y workstations.
También puede usar NVIDIA DGX Cloud para entrenar modelos de IA e implementarlos en cualquier lugar a gran escala.
Los tres son WFM con distintos roles:
Omniverse crea simulaciones 3D realistas de tareas del mundo real mediante el uso de diferentes API generativas, SDK y la tecnología de renderización NVIDIA RTX.
Los desarrolladores pueden ingresar simulaciones de Omniverse como videos de instrucciones a los modelos Cosmos Transfer para generar datos sintéticos fotorrealistas y controlables.
En conjunto, Omniverse proporciona el entorno de simulación antes y después del entrenamiento, mientras que Cosmos proporciona los modelos base para generar datos de video y entrenar modelos de IA física.
Más información sobre NVIDIA Omniverse.