Agentes de IA para Análisis de Video Impulsados por IA Generativa

Descubra una colección de workflows de referencia que usan modelos de lenguaje de visión para ofrecer capacidades de percepción visual ricas e interactivas para una amplia gama de industrias.

Cargas de Trabajo

Visión Artificial / Análisis de Videos

Industrias

Manufactura
Ciudades/Espacios Inteligentes
Venta Minorista/Bienes de Consumo Empaquetados
Medios de Comunicación y Entretenimiento
Área de la Salud y Ciencias Biológicas

Objetivo Empresarial

Retorno de la Inversión
Innovación

Productos

NVIDIA Metropolis
NVIDIA AI Enterprise
NVIDIA Cosmos Reason

Descripción General

Impulse una Nueva Ola de Aplicaciones

Las aplicaciones tradicionales de análisis de video y sus workflows de desarrollo suelen basarse en modelos limitados de función fija hechos para detectar e identificar solo un conjunto determinado de objetos predefinidos. Con la IA generativa y los modelos base, usted ahora puede desarrollar aplicaciones con menos modelos, ya que estos cuentan con una percepción increíblemente compleja y amplia, y una rica comprensión contextual. Esta nueva generación de modelos de lenguaje de visión (VLM), como NVIDIA Cosmos™ Reason, está dando lugar a agentes de IA de análisis de video inteligentes y poderosos.

¿Qué Es un Agente de IA de Análisis de Video?

Un agente de IA de análisis de video puede combinar modalidades de visión y lenguaje para comprender indicaciones en lenguaje natural y brindar respuestas visuales a preguntas. Por ejemplo, respuestas a una amplia gama de preguntas en lenguaje natural que se puedan aplicar a una transmisión de video grabada o en vivo. Esta comprensión más profunda del contenido en formato video permite interpretaciones más precisas y significativas, lo que mejora la funcionalidad de las aplicaciones de análisis de video y el análisis de escenarios del mundo real.  Estos agentes prometen abrir camino a ideas y posibilidades totalmente nuevas para la automatización.

Optimice Cada Operación Industrial

Se implementarán agentes de IA de análisis de video altamente perceptivos, precisos e interactivos en nuestras fábricas, almacenes, tiendas minoristas, aeropuertos, intersecciones de tráfico y más. Esto tendrá un enorme impacto en los equipos de operaciones que buscan tomar mejores decisiones con información más rica generada a partir de interacciones reales. Los gerentes y equipos de operaciones también se comunicarán con estos agentes en lenguaje natural, todos impulsados por IA generativa y VLM con microservicios NVIDIA NIM™ en su núcleo.


Implementación Técnica

Desarrolle con NVIDIA NIM

NVIDIA NIM es un conjunto de microservicios de inferencia que incluye API estándar de la industria, código específico de dominio, engines de inferencia optimizados y tiempo de ejecución empresarial. Ofrece una combinación de VLM, LLM y RAG para desarrollar un agente de IA de análisis de video capaz de procesar imágenes o videos en vivo o archivados para extraer información procesable mediante el lenguaje natural. Creamos un workflow de referencia de un agente de IA de análisis de video que usted puede probar para acelerar su proceso de desarrollo.

Desarrolle Agentes de IA con NVIDIA AI Blueprint

El NVIDIA AI Blueprint para búsqueda y resumen de videos (VSS) facilita el desarrollo y la personalización de agentes de IA de análisis de video mediante IA generativa, VLM, LLM y NVIDIA NIM. A los agentes de IA de análisis de video se les asignan tareas por medio del lenguaje natural. Estos pueden analizar, interpretar y procesar grandes cantidades de datos de video para proporcionar información crítica que ayudará a una gama de industrias a optimizar procesos, mejorar la seguridad y reducir costos.

VSS permite una integración perfecta de la IA generativa en pipelines de visión por computadora existentes, lo que mejora la inspección, la búsqueda y el análisis con comprensión multimodal y razonamiento sin ejemplos previos. Puede implementarlo fácilmente desde el edge a la nube en plataformas como NVIDIA RTX PRO™ 6000, NVIDIA DGX™ Spark y NVIDIA® Jetson Thor™.

Explore el blueprint en el catálogo de API.

Cree Agentes en el Edge con los Servicios de la Plataforma Jetson

Puede desarrollar agentes de IA de análisis de video impulsados por la plataforma de IA de edge NVIDIA Jetson™ mediante la función más nueva de NVIDIA JetPack™: los servicios de la plataforma Jetson. La aplicación de IA generativa se está ejecutando enteramente en un dispositivo NVIDIA Jetson Orin™ capaz de detectar eventos para generar alertas y facilitar sesiones interactivas de preguntas y respuestas.


Preguntas Frecuentes

NIM es un conjunto de microservicios fáciles de usar y diseñados para la implementación segura y confiable de inferencia de modelos de IA de alto rendimiento en la nube, data centers y workstations. Admite una amplia gama de modelos de IA, incluidos los de la comunidad de código abierto y los de NVIDIA AI Foundation, para garantizar una inferencia de IA escalable y fluida, ya sea en las instalaciones o en la nube, mediante el uso de API estándar de la industria. Todos los microservicios de NIM y las API de vista previa asociadas se pueden encontrar en build.nvidia.com.

Visite build.nvidia.com para crear una cuenta y comenzar a explorar los microservicios NIM disponibles. Puede explorar NVIDIA Cosmos Reason VLM NIM.

Pruebe el NVIDIA AI Blueprint para búsqueda y resumen de videos, gratuito.

Todos los usuarios pueden comenzar gratuitamente con las API de vista previa en build.nvidia.com. Cada cuenta nueva puede recibir hasta 5000 créditos para probar las API. Para seguir desarrollando una vez agotados los créditos, usted puede implementar los microservicios NIM descargables a nivel local, en su hardware, o en una instancia de nube. Los desarrolladores también pueden acceder a NIM a través del Programa para Desarrolladores de NVIDIA. Consulte los detalles en esta sección de Preguntas Frecuentes.

NVIDIA NIM es gratuito para los desarrolladores que deseen probarlo. Para pasar a producción, los microservicios NIM descargables requieren una licencia NVIDIA AI Enterprise. Para más información, visite esta página.

El foro para desarrolladores de NIM es el mejor lugar para hacer preguntas e interactuar con nuestra comunidad de desarrolladores. Puede acceder a los foros aquí.

Empieza Ahora

Desarrolle Agentes de IA de Análisis de Video

Explore el workflow de referencia impulsado por múltiples modelos de lenguaje visual para desarrollar fácilmente su agente de IA de análisis de video.

Desarrolladores en Acción

Desarrolle Agentes de IA de Análisis de Video Avanzados

Aprenda a desarrollar a la perfección un agente de IA de análisis de video mediante NVIDIA AI Blueprint para la búsqueda y resumen de videos (VSS).

Aumente los Pipelines de Visión por Computadora con IA Generativa

Explore las nuevas funciones de la última VSS 2.4, como la verificación de eventos, la integración con Cosmos Reason y el soporte ampliado para hardware.

Desarrolle un Workflow de Video Basada en Agentes

Aprenda a desarrollar un workflow con entrada de audio, salida de voz para búsqueda de video y resumen.

Desarrolle Aplicaciones Multimodales de XR en Tiempo Real

Aprenda a usar NVIDIA AI Blueprint para búsqueda y resumen de videos a fin de admitir audio en un entorno de XR.

Implemente Agentes de IA Desde el Edge Hasta la Nube

Aproveche el poder del blueprint de VSS para una implementación perfecta de agentes de IA desde el edge hasta la nube, con desempeño escalable en una diversa gama de GPU. La compatibilidad con VSS para NVIDIA DGX Spark estará disponible pronto.

GPU NVIDIA RTX PRO 6000 Serie Blackwell

Las GPU de la serie NVIDIA RTX PRO 6000 Blackwell aceleran la IA física al ejecutar todas las cargas de trabajo de desarrollo de robots en entrenamiento, generación de datos sintéticos, aprendizaje de robots y simulación.

NVIDIA Jetson Thor

Acelere el futuro de la IA física y la robótica con los módulos de la serie NVIDIA Jetson Thor, que ofrecen hasta 2070 TFLOPS FP4 de computación de IA y 128GB de memoria, todo en un formato compacto.

NVIDIA DGX Spark

NVIDIA DGX Spark lleva el poder de NVIDIA Grace Blackwell a los desktops de los desarrolladores. El superchip NVIDIA GB10, combinado con 128GB de memoria de sistema unificada, permite a los investigadores de IA, científicos de datos y estudiantes trabajar localmente con modelos de IA empleando hasta 200 mil millones de parámetros.

Historias de Clientes Relacionadas