Agentes de IA visual impulsados por IA generativa

Agentes de IA para análisis de video

Descubre una colección de flujos de trabajo de referencia que utilizan modelos de lenguaje de visión para ofrecer capacidades de percepción visual avanzadas e interactivas a una amplia gama de sectores.

Explorar la IA de visión

Descripción
Implementación técnica
Preguntas frecuentes
Empezar
Resources
Implemente agentes de IA
clientes relacionadas

Descripción
Implementación técnica
Preguntas frecuentes
Empezar
Resources
Implemente agentes de IA
clientes relacionadas

Explorar la IA de visión

Cargas de trabajo

Visión informática/análisis de video

Sectores

Comercio minorista/Productos de consumo envasados
Fabricación
Ciudades/espacios inteligentes
Sanidad y biociencias

Objetivo del negocio

Retorno de inversión
Innovación

Productos

Descripción

Impulsar una nueva ola de aplicaciones

Las aplicaciones de análisis de vídeo tradicionales y sus flujos de trabajo de desarrollo suelen basarse en modelos limitados de función fija que están diseñados para detectar e identificar solo un conjunto selecto de objetos predefinidos. Con la IA generativa y los modelos básicos, ahora puedes crear aplicaciones con menos modelos que tengan una percepción increíblemente compleja y amplia y una rica comprensión contextual. Esta nueva generación de modelos de lenguaje de visión (VLM), como NVIDIA Cosmos™ Reason, está dando lugar a agentes de IA para análisis de vídeo inteligentes y potentes

¿Qué es un agente de IA visual?

Un agente de IA de análisis de vídeo puede combinar tanto modalidades de visión como de lenguaje para comprender las indicaciones de lenguaje natural y dar respuestas visuales a preguntas. Por ejemplo, responder a una amplia gama de preguntas en lenguaje natural que se pueden aplicar en relación a una transmisión de vídeo ya sea grabada o en vivo. Esta comprensión más profunda del contenido de vídeo permite interpretaciones más precisas y significativas, mejorando la funcionalidad de las aplicaciones de análisis de vídeo y el análisis de escenarios del mundo real. Estos agentes prometen desbloquear información y posibilidades completamente nuevas para la automatización.

Optimizar todos los espacios y operaciones

Los agentes de IA para análisis de vídeo altamente perceptivos, precisos e interactivos se implementarán en fábricas, almacenes, tiendas minoristas, aeropuertos, intersecciones de tráfico, etc. Esto tendrá un impacto enorme en los equipos de operaciones que deseen crear espacios más seguros y tomar mejores decisiones utilizando información más exhaustiva y generada a partir de interacciones naturales. Los gerentes y los equipos de operaciones también se comunicarán con estos agentes usando un lenguaje natural, todo impulsado por IA generativa y VLM con microservicios NVIDIA NIM™ en su núcleo.

Cree agentes de IA para análisis de vídeo

Explore el flujo de trabajo de referencia, impulsado por múltiples modelos de lenguaje visual, y cree fácilmente su agente para análisis de vídeo.

Explorar el AI Blueprint

Enlaces rápidos

3 formas de llevar la IA agentiva a aplicaciones de visión por ordenador

Creación de espacios más seguros: NVIDIA y sus partners llevan la IA física a las ciudades y la infraestructura industrial

Cómo los agentes de IA de ciudades inteligentes transforman las operaciones urbanas

Implementación técnica

Desarrolla con NVIDIA NIM

NVIDIA NIM es un conjunto de microservicios de inferencia que incluye API estándar del sector, código específico de dominio, motores de inferencia optimizados y tiempo de ejecución empresarial. Ofrece una combinación de VLM, LLM y RAG a fin de crear su agente de IA para análisis de vídeo, capaz de procesar imágenes o vídeos, tanto en vivo como archivados, con objeto de extraer información procesable utilizando un lenguaje natural. Hemos creado un flujo de trabajo de referencia de un agente de IA para análisis de vídeo que puede probar para acelerar su proceso de desarrollo.

Enlaces rápidos

Pruebe el flujo de trabajo de referencia del agente de IA para análisis de vídeo

Leer el blog sobre la creación de agentes de IA para análisis de vídeo multimodal con NVIDIA NIM ›

Creación de agentes más inteligentes con modelos de razonamiento de NVIDIA Nemotron y Cosmos para aplicaciones de IA empresarial y física

Cree agentes de IA con el blueprint de NVIDIA AI

The NVIDIA AI Blueprint for video search and summarization (VSS) makes it easy to build and customize video analytics AI agents using generative AI, VLMs, LLMs, and NVIDIA NIM. The video analytics AI agents are given tasks through natural language and can analyze, interpret, and process vast amounts of video data to provide critical insights that help a range of industries optimize processes, improve safety, and cut costs.

VSS permite la integración sin problemas de la IA generativa en los procesos de visión por ordenador existentes, mejorando la inspección, la búsqueda y el análisis con comprensión multimodal y razonamiento de cero disparos. Se puede implementar fácilmente desde el perímetro hasta la nube en plataformas como NVIDIA RTX PRO™ 6000, NVIDIA DGX™ Spark y NVIDIA® Jetson Thor™.

Enlaces rápidos

Pruebe el Blueprint en la nube con Launchable ›

Cómo integrar los procesos de visión computerizada con IA generativa y razonamiento ›

Leer el blog: Agentes de IA avanzados para análisis de vídeo utilizando el Blueprint de IA de NVIDIA para la búsqueda y el resumen de vídeos ›

Transmisión en directo: Creación de agentes de IA visual con NVIDIA Cosmos Reason y Metropolis

Cree agentes perimetrales con los servicios de la plataforma Jetson

Los desarrolladores pueden crear agentes visuales de IA con la plataforma de IA en el perímetro NVIDIA Jetson™ utilizando la nueva característica de NVIDIA JetPack™: Jetson Platform Services. La aplicación generativa de IA se ejecuta completamente en un dispositivo NVIDIA Jetson Orin™, capaz de detectar eventos para generar alertas y facilitar sesiones interactivas de preguntas y respuestas.

Enlaces rápidos

Descargar el flujo de trabajo de referencia para Jetson™

Blog tecnológico: desarrollar agentes visuales de IA generativa para el perímetro

Preguntas frecuentes

NIM es un conjunto de microservicios fáciles de usar diseñados para implementar, de forma segura y fiable, inferencias de modelos de IA de alto rendimiento en la nube, centros de datos y estaciones de trabajo. Es compatible con una amplia gama de modelos de IA, entre ellos los de la comunidad de código abierto y los de NVIDIA AI Foundation, para garantizar una inferencia de IA perfecta y escalable, en las instalaciones o en la nube, utilizando API estándar del sector. Todos los microservicios NIM y las API de vista previa asociadas se pueden encontrar en build.nvidia.com.

Visite build.nvidia.com para crear una cuenta y empezar a explorar los microservicios NIM disponibles. Puede consultar el NVIDIA Cosmos Reason VLM NIM.

Pruebe de forma gratuita el Blueprint de IA de NVIDIA para la búsqueda y el resumen de vídeos.

Todos los usuarios pueden empezar gratis con las API de vista previa en build.nvidia.com. Cada cuenta nueva puede recibir hasta 5000 créditos para probar las API. Para continuar el desarrollo después de que se agoten los créditos, puede implementar los microservicios NIM descargables de forma local en su hardware o en una instancia de la nube. Los desarrolladores también pueden acceder a NIM a través del programa de desarrolladores de NVIDIA. Ver los detalles en estas preguntas frecuentes.

NVIDIA NIM es gratuito para que los desarrolladores lo prueben. Para pasar a producción, los microservicios NIM descargables requieren una licencia de NVIDIA AI Enterprise. Para obtener más información, visite esta página .

El foro de desarrolladores de NIM es el mejor lugar para hacer preguntas e interactuar con nuestra comunidad de desarrolladores. Puede acceder a los foros aquí.

Descripción
Implementación técnica
FAQ

Impulsar una nueva ola de aplicaciones

Las aplicaciones de análisis de vídeo tradicionales y sus flujos de trabajo de desarrollo suelen basarse en modelos limitados de función fija que están diseñados para detectar e identificar solo un conjunto selecto de objetos predefinidos. Con la IA generativa y los modelos básicos, ahora puedes crear aplicaciones con menos modelos que tengan una percepción increíblemente compleja y amplia y una rica comprensión contextual. Esta nueva generación de modelos de lenguaje de visión (VLM) está dando lugar a agentes de IA visuales inteligentes y poderosos.

¿Qué es un agente de IA visual?

Agilizar cada operación industrial

Agentes de IA visuales altamente perceptivos, precisos e interactivos se desplegarán en nuestras fábricas, almacenes, tiendas minoristas, aeropuertos, intersecciones de tráfico, etc. Esto tendrá un gran impacto en los equipos de operaciones que buscan tomar mejores decisiones utilizando información más rica, generada a partir de interacciones naturales. Los gerentes y los equipos de operaciones se comunicarán con estos agentes en lenguaje natural, todo ello con la tecnología generativa de IA y grandes modelos de lenguaje de visión con microservicios NVIDIA NIM™ en su núcleo.

Enlaces rápidos

Lea el blog: Ya disponible el blueprint de IA para búsqueda y resumen de vídeos para implementar agentes de IA visual en todos los sectores

Lea el blog: NVIDIA lanza un blueprint para agentes de IA capaces de analizar vídeos

Lea el blog: Cualquier sector ahora puede buscar y resumir grandes volúmenes de datos visuales

Lea el caso de estudio de Pegatron

Lea el caso de estudio de Linker Vision

Desarrolla con NVIDIA NIM

NVIDIA NIM es un conjunto de microservicios de inferencia que incluye API estándar del sector, código específico de dominio, motores de inferencia optimizados y tiempo de ejecución empresarial. Ofrece múltiples VLM para crear tu agente de IA visual, capaz de procesar imágenes o vídeos, tanto en vivo como archivados, para extraer información procesable utilizando lenguaje natural. Hemos creado un flujo de trabajo de referencia de un agente de IA visual que puedes probar para acelerar tu proceso de desarrollo.

Enlaces rápidos

Probar el flujo de trabajo de referencia del agente de IA

Cree agentes de IA con el blueprint de NVIDIA AI

El Blueprint de NVIDIA AI para búsqueda y resumen de vídeos (VSS) facilita el comienzo de creación y personalización de agentes de IA de análisis de vídeo, todo ello con IA generativa, modelos de lenguaje de visión (VLM), modelos lingüísticos de gran tamaño (LLM) y NVIDIA NIM. A los agentes de IA de análisis de vídeo se les asignan tareas mediante lenguaje natural y pueden procesar grandes cantidades de datos de vídeo para proporcionar información crítica que ayude a diversos sectores a optimizar procesos, mejorar la seguridad y reducir los costes.

Los agentes de IA creados a partir del blueprint pueden analizar, interpretar y procesar datos de vídeo a escala, produciendo resúmenes de vídeo hasta 200 veces más rápido que al revisar los vídeos manualmente. El blueprint puede acelerar el desarrollo de agentes de IA al reunir varios modelos y servicios de IA generativa y ofrece mucha flexibilidad mediante una amplia gama de VLM/LLM de NVIDIA y de terceros, así como opciones de implementaciones optimizadas desde el perímetro hasta la nube.

Enlaces rápidos

Descargar Microservicios NVIDIA VIA

Blog tecnológico: creando agentes de IA visuales con microservicios NVIDIA VIA y NIM

Cree agentes perimetrales con los servicios de la plataforma Jetson

Enlaces rápidos

Descargar el flujo de trabajo de referencia para Jetson™

Blog tecnológico: desarrollar agentes visuales de IA generativa para el perímetro

Para empezar con los microservicios NIM y los Blueprints de NVIDIA AI, visite build.nvidia.com para crear una cuenta y empezar a explorar los microservicios NIM disponibles. Puede consultar los NIM de VLM disponibles aquí.

Pruebe el Blueprint de NVIDIA AI para búsqueda y resumen de vídeos de forma gratuita,

El foro de desarrolladores de NIM es el mejor lugar para hacer preguntas e interactuar con nuestra comunidad de desarrolladores. Puede acceder a los foros aquí.

Crear agentes de IA visual

Explora el flujo de trabajo de referencia impulsado por múltiples modelos de lenguaje visual para crear fácilmente tu agente de IA visual.

Pruebe modelos de lenguaje de visión

Explore blueprints de VSS

Desarrolladores en acción

Cree agentes de IA avanzados para análisis de vídeo

Descubra la mejora más reciente del blueprint de NVIDIA AI para búsqueda y resumen de vídeos, ahora disponible de forma general.

Leer el blog

Cree un agente de búsqueda y resumen de vídeos

Descubra el blueprint de NVIDIA AI para búsqueda y resumen de vídeo, que integra VLM, LLM y RAG complejos con microservicios compatibles.

Leer el blog

Desarrolle agentes de IA de análisis de vídeo para el perímetro

Explore los agentes de IA para análisis de vídeo basados en VLM en el perímetro utilizando NVIDIA Jetson Platform Services.

Leer el blog

Seminario web: cómo desbloquear el análisis de vídeo con agentes de IA

Descubra cómo desarrollar y ajustar con precisión agentes de IA que analizan el vídeo y ofrecen información crítica utilizando los últimos modelos de lenguaje de visión.

Ver ahora

Implemente agentes de IA desde el perímetro a la nube

Aproveche la potencia del blueprint de VSS para implementar óptimamente agentes de IA, desde el perímetro hasta la nube, con un rendimiento escalable en una variada gama de GPU.

NVIDIA DGX Spark

DGX™ Spark lleva la potencia de NVIDIA Grace Blackwell a los escritorios de los desarrolladores. El superchip GB10, combinado con 128 GB de memoria de sistema unificada, permite a investigadores de IA, científicos de datos y estudiantes trabajar con modelos de IA de forma local con hasta 200 000 millones de parámetros.

Más Información

NVIDIA Jetson Thor

Acelere el futuro de la IA física y la robótica con los módulos de la serie NVIDIA Jetson Thor, que ofrecen hasta 2070 TFLOPS FP4 de computación de IA y 128 GB de memoria, todo en un factor de forma compacto.

Más información

Acelere las cargas de trabajo de IA física con las GPU NVIDIA RTX PRO Blackwell Serie 6000

Las GPU NVIDIA RTX PRO™ Blackwell Serie 6000 aceleran la IA física al ejecutar todas las cargas de trabajo de desarrollo de robots a través del entrenamiento, la generación de datos sintéticos, el aprendizaje de robots y la simulación.

Más información

Historias de clientes relacionadas

Más casos de éxito

Descripción
Implementación técnica
FAQ

Impulsar una nueva ola de aplicaciones

Las aplicaciones de análisis de vídeo tradicionales y sus flujos de trabajo de desarrollo suelen basarse en modelos limitados de función fija que están diseñados para detectar e identificar solo un conjunto selecto de objetos predefinidos. Con la IA generativa y los modelos básicos, ahora puedes crear aplicaciones con menos modelos que tengan una percepción increíblemente compleja y amplia y una rica comprensión contextual. Esta nueva generación de modelos de lenguaje de visión (VLM) está dando lugar a agentes de IA visuales inteligentes y poderosos.

¿Qué es un agente de IA visual?

Agilizar cada operación industrial

Enlaces rápidos

Lea el blog: Ya disponible el blueprint de IA para búsqueda y resumen de vídeos para implementar agentes de IA visual en todos los sectores

Lea el blog: NVIDIA lanza un blueprint para agentes de IA capaces de analizar vídeos

Lea el blog: Cualquier sector ahora puede buscar y resumir grandes volúmenes de datos visuales

Lea el caso de estudio de Pegatron

Lea el caso de estudio de Linker Vision

Desarrolla con NVIDIA NIM

NVIDIA NIM es un conjunto de microservicios de inferencia que incluye API estándar del sector, código específico de dominio, motores de inferencia optimizados y tiempo de ejecución empresarial. Ofrece múltiples VLM para crear tu agente de IA visual, capaz de procesar imágenes o vídeos, tanto en vivo como archivados, para extraer información procesable utilizando lenguaje natural. Hemos creado un flujo de trabajo de referencia de un agente de IA visual que puedes probar para acelerar tu proceso de desarrollo.

Enlaces rápidos

Probar el flujo de trabajo de referencia del agente de IA

Cree agentes de IA con el blueprint de NVIDIA AI

Enlaces rápidos

Descargar Microservicios NVIDIA VIA

Blog tecnológico: creando agentes de IA visuales con microservicios NVIDIA VIA y NIM

Cree agentes perimetrales con los servicios de la plataforma Jetson

Enlaces rápidos

Descargar el flujo de trabajo de referencia para Jetson™

Blog tecnológico: desarrollar agentes visuales de IA generativa para el perímetro

Pruebe el Blueprint de NVIDIA AI para búsqueda y resumen de vídeos de forma gratuita,

El foro de desarrolladores de NIM es el mejor lugar para hacer preguntas e interactuar con nuestra comunidad de desarrolladores. Puede acceder a los foros aquí.

Agentes de IA para análisis de video

Impulsar una nueva ola de aplicaciones

¿Qué es un agente de IA visual?

Optimizar todos los espacios y operaciones

Cree agentes de IA para análisis de vídeo

Desarrolla con NVIDIA NIM

Cree agentes de IA con el blueprint de NVIDIA AI

Cree agentes perimetrales con los servicios de la plataforma Jetson

¿Qué es un microservicio NIM?

¿Cómo empiezo con los VLM y el Blueprint de NVIDIA AI para la búsqueda y resumen de vídeos (VSS)?

¿Cómo obtengo créditos para build.nvidia.com?

¿Tengo que pagar para usar un NIM descargable?

¿Cómo puedo obtener soporte técnico al crear prototipos con los microservicios NIM?

Impulsar una nueva ola de aplicaciones

¿Qué es un agente de IA visual?

Agilizar cada operación industrial

Desarrolla con NVIDIA NIM

Cree agentes de IA con el blueprint de NVIDIA AI

Cree agentes perimetrales con los servicios de la plataforma Jetson

¿Qué es un microservicio NIM?

¿Cómo empiezo con los VLM y el Blueprint de NVIDIA AI para la búsqueda y resumen de vídeos (VSS)?

¿Cómo obtengo créditos para build.nvidia.com?

¿Tengo que pagar para usar un NIM descargable?

¿Cómo puedo obtener soporte técnico al crear prototipos con los microservicios NIM?

Crear agentes de IA visual

Desarrolladores en acción

Cree agentes de IA avanzados para análisis de vídeo

Cree un agente de búsqueda y resumen de vídeos

Desarrolle agentes de IA de análisis de vídeo para el perímetro

Seminario web: cómo desbloquear el análisis de vídeo con agentes de IA

Implemente agentes de IA desde el perímetro a la nube

NVIDIA DGX Spark

NVIDIA Jetson Thor

Acelere las cargas de trabajo de IA física con las GPU NVIDIA RTX PRO Blackwell Serie 6000

Historias de clientes relacionadas

Impulsar una nueva ola de aplicaciones

¿Qué es un agente de IA visual?

Agilizar cada operación industrial

Desarrolla con NVIDIA NIM

Cree agentes de IA con el blueprint de NVIDIA AI

Cree agentes perimetrales con los servicios de la plataforma Jetson

¿Qué es un microservicio NIM?

¿Cómo empiezo con los VLM y el Blueprint de NVIDIA AI para la búsqueda y resumen de vídeos (VSS)?

¿Cómo obtengo créditos para build.nvidia.com?

¿Tengo que pagar para usar un NIM descargable?

¿Cómo puedo obtener soporte técnico al crear prototipos con los microservicios NIM?