Flujos de trabajo de NVIDIA Visual Insight Agent (VIA)

Cree agentes IA de visión con tecnología de modelos de lenguaje de visión

¿Qué es VIA?

NVIDIA VIA es una colección de flujos de trabajo para crear agentes de IA capaces de procesar grandes cantidades de vídeos e imágenes en directo o archivados mediante Vision-Language Models (VLM), ya estén implementados en el perímetro o en la nube. Esta nueva generación de agentes de IA visual ayudará a casi todos los sectores a resumir, buscar y extraer información procesable de vídeos, utilizando para ello lenguaje natural.

Transforma tus aplicaciones de visión con la IA generativa

Aprovecha los últimos modelos

Mejora la precisión del modelo con la adaptación del dominio mediante NVIDIA NeMo y NVIDIA TAO o actualiza sin problemas a los nuevos modelos de última generación con los NVIDIA NIM.

Crear agentes de IA para resumir vídeos y encontrar aspectos destacados

Procesa más de 100 veces más rápido que el vídeo de entrada para realizar resúmenes de vídeo enriquecidos con lenguaje natural.

Interacciones multimodales

Experimenta interacciones multimodales impulsadas por IA generativa e integra fácilmente con sistemas empresariales utilizando API estándar.

Ver VIA en acción

Ejemplo: Gestión de almacenes

Obtén resúmenes completos de actividades matizadas mediante lenguaje natural, ya sea a partir de vídeos largos o imágenes.

Ejemplo: Análisis deportivo

Crea agentes con interactividad enriquecida.  Haz preguntas detalladas e incluso solicitudes del tipo "muéstrame" para encontrar clips específicos de ciertos tipos de actividades, como imágenes destacadas o eventos únicos

Recursos iniciales

Solicitar acceso anticipado

Descubre la potencia de un agente de IA para el resumen y la búsqueda de vídeo.

Mira la charla de NVIDIA GTC sobre agentes de IA de visión

Aprende a aprovechar la IA generativa y los modelos de lenguaje de gran tamaño con agentes de IA de visión.