Descubra una colección de workflows de referencia que usan modelos de lenguaje de visión para ofrecer capacidades de percepción visual ricas e interactivas para una amplia gama de industrias.
Cargas de Trabajo
Visión Artificial / Análisis de Videos
Industrias
Manufactura
Ciudades/Espacios Inteligentes
Venta Minorista/Bienes de Consumo Empaquetados
Medios de Comunicación y Entretenimiento
Área de la Salud y Ciencias Biológicas
Objetivo Empresarial
Retorno de la Inversión
Innovación
Productos
NVIDIA Metropolis
NVIDIA AI Enterprise
NVIDIA Cosmos Reason
Descripción General
Las aplicaciones tradicionales de análisis de video y sus workflows de desarrollo suelen basarse en modelos limitados de función fija hechos para detectar e identificar solo un conjunto determinado de objetos predefinidos. Con la IA generativa y los modelos base, usted ahora puede desarrollar aplicaciones con menos modelos, ya que estos cuentan con una percepción increíblemente compleja y amplia, y una rica comprensión contextual. Esta nueva generación de modelos de lenguaje de visión (VLM), como NVIDIA Cosmos™ Reason, está dando lugar a agentes de IA de análisis de video inteligentes y poderosos.
Un agente de IA de análisis de video puede combinar modalidades de visión y lenguaje para comprender indicaciones en lenguaje natural y brindar respuestas visuales a preguntas. Por ejemplo, respuestas a una amplia gama de preguntas en lenguaje natural que se puedan aplicar a una transmisión de video grabada o en vivo. Esta comprensión más profunda del contenido en formato video permite interpretaciones más precisas y significativas, lo que mejora la funcionalidad de las aplicaciones de análisis de video y el análisis de escenarios del mundo real. Estos agentes prometen abrir camino a ideas y posibilidades totalmente nuevas para la automatización.
Se implementarán agentes de IA de análisis de video altamente perceptivos, precisos e interactivos en nuestras fábricas, almacenes, tiendas minoristas, aeropuertos, intersecciones de tráfico y más. Esto tendrá un enorme impacto en los equipos de operaciones que buscan tomar mejores decisiones con información más rica generada a partir de interacciones reales. Los gerentes y equipos de operaciones también se comunicarán con estos agentes en lenguaje natural, todos impulsados por IA generativa y VLM con microservicios NVIDIA NIM™ en su núcleo.
Enlaces Rápidos
Implementación Técnica
NVIDIA NIM es un conjunto de microservicios de inferencia que incluye API estándar de la industria, código específico de dominio, engines de inferencia optimizados y tiempo de ejecución empresarial. Ofrece una combinación de VLM, LLM y RAG para desarrollar un agente de IA de análisis de video capaz de procesar imágenes o videos en vivo o archivados para extraer información procesable mediante el lenguaje natural. Creamos un workflow de referencia de un agente de IA de análisis de video que usted puede probar para acelerar su proceso de desarrollo.
Enlaces Rápidos
El NVIDIA AI Blueprint para búsqueda y resumen de videos (VSS) facilita el desarrollo y la personalización de agentes de IA de análisis de video mediante IA generativa, VLM, LLM y NVIDIA NIM. A los agentes de IA de análisis de video se les asignan tareas por medio del lenguaje natural. Estos pueden analizar, interpretar y procesar grandes cantidades de datos de video para proporcionar información crítica que ayudará a una gama de industrias a optimizar procesos, mejorar la seguridad y reducir costos.
VSS permite una integración perfecta de la IA generativa en pipelines de visión por computadora existentes, lo que mejora la inspección, la búsqueda y el análisis con comprensión multimodal y razonamiento sin ejemplos previos. Puede implementarlo fácilmente desde el edge a la nube en plataformas como NVIDIA RTX PRO™ 6000, NVIDIA DGX™ Spark y NVIDIA® Jetson Thor™.
Enlaces Rápidos
Puede desarrollar agentes de IA de análisis de video impulsados por la plataforma de IA de edge NVIDIA Jetson™ mediante la función más nueva de NVIDIA JetPack™: los servicios de la plataforma Jetson. La aplicación de IA generativa se está ejecutando enteramente en un dispositivo NVIDIA Jetson Orin™ capaz de detectar eventos para generar alertas y facilitar sesiones interactivas de preguntas y respuestas.
Enlaces Rápidos
Preguntas Frecuentes
NIM es un conjunto de microservicios fáciles de usar y diseñados para la implementación segura y confiable de inferencia de modelos de IA de alto rendimiento en la nube, data centers y workstations. Admite una amplia gama de modelos de IA, incluidos los de la comunidad de código abierto y los de NVIDIA AI Foundation, para garantizar una inferencia de IA escalable y fluida, ya sea en las instalaciones o en la nube, mediante el uso de API estándar de la industria. Todos los microservicios de NIM y las API de vista previa asociadas se pueden encontrar en build.nvidia.com.
Visite build.nvidia.com para crear una cuenta y comenzar a explorar los microservicios NIM disponibles. Puede explorar NVIDIA Cosmos Reason VLM NIM.
Pruebe el NVIDIA AI Blueprint para búsqueda y resumen de videos, gratuito.
Todos los usuarios pueden comenzar gratuitamente con las API de vista previa en build.nvidia.com. Cada cuenta nueva puede recibir hasta 5000 créditos para probar las API. Para seguir desarrollando una vez agotados los créditos, usted puede implementar los microservicios NIM descargables a nivel local, en su hardware, o en una instancia de nube. Los desarrolladores también pueden acceder a NIM a través del Programa para Desarrolladores de NVIDIA. Consulte los detalles en esta sección de Preguntas Frecuentes.
NVIDIA NIM es gratuito para los desarrolladores que deseen probarlo. Para pasar a producción, los microservicios NIM descargables requieren una licencia NVIDIA AI Enterprise. Para más información, visite esta página.
El foro para desarrolladores de NIM es el mejor lugar para hacer preguntas e interactuar con nuestra comunidad de desarrolladores. Puede acceder a los foros aquí.
Explore el workflow de referencia impulsado por múltiples modelos de lenguaje visual para desarrollar fácilmente su agente de IA de análisis de video.
Aproveche el poder del blueprint de VSS para una implementación perfecta de agentes de IA desde el edge hasta la nube, con desempeño escalable en una diversa gama de GPU. La compatibilidad con VSS para NVIDIA DGX Spark estará disponible pronto.