Villes et espaces intelligents
Kaohsiung City Government
Linker Vision propose des solutions de vision par ordinateur axées sur les données ayant été optimisées pour un déploiement rapide et une évolutivité efficace des applications de vision avec l'IA, du Cloud à l'Edge. Kaohsiung, l'une des plus grandes villes de Taïwan, figure parmi les clients les plus importants de Linker Vision. Elle a mis en œuvre des solutions de ville intelligente avancées en utilisant NVIDIA Metropolis pour relever un défi urbain crucial avec des silos départementaux. Ces infrastructures gouvernementales fragmentées rendent le partage rapide et efficace d'informations essentielles extrêmement difficile, ce qui entrave les réponses coordonnées aux problèmes de la ville. Linker Vision utilise la stratégie de NVIDIA basée sur trois ordinateurs, consistant à simuler des jumeaux numériques avec NVIDIA Omniverse™, à ajuster des modèles d'IA tels que Cosmos Reason et à déployer des agents d'IA avec NVIDIA AI Blueprint pour la recherche et la synthèse de vidéos (VSS), afin d'aider les villes à mieux connaître la situation et à prendre des décisions proactives fondées sur les données. Cela permet également de briser des silos organisationnels et de jeter les bases d'une ville vraiment intelligente.
La nature hautement variable et imprévisible des évènements anormaux en ville est l'une des difficultés principales à l'application de la vision par l'IA dans le domaine. Les systèmes de vision par ordinateur traditionnels sont entraînés pour détecter des objets standard tels que des voitures, des bâtiments ou des personnes. En revanche, ils ont souvent du mal à interpréter la situation dans son ensemble ou à comprendre des événements critiques, tels qu'un accident de la route, une inondation ou la chute d'un arbre.
Pour remédier à cette limitation, Linker Vision utilise des VLM, avec le mappage dumodèle d'IA de NVIDIA pour les villes intelligentes, afin d'aller au-delà de la simple détection d'objets en interprétant les relations entre les éléments visuels et en générant des narrations descriptives de la scène. En demandant à NVIDIA Cosmos Reason VLM de décrire ce qui se passe, Linker Vision permet au système de fournir des explications intelligentes de scénarios complexes, ce qui aide les intervenants et les responsables de la ville à mieux comprendre la situation en temps réel. Cette approche améliore considérablement la connaissance de la situation et l'efficacité de la réponse, en particulier dans des environnements urbains dynamiques et imprévisibles.
"Grâce aux innovations en matière d'IA générative et de VLM, nous visons à démontrer l'immense potentiel de la vision par l'IA dans le développement de villes intelligentes. L'intégration des technologies NVIDIA rend nos solutions plus efficaces et utiles. Cette collaboration montre comment les technologies intelligentes peuvent s'aligner sur les besoins urbains pour entrainer des changements significatifs."
Willy Kuo
, directeur de la technologie et cofondateur de Linker Vision
Les villes sont confrontées à un problème de taille : la compartimentation des services publics. Historiquement, les différents services municipaux (service de l'eau potable, service transport et mobilité, etc.) fonctionnaient sur des systèmes isolés développés par différents intégrateurs de systèmes et fournisseurs. Cela rend extrêmement difficile la coordination de réponses rapides aux problèmes. Prenons l'exemple d'une inondation détectée par le service en charge de surveiller les crues. Ces données soient vitales pour le service des transports, car les inondations peuvent gravement perturber la circulation et la sécurité publique. Cependant, l'absence de système unifié empêchait le partage automatique et rapide de ces informations. Les différents services se retrouvaient ainsi souvent à travailler chacun de leur côté et à manquer des opportunités de réagir de façon à atténuer l'impact sur les citoyens et les infrastructures.
Pour combler cette lacune, Linker Vision a développé et déployé une plateforme intégrée de vision par IA. Celle-ci s'appuie sur le modèle d'IA de NVIDIA pour la recherche et la synthèse vidéo (VSS) pour développer des agents d'IA d'analyse vidéo capables de traiter des milliers de flux de données en direct issus de caméras dans la ville et de fournir des informations plus approfondies sur les incidents de circulation. Ces informations aident les services d'urgence à réagir rapidement et à améliorer les opérations en ville. Prenons un exemple : les agents d'IA détectent les inondations sur une artère majeure et alertent automatiquement les services municipaux appropriés ainsi que les citoyens concernés en leur fournissant des informations essentielles sur l'emplacement, l'heure de l'évènement et les mesures à prendre. La plateforme d'IA sert de base unifiée aux données en temps réel, ce qui permet d'améliorer la collaboration entre les différents services, la connaissance de la situation et la prise de décision dans l'ensemble de la ville.
Linker Vision structure sa solution de vision par l'IA pour les villes autour de la stratégie à trois ordinateurs de NVIDIA pour les étapes de simulation, d'entraînement et d'exécution.
Linker Vision commence par convertir les images satellites et aériennes en scènes OpenUSD et crée un jumeau numérique de la ville en utilisant NVIDIA Omniverse sur des serveurs NVIDIA OVX™. L'utilisation de NVIDIA Cosmos Transfer permet de générer diverses données vidéo synthétiques pour des scénarios complexes tels que des dommages aux infrastructures ou des inondations, contribuant ainsi à couvrir les cas rares de longue traîne difficiles à capturer dans le monde réel.
Pour entraîner ses modèles d'IA, Linker Vision s'appuie sur NeMo Curator et nv-grounding-dino pour organiser, annoter et étiqueter les données réelles. Ces jeux de données réels et synthétiques sont utilisés pour affiner les VLM afin d'augmenter leur précision et d'obtenir de meilleures informations sur les activités urbaines complexes.
Au niveau du déploiement, Linker Vision utilise le modèle VSS, qui combine les pipelines de vision de NVIDIA Metropolis avec des modèles d'IA générative commeles VLM Cosmos Reason sur des serveurs NVIDIA DGX™. Cela permet aux agents d'IA de détecter, comprendre et répondre aux événements du monde réel avec des informations pertinentes et rapides pour mener des opérations de ville intelligente.
Enfin, Linker Vision connecte son pipeline de vision par l'IA à un environnement de jumeau numérique en temps réel basé sur Omniverse. En intégrant les résultats de son pipeline d'analyse de vision, la société crée un centre de commande interactif au sein duquel les responsables municipaux peuvent facilement surveiller et réagir aux événements dans la ville.
Linker Vision contribue activement au développement d'écosystèmes d'IA, en particulier dans les milieux de la gouvernance des villes intelligentes, des infrastructures basées sur l'IA et de la prise de décision autonome. À Kaohsiung, Linker Vision intègre 30 000 flux de données issus de diverses caméras, gérés sur une plateforme de jumeau numérique 3D à l'échelle de la ville. Le système est entraîné pour comprendre plus de dix domaines urbains et d'entreprise, notamment le transport, la gestion de l'eau, les soins de santé et la logistique, ainsi que plus de 300 scénarios tels que les accidents de la route, la réponse aux catastrophes, la sécurité publique et la gestion des infrastructures.
Les solutions de vision avec l'IA améliorent la qualité de vie dans les villes et réduisent jusqu’à 80 % les temps de réponse aux incidents. Le travail de Linker Vision, mis en avant dans une récente conférence GTC sur l'IA à l'échelle de la ville avec des jumeaux numériques, montre comment les technologies d'IA de NVIDIA s'intègrent afin de traiter l'IA en temps réel pour l'IA à l'échelle de la ville, l'entraînement de modèles à grande échelle et les applications d'IA multi-domaines dans les villes intelligentes, l'automatisation industrielle et les écosystèmes d'IA.
Exploitez la puissance des VLM et commencez à développer grâce aux modèles d'IA de NVIDIA.