Les algorithmes de synthèse vocale ont grandement évolué au cours des dernières années et, désormais, l’IA conversationnelle peut interagir avec les clients tout en identifiant les intervenants et leurs contributions respectives. NVIDIA® Riva permet de fusionner les données multi-capteurs de vision et de rendu audio au sein d’un seul flux d’informations avec des composants de transcription avancés, dans des champs d’application tels que la journalisation visuelle pour différencier des voix multiples en temps réel.