Sprache-zu-Text-Algorithmen haben sich weiterentwickelt, und jetzt kann Gesprächs-KI mit Kunden interagieren, während Sprecher identifiziert und ihre Beiträge gekennzeichnet werden. NVIDIA® Riva ermöglicht die Verschmelzung von Multisensor-Audio- und Bilddaten zu einem einzigen Informationsstrom, der für fortgeschrittene Transkriptionen wie die Unterscheidung mehrerer Stimmen in Echtzeit verwendet werden kann.