Gli algoritmi speech-to-text si sono evoluti e ora l'IA conversazionale può interagire con i clienti identificando i parlanti ed etichettando i loro contributi. NVIDIA® Riva fonde dati di visione e audio acquisiti da più sensori in un singolo flusso di informazioni che può essere utilizzato per la trascrizione avanzata, come la differenziazione di più voci in tempo reale.