Los algoritmos de conversión de voz a texto han evolucionado y, ahora, la IA conversacional puede interactuar con los clientes identificando a los interlocutores y etiquetando sus contribuciones. NVIDIA® Riva fusiona los datos de audio y visión de varios sensores en un único flujo de información que puede utilizarse para la transcripción avanzada, como la diferenciación de varias voces en tiempo real.