O Riva fornece modelos de reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) baseados em deep learning para profissionais e desenvolvedores de IA. ASR, TTS e NMT são interfaces de voz em aplicações de fala baseados em IA, como assistências de agentes de call center, assistentes digitais, transcrições de chamadas de vídeo e superchats de IA impulsionados por grandes modelos de linguagem (LLMs) e geração aumentada de recuperação (RAG).
O ASR converte fala em texto e geralmente é a primeira etapa em um pipeline de fala, portanto, sua precisão de transcrição influencia todas as tarefas posteriores. O TTS gera vozes semelhantes às humanas a partir do texto. NMT traduz palavras de um idioma para outro.
A Riva é usada em todos os setores, desde telecomunicações e finanças até a área da saúde, varejo e automotivo, onde quer que as empresas interajam com os clientes.