Transformando as Operações Inteligentes de Call Center em Finanças ao Consumidor
Os recursos da IA atraíram uma infinidade de instituições bancárias e financeiras no Vietnã, particularmente o Home Credit Vietnam. Como uma das principais empresas de finanças digitais do Vietnã, a Home Credit sempre priorizou a experiência do cliente. Reconhecendo a importância da automação de processos e da eficiência operacional, a Home Credit fez parceria com a FPT Smart Cloud para implantar a solução FPT AI Engage em 2019, quando a IA ainda era um conceito relativamente novo no Vietnã, demonstrando a visão estratégica da empresa.
Após o primeiro ano de operação em 2020, o FPT.AI Virtual Agent for Call Center apoiou o Home Credit Vietnam para fazer mais de 5 milhões de chamadas por mês. Isso foi ampliado, com tecnologia da NVIDIA, para 12 milhões de chamadas durante os horários de pico, economizando 50% dos custos operacionais e alcançando uma taxa de sucesso de chamadas de 98%. Além disso, o "atendente virtual" da Home Credit Vietnam teve um índice médio de satisfação do cliente de 4,5/5.
A implantação é otimizada usando o NVIDIA® TensorRT™ e servida no Servidor de Inferência NVIDIA Triton™ com lotes dinâmicos, economizando até 20% dos recursos de computação de alto desempenho para a mesma qualidade de saída do modelo.
Até agora, o Home Credit Vietnam colocou mais de 100 casos de uso em aplicações, incluindo consultas de informações, autoatendimento para bloquear ou ativar cartões, pesquisas automatizadas com clientes e cobrança de dívidas. Como resultado, essas tarefas rotineiras são transferidas para a IA e os atendentes humanos têm mais tempo para lidar com problemas críticos do cliente.
Uma nova aplicação de assistentes virtuais que pode ajudar a converter um "centro de custo", como um departamento de atendimento ao cliente, em um "centro de lucro", é um processo chamado serviço de vendas. O FPT AI Engage aumentou o volume de serviços para vendas da Home Credit Vietnam em 2 vezes.
Essas inovações revelaram a necessidade de um envolvimento mais humano do cliente em assistentes virtuais para impulsionar a experiência digital. Isso mudou o foco para a qualidade das vozes geradas por IA.
As vozes sintéticas são desenvolvidas em conjunto com assistentes virtuais, com uma variedade de tons, sotaques e sentimentos disponíveis. O tipo de voz implantada depende da aplicação. Por exemplo, assistentes virtuais para consultas gerais usam tons mais amigáveis e informativas. As vozes de IA para televendas envolvem mais flexibilidade e emoções para melhor persuadir os clientes em potencial.
Modelos Avançados de Síntese de Fala para Melhorar a Qualidade da Conversação
Reconhecendo a crescente demanda por assistentes virtuais sentimentais e com som mais humano, o FPT Smart Cloud visa desenvolver modelos de síntese de fala que possam produzir novas vozes com base em alguns minutos de amostras de áudio. As vozes geradas precisam ser de alta qualidade, indistinguíveis da voz humana e se comunicar em vários idiomas, mesmo que as entradas de treinamento sejam em vietnamita.
Dadas as nuances e conotações emocionais da linguagem humana, o modelo de síntese de fala geralmente requer uma grande quantidade de dados de treinamento e longo tempo de processamento para otimizar a precisão e a expressividade.
O treinamento do modelo foi executado anteriormente na GPU NVIDIA A100 Tensor Core. O treinamento típico requer três servidores com capacidade de processamento de 100 horas de dados de voz por dia por um período de 20 dias. Espera-se que uma atualização para a GPU NVIDIA H100 Tensor Core lide com requisitos de modelo mais complicados e reduza o tempo de processamento em pelo menos 3 vezes, ou 7 dias, com 2.000 horas de dados de áudio.
Com a H100, o processo total requer apenas um servidor dedicado. O modelo de síntese de fala fica pronto em cinco dias, uma melhoria de eficiência de 4 vezes em comparação com a NVIDIA A100, pois processava cerca de 400 horas de amostras de voz por dia. O modelo de saída aumentou 100 vezes em dimensão e aptidão, gerando uma voz com som humano que pode fazer a transição perfeita para 18 idiomas, incluindo vietnamita, inglês e indonésio.
Comparado com a A100, a H100 é um avanço na modelagem de voz de IA, transcendendo as barreiras linguísticas e facilitando a comunicação global em uma escala sem precedentes. Dando o salto no empoderamento da IA, a FPT Smart Cloud também está utilizando a NVIDIA H100 para grandes modelos de linguagem para gerar respostas mais precisas e flexíveis para assistentes virtuais.