Révolutionner les opérations de centre d’appels intelligents dans l’industrie du crédit à la consommation
Les capacités de l’IA ont attiré une pléthore d’institutions bancaires et financières au Vietnam, en particulier Home Credit Vietnam. En tant que l’une des principales sociétés de finance numérique du Vietnam, Home Credit a toujours donné la priorité à l’expérience client. Reconnaissant l’importance de l’automatisation des processus et de l’efficacité opérationnelle, Home Credit s’est associé à FPT Smart Cloud pour déployer la solution
FPT AI Engage en 2019, alors que l’IA était encore un concept relativement nouveau au Vietnam, démontrant ainsi la vision stratégique de l’entreprise.
Après la première année d’exploitation en 2020, l’agent virtuel FPT.AI pour le centre d’appels a permis à Home Credit Vietnam de faire plus de 5 000 000 appels par mois. Cela est passé, grâce à NVIDIA, à 12 000 000 appels pendant les heures de pointe, ce qui a permis d’économiser 50 % des coûts d’exploitation et d’obtenir un taux de réussite des appels de 98 %. En outre, l’agent virtuel de Home Credit Vietnam avait un taux de satisfaction client moyen de 4,5/5.
Le déploiement est désormais optimisé en utilisant NVIDIA® TensorRT™ et servi dans NVIDIA Triton™ Inference Server avec un batching dynamique, ce qui permet d’épargner jusqu’à 20 % des ressources informatiques hautes performances pour la même qualité de sortie du modèle.
Depuis lors, Home Credit Vietnam a mis plus de 100 cas d’utilisation dans des applications, y compris des demandes d’informations, des demandes d’informations pour verrouiller ou activer des cartes, des enquêtes en libre-service pour les clients, des enquêtes sur les clients automatisés et le recouvrement des créances. Ces tâches banales sont donc déchargées à l’IA et les agents humains ont plus de temps pour gérer les problèmes clients critiques.
Une nouvelle application d’assistants virtuels capable d’aider à transformer un « centre de coûts », tel qu’un service clientèle, en un « centre de profits », est un processus qualifié de « service aux ventes ». Le service à domicile a multiplié le volume des ventes de Home Credit Vietnam par deux.
Ces innovations ont mis en évidence la nécessité d’humaniser davantage les interactions des assistants virtuels afin d’améliorer l’expérience numérique. L’accent a donc été mis sur la qualité des voix générées par l’IA.
Les voix de synthèse sont conçues en même temps les asssistants vituels, avec des tonalités, accents, et émtions divers et variés. Le type de voix déployé dépend de l’application. Par exemple, les assistants virtuels pour les demandes générales utilisent des tons plus chalereux et informatifs. Les voix d’IA pour la télévente en revanche nécessitent plus de flexibilité et d’émotions pour mieux persuader les clients.
Améliorer les modèles de synthèse vocale pour améliorer la qualité des conversations
Conscient de la demande croissante d’assistants virtuels à consonance plus humaine et plus sentimentale, FPT Smart Cloud vise à développer des modèles de synthèse vocale capables de produire de nouvelles voix sur la base de quelques minutes d’échantillons audio. Les voix générées doivent être de haute qualité, indiscernables de la voix humaine et communiquer en plusieurs langues, même si les données d’entraînement sont en vietnamien
Étant donné les nuances et les sous-entendus émotionnels du langage humain, le modèle de synthèse vocale nécessite souvent une grande quantité de données d’entraînement et un long temps de traitement afin d’optimiser la précision et l’expansion.
Une formation typique nécessite trois serveurs avec une capacité de traitement de 100 heures de données vocales par jour pour une durée de 20 jours. Une mise à niveau vers le GPU Tensor Core NVIDIA H100 devrait permettre de gérer des modèles plus complexes et de rendre le temps de traitement trois fois plus court, en d’autres termes le faire passer à sept jours, avec 2 000 heures de données audio.
Avec le H100, l’ensemble du processus ne nécessite qu’un seul serveur dédié. Le modèle de synthèse vocale est prêt en cinq jours, ce qui représente un gain de 1,5 million d’euros par rapport à l’année précédente. Avec le H100, l’ensemble du processus ne nécessite qu’un seul serveur dédié. Le modèle de synthèse vocale est prêt en cinq jours, ce qui le rend quatre fois plus efficace par rapport au NVIDIA A100, qui traitait environ 400 heures d’échantillons vocaux par jour. Le modèle de sortie a été multiplié par 100 en termes de dimension et d’aptitude, générant une voix à consonance humaine capable d’alterner aisément entre 18 langues, dont le vietnamien, l’anglais et l’indonésien.
Par rapport au A100, le H100 constitue une étape supplémentaire dans la modélisation vocale de l’IA, transcendant les barrières linguistiques et facilitant la communication mondiale à une échelle sans précédent. Faisant un bond en avant dans l’autonomisation de l’IA, FPT Smart Cloud utilise également le NVIDIA H100 pour des modèles linguistiques de grande taille afin de générer des réponses plus précises et plus flexibles pour les assistants virtuels.