Transformation intelligenter Callcenter-Betriebsabläufe in der Konsumentenfinanzierung
Die Fähigkeiten von KI haben eine Vielzahl von Bank- und Finanzinstituten in Vietnam angesprochen, insbesondere Home Credit Vietnam. Als eines der führenden digitalen Finanzunternehmen in Vietnam hat Home Credit das Kundenerlebnis schon immer in den Vordergrund gestellt. In dem Bewusstsein, wie wichtig Prozessautomatisierung und betriebliche Effizienz sind, hat Home Credit in Zusammenarbeit mit FPT Smart Cloud im Jahr 2019, als KI in Vietnam noch ein relativ neues Konzept war, die
FPT AI Engage-Lösung bereitstellt und damit den strategischen Weitblick des Unternehmens demonstriert.
Nach dem ersten Betriebsjahr im Jahr 2020 unterstützte der FPT.AI Virtual Agent für Callcenter Home Credit Vietnam bei mehr als 5.000.000 Anrufen pro Monat. Diese Zahlen wurden mithilfe von NVIDIA übertroffen und auf 12.000.000 Anrufe während der Spitzenzeiten erhöht, was zu einer Einsparung von 50 Prozent bei den Betriebskosten und einer Erfolgsrate von 98 Prozent bei den Anrufen führte. Darüber hinaus hatte der „virtuelle Agent“ von Home Credit Vietnam eine durchschnittliche Kundenzufriedenheitsbewertung von 4,5/5.
Die Bereitstellung wird mit NVIDIA® TensorRT™ optimiert und in NVIDIA Triton™ Inference Server mit dynamischem Batching bereitgestellt, wodurch bis zu 20 Prozent der High-Performance-Computing-Ressourcen bei gleicher Qualität der Modellausgabe eingespart werden.
Bisher hat Home Credit Vietnam mehr als 100 Anwendungsfälle in Anwendungen umgesetzt, darunter Informationsabfragen, Self-Service-Funktionen zum Sperren oder Aktivieren von Karten, automatisierte Kundenumfragen und Forderungseinziehung. Dadurch werden diese einfachen Aufgaben auf KI ausgelagert und menschliche Agenten haben mehr Zeit für die Bewältigung kritischer Kundenprobleme.
Eine neuartige Anwendung virtueller Assistenten, die dazu beitragen kann, ein „Kostenzentrum“ wie eine Kundendienstabteilung in ein „Profitcenter“ umzuwandeln, ist ein Verfahren, das als Service-to-Sales bezeichnet wird. FPT AI Engage hat das Service-to-Sales-Volumen von Home Credit Vietnam verdoppelt.
Diese Innovationen haben gezeigt, dass virtuelle Assistenten eine menschliche Interaktion mit Kunden erfordern, um das digitale Erlebnis zu verbessern. Dadurch richtet sich der Fokus nun auf die Qualität von KI-generierten Stimmen.
Synthetische Stimmen werden zusammen mit virtuellen Assistenten entwickelt, wobei eine Vielzahl von Tönen, Akzenten und Stimmungen verfügbar sind. Die Art der verwendeten Stimme hängt von der Anwendung ab. Virtuelle Assistenten für allgemeine Anfragen verwenden beispielsweise freundlichere und informativere Töne. KI-Stimmen für Teleshopping zeigen mehr Flexibilität und Emotionen, um potenzielle Kunden besser zu überzeugen.
Verbesserung der Sprachsynthesemodelle zur Verbesserung der Gesprächsqualität
Aufgrund der wachsenden Nachfrage nach menschlich klingenden, gefühlvollen virtuellen Assistenten hat sich FPT Smart Cloud zum Ziel gesetzt, Sprachsynthesemodelle zu entwickeln, die neue Stimmen auf der Grundlage von wenige Minuten dauernden Audioproben zu erzeugen. Die generierten Stimmen müssen von hoher Qualität sein und dürfen sich nicht von der menschlichen Stimme unterscheiden. Sie müssen in mehreren Sprachen kommunizieren, selbst wenn die Trainingseingaben in vietnamesischer Sprache erfolgen.
Wegen der Nunancen und emotionalen Untertöne der menschlichen Sprache erfordert das Sprachsynthesemodell oft eine große Menge an Trainingsdaten und eine lange Verarbeitungszeit, um die Genauigkeit und Ausdruckskraft zu optimieren.
Das Modelltraining wurde zuvor auf der NVIDIA A100 Tensor Core GPU ausgeführt. Ein typisches Training erfordert drei Server mit einer Verarbeitungskapazität von 100 Stunden Sprachdaten pro Tag über eine Dauer von 20 Tagen. Es wird erwartet, dass ein Upgrade auf die NVIDIA H100 Tensor Core GPU kompliziertere Modellanforderungen bewältigen und die Verarbeitungszeit mit 2.000 Stunden Audiodaten um mindestens das Dreifache oder 7 Tage verkürzt.
Mit H100 erfordert der gesamte Prozess nur einen dedizierten Server. Das Sprachsynthese-Modell ist in fünf Tagen einsatzbereit, was eine Vierfache Effizienzsteigerung im Vergleich zur NVIDIA A100 bedeutet, da es täglich etwa 400 Stunden Sprachproben verarbeitet. Das Ausgabemodell erhöhte die Dimension und Fähigkeit um das Hundertfache und generierte eine menschlich klingende Stimme, die nahtlos in 18 Sprachen übergehen kann, einschließlich Vietnamesisch, Englisch und Indonesisch.
Im Vergleich zur A100 ist die H100 in der KI-Sprachmodellierung einen Schritt weiter, sodass Sprachbarrieren überwunden werden und die globale Kommunikation in beispielloser Größenordnung erleichtert wird. FPT Smart Cloud macht einen Schritt nach vorne und nutzt die NVIDIA H100 auch für große Sprachmodelle, um genauere und flexiblere Antworten für virtuelle Assistenten zu generieren.