Amazon verbessert das Kundenerlebnis mit einer KI-gestützten Rechtschreibprüfung in Echtzeit für die Produktsuche.
Amazon
Suche in Echtzeit
NVIDIA TensorRT, NVIDIA Triton Inference Server, T5, Triton Model Analyzer
Amazon.com, eine der meistbesuchten E-Commerce-Websites der Welt, vereinfacht Kunden den Einkauf mit einem KI-Modell, das automatisch falsch geschriebene Wörter in Suchanfragen korrigiert. Amazon misst den Erfolg seiner beschleunigten Suchergebnisse anhand der Latenz – wie schnell die Rechtschreibprüfung einen Tippfehler korrigiert – und anhand des Durchsatzes – der Anzahl erfolgreicher Sitzungen.
Um die gewünschten Ergebnisse zu erzielen, verwendet Amazon das Modell der natürlichen Sprachverarbeitung (NLP) des Text-zu-Text-Transfertransformators (T5) zur Rechtschreibkorrektur. Zur Beschleunigung der Textkorrektur nutzt das Unternehmen die KI-Inferenzsoftware von NVIDIA, einschließlich NVIDIA Triton™ Inference Server und NVIDIA® TensorRT™, ein SDK für hochleistungsfähige Deep-Learning-Inferenz.
Ergebnisse
Amazon hat das T5 NLP-Modell für die automatische Rechtschreibkorrektur, das von Triton Inference Server und TensorRT beschleunigt wird, erfolgreich eingesetzt. Die NVIDIA-Lösungen lieferten jeweils unter 50 ms Inferenzlatenz und den 5-fachen Durchsatz für das T5-Modell, wobei NVIDIA-GPUs auf Amazon Web Services (AWS) verwendet wurden. Der Triton Model Analyzer reduzierte auch die Zeit, die für die Ermittlung der optimalen Inferenzkonfiguration benötigt wurde, von Wochen auf Stunden. Mit KI können Online-Käufer die Produkte, nach denen sie suchen, schneller und einfacher finden, was die allgemeine Kundenzufriedenheit bei Amazon steigert.
Amazon.com, Inc. ist ein amerikanisches multinationales Technologieunternehmen, das sich auf E-Commerce konzentriert.
„Das Wichtigste ist das Kundenerlebnis, und die Suchleiste ist der Einstiegspunkt für unsere Kunden auf der ganzen Welt. Mit Model Analyzer können wir Dinge, für die wir früher zwei oder drei Wochen brauchten, in weniger als einem Tag erledigen. Wir haben gezeigt, dass generative Modelle am besten auf NVIDIA-GPUs funktionieren, das war klar. Wenn ich Millisekunden-Latenz bei größeren Modellen liefern kann, kann ich mehr Kunden glücklich machen. NVIDIA konzentriert sich auf das Richtige: Optimierung für Leistung, und sie sind hervorragende und ansprechbare Partner, die schnell auf Anforderungen reagieren.“
Leitender Entwickler für maschinelles Lernen
Amazon