Amazon migliora l'esperienza cliente con il controllo ortografico in tempo reale basato sull'IA per la ricerca dei prodotti.
Amazon
Ricerca in tempo reale
NVIDIA TensorRT, NVIDIA Triton Inference Server, T5, Triton Model Analyzer
Amazon.com, uno dei siti di e-commerce più visitati al mondo, consente ai clienti di acquistare con facilità utilizzando un modello di intelligenza artificiale che corregge automaticamente le parole errate nelle query di ricerca. Amazon misura il successo dei risultati di ricerca accelerati in base alla latenza, ovvero la velocità con cui il correttore ortografico corregge un errore di battitura, e il throughput, ovvero il numero di sessioni riuscite.
Per ottenere i risultati desiderati, Amazon utilizza il modello di elaborazione del linguaggio naturale (NLP) Text-To-Text Transfer Transformer (T5) per la correzione ortografica. Per accelerare la correzione del testo, sfrutta il software di inferenza NVIDIA AI, tra cui NVIDIA Triton™ Inference Server e NVIDIA® TensorRT™, un SDK per l'inferenza di deep learning ad alte prestazioni.
I risultati di
Amazon ha implementato con successo il modello T5 di NLP per la correzione ortografica automatica, accelerata da Triton Inference Server e TensorRT. Le soluzioni NVIDIA hanno fornito rispettivamente meno di 50 ms di latenza di inferenza e 5 volte il throughput per il modello T5, utilizzando le GPU NVIDIA su Amazon Web Services (AWS). Il Triton Model Analyzer ha inoltre ridotto il tempo necessario per trovare la configurazione ottimale dell'inferenza da settimane a ore. Con l’IA, gli acquirenti online possono ora trovare i prodotti che stanno cercando più rapidamente e facilmente, aumentando la soddisfazione complessiva dei clienti di Amazon.
Amazon.com, Inc. è una multinazionale americana incentrata sul commercio elettronico.
"Riguarda l’esperienza cliente e la barra di ricerca è il punto di ingresso per i nostri clienti a livello mondiale. Con Model Analyzer, quello che si faceva in due o tre settimane, ora lo possiamo fare in meno di un giorno. Abbiamo dimostrato che i modelli generativi funzionano meglio sulle GPU NVIDIA, questo punto è stato chiaro. Se riesco a portare latenza di millisecondi a modelli più grandi, posso soddisfare più clienti. NVIDIA si concentra sulla cosa giusta: ottimizzare le prestazioni, ed è un partner eccellente, veloce e reattivo sulle funzionalità".
Sviluppatore di apprendimento automatico senior
di Amazon