IA vocale e di traduzione

NVIDIA Riva

Crea compagni di squadra IA vocali, personalizzabili e facili da integrare, capaci di comunicare fluidamente e in tempo reale grazie al multilinguismo, alla trascrizione e alla traduzione basati su IA.

Panoramica

Cos'è NVIDIA Riva?

NVIDIA® Riva è una raccolta di microservizi per voce e traduzione multilingue accelerati da GPU per creare pipeline di IA conversazionale completamente personalizzabili e in tempo reale. Riva include soluzioni leader di settore per il riconoscimento vocale automatico (ASR), la sintesi vocale (TTS) e la traduzione automatica neurale (NMT) ed è distribuibile in tutti i cloud, nei data center, ai margini della rete e su dispositivi integrati. Con Riva, le organizzazioni possono aggiungere interfacce vocali e di traduzione che trasformano i chatbot in assistenti vocali multilingue o avatar coinvolgenti ed espressivi.

NVIDIA Riva Canary ora disponibile

Riva Canary è un set di modelli multilingue e multi-tasking che possono essere implementati come microservizi NVIDIA NIM™. Supportano il riconoscimento vocale automatico e la traduzione dei contenuti vocali in testo, possono aggiungere punteggiatura e maiuscole e supportano la traduzione.

NVIDIA Riva Magpie TTS ora disponibile

Riva Magpie TTS converte testo in audio e include una voce multilingue sia maschile che femminile dal suono naturale. Il modello può essere personalizzato con voci aggiuntive specifiche per il marchio ed è un ottimo complemento per il modello di streaming Automatic Speech Recognition (ASR) multilingue Riva Parakeet per i casi d'uso con agenti vocali.

Vantaggi

Scopri i vantaggi di NVIDIA Riva

Trascrizioni multilingue e generazione di voci espressive

Ottieni trascrizioni e traduzioni multilingue altamente accurate e fornisci voci femminili e maschili professionali, espressive e pronte all'uso con modelli all'avanguardia preaddestrati su migliaia di ore di audio.

Completamente personalizzabile

Personalizza le pipeline ASR per diverse lingue, accenti, domini, vocabolari e contesti per la massima precisione possibile per il tuo caso d'uso e le pipeline TTS per la voce e il tono del brand desiderati.

Implementazioni flessibili

Offri esperienze coerenti a centinaia di migliaia di utenti simultanei con prestazioni di inferenza superiori rispetto alla tecnologia esistente e implementa ovunque: nei data center, sul luogo, nel cloud, nell'edge o nei dispositivi integrati.

IA di livello aziendale

Accelera lo sviluppo e la distribuzione di applicazioni IA multilingue, vocali e di alta qualità con NVIDIA Riva, parte della piattaforma modulare e flessibile NVIDIA AI Enterprise ideata per accelerare lo sviluppo e la distribuzione dell'IA.

NVIDIA Riva NIM è disponibile per il download

I nuovi microservizi ASR, TTS e NMT sono ora disponibili. Sono progettati per fornire un'inferenza IA ottimizzata per l'IA per parlato e traduzione. Questo include i modelli Parakeet che offrono precisione e prestazioni ASR per le impostazioni di registrazione.

Casi d'uso

Casi d'uso Come viene utilizzato Riva

Scopri come i leader del settore guidano l'innovazione con Riva.

Assistenti Domande e risposte

Le aziende distribuiscono assistenti virtuali IA per rispondere automaticamente alle domande di milioni di clienti e dipendenti ininterrottamente. Con i microservizi IA per voce e traduzione Riva, questi assistenti forniscono risposte utili e naturali durante ogni fase della conversazione, nonostante il rumore di fondo, la scarsa qualità del suono e i diversi dialetti e accenti dei parlanti.

Agent Assists

I consumatori si aspettano che gli agenti del call center risolvano i loro problemi in modo rapido ed efficiente. Per soddisfare queste aspettative e offrire la migliore esperienza possibile per clienti e agenti, le aziende di tutti i settori stanno implementando la tecnologia agent-assist basata sull’IA vocale e di traduzione Riva.

Persona digitale

Per migliorare le esperienze del servizio clienti e costruire solide relazioni con i propri clienti, le aziende stanno creando persone digitali con voci identificabili con il brand. Con Riva, possono creare una voce unica, di alta qualità e personalizzata con soli tre secondi di dati vocali.

Trascrizione

Con centinaia di milioni di riunioni online che si svolgono ogni giorno, la videoconferenza è diventata uno strumento indispensabile per le aziende. Grazie alla trascrizione in tempo reale di Riva, le applicazioni di videoconferenza possono raggiungere il massimo della precisione nel sottotitolaggio e nella sintesi delle riunioni, accogliendo utenti con accenti di tutto il mondo e vocabolari specifici per ciascun dominio.

Traduzione IA

Nell'economia globale, le aziende operano in molti paesi e servono clienti con background linguistici e culturali diversi. Questa varietà linguistica pone il problema di trovare parlanti madrelingua o formare i dipendenti in più lingue. La traduzione di Riva rende possibile una comunicazione accurata ed efficace, facilitando interazioni globali fluide.

Robot di servizio

I robot di servizio sono sempre più presenti negli ospedali, negli aeroporti e nei negozi al dettaglio di tutto il mondo. Aiutano i lavoratori in prima linea gestendo compiti ripetitivi quotidiani nei ristoranti e negli stabilimenti produttivi, assistono i clienti nel localizzare gli articoli nei negozi e supportano medici e infermieri nella cura dei pazienti. Con Riva, è facile aggiungere l'IA vocale e di traduzione ai robot di servizio.

Opzioni per iniziare

Come iniziare con NVIDIA Riva

Utilizza gli strumenti e le tecnologie giuste per creare e distribuire applicazioni di IA vocale e di traduzione completamente personalizzabili e multilingue.

Prova

Scopri Riva attraverso un portale basato sull'interfaccia utente per esplorare e creare prototipi con endpoint gestiti da NVIDIA, disponibile gratuitamente tramite il catalogo API di NVIDIA.

Distribuisci

Ottieni una licenza gratuita per provare NVIDIA AI Enterprise per 90 giorni utilizzando la tua infrastruttura esistente.

Prova

Accedi all'infrastruttura NVIDIA e ai laboratori pratici guidati che includono istruzioni ed esempi dettagliati, disponibili gratuitamente su NVIDIA LaunchPad.

Storie dei clienti

Come i leader del settore guidano l'innovazione con Riva

Telecomunicazioni

IA vocale per l'eccellenza del servizio clienti

Cliente: T-Mobile

Prodotti: NVIDIA Riva, sistemi certificati NVIDIA

Tecnologie: NVIDIA Data Center GPU, NVIDIA NeMo, NVIDIA Riva

Telecomunicazioni

IA vocale di prim'ordine per la migliore esperienza di videoconferenza

Cliente: RingCentral

Prodotti: NVIDIA DGX, NVIDIA Riva

Tecnologie: NVIDIA Data Center GPU, NVIDIA NeMo, NVIDIA Riva, NVIDIA Triton Inference Server

Academia / Higher Education

Automatizzazione del riconoscimento della lingua araba parlata in tempo reale

Cliente: Tarteel.ai

Prodotti: : NVIDIA Riva, sistemi certificati NVIDIA

Tecnologie: NVIDIA NeMo, NVIDIA Riva, NVIDIA Data Center GPU

Utilizzatori

Principali clienti in tutti i settori

Risorse

Le ultime novità su NVIDIA Riva

Prova Riva su NVIDIA LaunchPad

Hai un progetto di IA vocale esistente? Candidati per sperimentare e prototipare le tue soluzioni basate sulla conversazione con competenze vocali nello stack software Riva ad alte prestazioni e pronto per l'implementazione.

Inizia con ASR personalizzato ad alta precisione

Impara a creare, addestrare, perfezionare e distribuire un servizio ASR accelerato da GPU con Riva che include funzionalità personalizzate

Parla ai tuoi dati nella tua lingua madre

Unisciti agli esperti di IA per imparare a creare, perfezionare e distribuire IA vocale e di traduzione multilingue pronta per la produzione in applicazioni basate su LLM, consentendo ai tuoi chatbot di parlare ai tuoi clienti nelle loro lingue native.

Utilizzo dell'IA vocale per trascrizione, traduzione e voce

Crea applicazioni di IA vocale di prim'odine, completamente personalizzabili, come assistenti virtuali intelligenti, servizi di trascrizione audio e avatar digitali.

Reinventa le esperienze di call center con NVIDIA Riva

Generando una trascrizione accurata delle interazioni con i clienti in tempo reale, Riva consente all’IA di fornire informazioni contestuali, misurare il sentimento e suggerire l’azione migliore a un agente, garantendo un’esperienza personalizzata eccezionale.

Cane robot porta gli snack in tutta la città

Guarda come Spot utilizza l'IA vocale per ordinare snack in tutta la città senza connessione internet. Invece di caricare i comandi vocali nel cloud ed elaborarli sul server, Spot elabora tutto localmente per garantire prestazioni e consegne efficienti e senza interruzioni.

Prossimi passi

Vuoi iniziare?

Utilizza gli strumenti e le tecnologie giuste per creare e distribuire applicazioni di IA completamente personalizzabili, multilingue, vocali e di traduzione.

Per gli sviluppatori

Esplora tutto ciò che ti serve per iniziare a sviluppare con NVIDIA Riva, tra cui la documentazione più recente, i tutorial, i blog tecnici e altro ancora.

Contattaci

Parla con uno specialista del prodotto NVIDIA per sapere come passare dal progetto pilota alla produzione con la sicurezza, la stabilità delle API e il supporto di NVIDIA AI Enterprise.

AI2Labs

Nel 2021, AI2Labs è partita da Yoozoo Games come startup tecnologica locale a Singapore. AI2Labs innova, sperimenta e sviluppa prodotti e applicazioni IA, consentendo processi efficienti e migliorando la sostenibilità e i risultati aziendali.

AI2Labs ha integrato Riva nell'API di riconoscimento vocale Speakr, l'IA vocale specifica per dominio, per adattarsi alle complessità delle specificità vocali e aziendali asiatiche e ottenere traduzioni in inglese di Singapore accurate e all'avanguardia.

 

Avaya

Avaya è specializzata in soluzioni di comunicazione cloud e collaborazione workstream, fornisce comunicazioni unificate, centro contatti, piattaforma di comunicazione as a service (CPaaS) e servizi con la piattaforma OneCloud.

Avaya integra il motore speech-to-text di NVIDIA Riva per didascalie in tempo reale su larga scala. Riva consente una migliore qualità di trascrizione, un tasso di errore per parola più basso e una distribuzione conveniente.

 

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS, una filiale di Singtel Group, è una società leader di servizi tecnologici in Asia Pacifico. Collabora con governi e imprese per far crescere le comunità attraverso la tecnologia. Combinando l'esperienza e le competenze del suo team di 12.000 persone, in 61 specializzazioni, NCS offre servizi tecnologici differenziati e completi ai clienti con le funzionalità NEXT in ambito digitale, dati, cloud e piattaforme, nonché soluzioni essenziali per applicazioni, infrastrutture, ingegneria e sicurezza informatica. NCS crede anche nella creazione di un solido ecosistema di partner con i principali player tecnologici, gli istituti di ricerca e le start-up per supportare l'innovazione aperta e la creazione condivisa. 

NCS usa NVIDIA Riva TTS in Breeze, l'app di assistenza al conducente, per la navigazione con guida vocale, gli aggiornamenti sul traffico e sulle condizioni stradali in tempo reale, le tariffe dei parcheggi in tempo reale, i prezzi delle tratte autostradali e gli orari di funzionamento dei caselli elettronici, per aiutare i conducenti di Singapore a sperimentare percorsi di guida fluidi.

Scopri di più.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral, un fornitore leader di soluzioni globali di comunicazione, collaborazione e contact center su cloud aziendale, serve milioni di utenti. La piattaforma RingCentral consente la collaborazione da qualsiasi luogo e dispositivo, migliorando l'efficienza aziendale e la soddisfazione dei clienti.

RingCentral usa NVIDIA Riva per la trascrizione delle videoconferenze per 200.000 utenti simultanei sulla sua piattaforma.

Scopri di più.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap è un'azienda di fotocamere e social media che consente la creazione di messaggi multimediali con filtri ed effetti. Per creare esperienze più interattive, gli utenti di Snapchat usano Lenses, una funzionalità che aggiunge effetti in tempo reale agli scatti, oltre 6 miliardi di volte al giorno. 

Il servizio di IA vocale ottimizzato per rumore e linguaggio di NVIDIA Riva è integrato in Snap AR Lens Studio e consente a creativi, artisti e sviluppatori, di creare esperienze accattivanti in AR (realtà aumentata).

T-Mobile

T-Mobile, un importante operatore telefonico, offre una rete LTE 4G avanzata e una rete 5G trasformativa per la migliore esperienza clienti. Per supportare gli operatori del contact center, T-Mobile implementa Expert Assist. Questo software basato su IA usa NVIDIA Riva per trascrivere in tempo reale le conversazioni dei clienti che alimentano i generatori di consigli e assistono migliaia di operatori.

Con Riva, T-Mobile calibra i modelli di riconoscimento vocale automatico su set di dati personalizzati e interpreta accuratamente il linguaggio dei clienti in ambienti rumorosi.

Scopri di più.

www.t-mobile.com

Customer Story

GTC Session

Building Speech AI Applications

Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.

An Introduction to NVIDIA Riva

Learn about Riva’s architecture, key features, and components for building speech and translation AI services.

NVIDIA Parlays Win in Voice Challenge

Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.