IA vocale
Sviluppa e distribuisci applicazioni di IA vocale e traduzione multilingue intelligenti, completamente personalizzabili, per modelli linguistici di grandi dimensioni e applicazioni basate sulla generazione aumentata di recupero.
Video | Sintesi della soluzione | Per sviluppatori
NVIDIA® Riva è un set di microservizi di traduzione vocale e multilingue accelerati da GPU per creare pipeline di IA conversazionale completamente personalizzabili e in tempo reale. Riva include il riconoscimento vocale automatico (ASR), la sintesi vocale (TTS) e la traduzione automatica neurale (NMT) ed è distribuibile in tutti i cloud, nei data center, sui sistemi periferici o integrati. Con Riva, le aziende possono aggiungere funzionalità vocali e di traduzione con modelli linguistici di grandi dimensioni (LLM) e RAG per trasformare i chatbot in potenti assistenti e avatar multilingue.
Fornisci chatbot IA con trascrizione, traduzione e voce multilingue all'avanguardia.
Seleziona la lingua e scopri come Riva ASR offre trascrizioni altamente accurate in tempo reale fornendo un input tramite il tuo microfono o caricando un file .wav dal tuo dispositivo.
Nota: la durata di ciascun campione è limitata a 30 secondi.
Seleziona una voce e digita una frase di prova per ascoltare la straordinaria voce in inglese femminile o maschile di Riva.
Nota: il testo da inserire è limitato a 400 caratteri.
0 / 400
L'uso delle funzionalità di Riva è soggetto ai Termini di utilizzo di NVIDIA Riva. I dati degli utenti saranno utilizzati per migliorare prodotti e servizi NVIDIA.
Ottieni un'elevata precisione di trascrizione per traduzioni bilingue e multilingue e utilizza voci femminili e maschili professionali pronte all'uso con modelli all'avanguardia pre-addestrati con migliaia di ore di audio su supercomputer NVIDIA.
Personalizza i flussi ASR per diverse lingue, accenti, domini, vocaboli e contesto per ottenere la migliore precisione possibile in base al tuo caso d'uso e nei flussi TTS per ottenere la voce e l'intonazione che preferisci.
Offri esperienze coerenti ai tuoi clienti per centinaia di migliaia di flussi di input con prestazioni di inferenza più elevate rispetto alla tecnologia esistente e nella distribuzione di tua scelta, nel data center, in locale, nel cloud, sull'edge o in dispositivi integrati.
Usa gli strumenti giusti per creare e distribuire applicazioni di IA vocale e di traduzione multilingue completamente personalizzabili.
Per gli utenti che desiderano provare Riva, il catalogo API offre un'interfaccia utente e l'accesso gratuito agli endpoint API gestiti da NVIDIA, un ottimo punto di partenza.
Per le aziende che desiderano provare Riva prima di acquistare NVIDIA AI Enterprise per la produzione, sono disponibili due opzioni per iniziare a costo zero:
Senza infrastruttura: Alle aziende non dotate di un'infrastruttura esistente, NVIDIA offre laboratori pratici tramite NVIDIA LaunchPad.
Con infrastruttura: Alle aziende che dispongono di un'infrastruttura esistente, NVIDIA offre una licenza di valutazione gratuita per provare NVIDIA AI Enterprise per 90 giorni.
T-Mobile uses NVIDIA Riva ASR in their call center to accurately transcribe customer conversations and provide real-time recommendations to help agents quickly resolve customer queries.
T-Mobile usa NVIDIA Riva ASR nel call center per trascrivere con precisione le conversazioni con i clienti e fornire consigli in tempo reale agli operatori per accelerare le risoluzioni.
NCS ha usato NVIDIA Riva TTS per personalizzare una voce di Singapore con pronuncia, tono e accento locale per decine di migliaia di utenti mensili attivi e simultanei di Breeze.
Tarteel usa NVIDIA Riva e NVIDIA NeMo per fornire feedback in tempo reale sulla recita del Corano su larga scala, consentendo a religiosi, docenti, autori di contenuti e ricercatori di interagire con il Corano.
Con NVIDIA Riva, RingCentral ha ottenuto una precisione di trascrizione in tempo reale senza pari per le riunioni video, a vantaggio milioni di utenti con accenti differenti e con linguaggi settoriali specifici.
Data Monsters ha aggiunto una pipeline vocale per l'app Plabook che usa NVIDIA Riva per aiutare gli studenti a leggere, valutare l'accuratezza a livello di fonema e fornire feedback individualizzato.
Artisight ha sviluppato soluzioni ospedaliere intelligenti che automatizzano gli accessi e notificano i pazienti in attesa tramite chioschi vocali. Queste soluzioni integrano un'applicazione di IA vocale personalizzata e offrono prestazioni in tempo reale utilizzando le funzionalità di sintesi vocale di NVIDIA Riva accelerate da GPU.
Scopri come AT&T, Kore.ai, Deloitte e Sutherland traggono vantaggio dall'uso di ASR, traduzione e TTS multilingue per offrire un'assistenza self-service più rapida e accurata ai clienti, migliorare la produttività degli operatori in tempo reale e l'efficienza operativa delle imprese.
Impara dagli esperti di scienza dei dati e tecnologia IA che discutono delle soluzioni all'avanguardia IA per voce e traduzione NVIDIA Riva che stanno rivoluzionando il settore, dagli assistenti virtuali e avatar digitali per migliorare la portata, la gestione dei sinistri, gli ordini e il provisioning, fino ai sistemi di rilevamento delle frodi per l'attenuazione del rischio.
Guarda questo webinar on-demand per scoprire come creare assistenti virtuali intelligenti sotto forma di agenti digitali con funzionalità vocali. Ti mostreremo come distribuire soluzioni flessibili e completamente personalizzabili per migliorare la soddisfazione dei clienti.
Scopri come Motorola e Softserve offrono traduzioni e trascrizioni più accurate possibili e voci coinvolgenti alla velocità e con la scalabilità che richiedono le esperienze di IA conversazionale.
Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.
Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.
Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.
Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.
Join Motorola and Softserve to learn how to deliver the most accurate transcription, translation, and engaging voices at the speed and scale conversational AI experiences demand.
Scopri le funzionalità principali di Riva che ti aiutano a creare servizi di IA vocale e traduzione.
Ottieni tutto il necessario per iniziare a costruire i tuoi flussi di IA vocale e traduzione vocale con NVIDIA Riva, inclusi tutorial, Jupyter Notebook e documentazione.
Leggi una procedura dettagliata tecnica su come creare e distribuire applicazioni di IA vocale e traduzione con Riva.
Scopri come iniziare a integrare e distribuire modelli Riva ASR e TTS in produzione con inferenza ad alte prestazioni e il minimo sforzo.
Trova la licenza giusta per creare e distribuire applicazioni IA vocali e di traduzione multilingue completamente personalizzabili o esplora altre risorse per sviluppatori.
Parla con un esperto di prodotti NVIDIA per passare dal progetto pilota alla produzione con sicurezza, stabilità API e supporto con NVIDIA AI Enterprise.
Iscriviti per ricevere le ultime notizie, gli aggiornamenti e altro da NVIDIA.
Nel 2021, AI2Labs è partita da Yoozoo Games come startup tecnologica locale a Singapore. AI2Labs innova, sperimenta e sviluppa prodotti e applicazioni IA, consentendo processi efficienti e migliorando la sostenibilità e i risultati aziendali.
AI2Labs ha integrato Riva nell'API di riconoscimento vocale Speakr, l'IA vocale specifica per dominio, per adattarsi alle complessità delle specificità vocali e aziendali asiatiche e ottenere traduzioni in inglese di Singapore accurate e all'avanguardia.
Avaya è specializzata in soluzioni di comunicazione cloud e collaborazione workstream, fornisce comunicazioni unificate, centro contatti, piattaforma di comunicazione as a service (CPaaS) e servizi con la piattaforma OneCloud.
Avaya integra il motore speech-to-text di NVIDIA Riva per didascalie in tempo reale su larga scala. Riva consente una migliore qualità di trascrizione, un tasso di errore per parola più basso e una distribuzione conveniente.
For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.
NCS, una filiale di Singtel Group, è una società leader di servizi tecnologici in Asia Pacifico. Collabora con governi e imprese per far crescere le comunità attraverso la tecnologia. Combinando l'esperienza e le competenze del suo team di 12.000 persone, in 61 specializzazioni, NCS offre servizi tecnologici differenziati e completi ai clienti con le funzionalità NEXT in ambito digitale, dati, cloud e piattaforme, nonché soluzioni essenziali per applicazioni, infrastrutture, ingegneria e sicurezza informatica. NCS crede anche nella creazione di un solido ecosistema di partner con i principali player tecnologici, gli istituti di ricerca e le start-up per supportare l'innovazione aperta e la creazione condivisa.
NCS usa NVIDIA Riva TTS in Breeze, l'app di assistenza al conducente, per la navigazione con guida vocale, gli aggiornamenti sul traffico e sulle condizioni stradali in tempo reale, le tariffe dei parcheggi in tempo reale, i prezzi delle tratte autostradali e gli orari di funzionamento dei caselli elettronici, per aiutare i conducenti di Singapore a sperimentare percorsi di guida fluidi.
breeze.com.sg/
www.ncs.co
Customer Story
RingCentral, un fornitore leader di soluzioni globali di comunicazione, collaborazione e contact center su cloud aziendale, serve milioni di utenti. La piattaforma RingCentral consente la collaborazione da qualsiasi luogo e dispositivo, migliorando l'efficienza aziendale e la soddisfazione dei clienti.
RingCentral usa NVIDIA Riva per la trascrizione delle videoconferenze per 200.000 utenti simultanei sulla sua piattaforma.
www.ringcentral.com
GTC Session
Snap è un'azienda di fotocamere e social media che consente la creazione di messaggi multimediali con filtri ed effetti. Per creare esperienze più interattive, gli utenti di Snapchat usano Lenses, una funzionalità che aggiunge effetti in tempo reale agli scatti, oltre 6 miliardi di volte al giorno.
Il servizio di IA vocale ottimizzato per rumore e linguaggio di NVIDIA Riva è integrato in Snap AR Lens Studio e consente a creativi, artisti e sviluppatori, di creare esperienze accattivanti in AR (realtà aumentata).
T-Mobile, un importante operatore telefonico, offre una rete LTE 4G avanzata e una rete 5G trasformativa per la migliore esperienza clienti. Per supportare gli operatori del contact center, T-Mobile implementa Expert Assist. Questo software basato su IA usa NVIDIA Riva per trascrivere in tempo reale le conversazioni dei clienti che alimentano i generatori di consigli e assistono migliaia di operatori.
Con Riva, T-Mobile calibra i modelli di riconoscimento vocale automatico su set di dati personalizzati e interpreta accuratamente il linguaggio dei clienti in ambienti rumorosi.
www.t-mobile.com
Risponderemo alle tue domande e ti aiuteremo con le esigenze della tua organizzazione.
Informativa sulla privacy NVIDIA