Sprach-KI
Erstellen und Bereitstellen einer vollständig anpassbaren mehrsprachigen Sprach-und Übersetzungs-KI für Ihr großes Sprachmodell und Retrieval-Augmented Generation(RAG)-basierte Anwendungen.
Video | Lösungsübersicht | Für Entwickler
NVIDIA® Riva ist eine Reihe von GPU-beschleunigten, mehrsprachigen Sprach- und Übersetzungs-Microservices, mit denen Sie vollständig anpassbare Echtzeit-Gesprächs-KI-Pipelines erstellen können. Riva umfasst die automatische Spracherkennung (Automatic Speech Recognition, ASR), Text-zu-Sprache (Text-to-Speech, TTS) und die neuronale maschinelle Übersetzung (Neural Machine Translation, NMT) und kann in allen Clouds, in Rechenzentren, in der Peripherie oder in eingebetteten Geräten eingesetzt werden. Mit Riva können Unternehmen Sprach- und Übersetzungsfunktionen mit großen Sprachmodellen (Large Language Models, LLMs) und Retrieval-Augmented Generation (RAG) hinzufügen, um Chatbots in leistungsstarke mehrsprachige Assistenten und Avatare zu verwandeln.
Bereitstellen von KI-Chatbots mit modernster mehrsprachiger Transkription, Übersetzung und Spracheingabe.
Wählen Sie die Sprache aus und sehen Sie sich an, wie Riva ASR eine hochpräzise Transkription in Echtzeit ermöglicht, indem Sie eine Eingabe über Ihr Mikrofon vornehmen oder eine .wav-Datei von Ihrem Gerät hochladen.
Hinweis: Die Dauer jedes Samples ist auf 30 Sekunden begrenzt.
Wählen Sie eine Stimme aus und geben Sie einen Testsatz ein, um Rivas vordefinierte englische Frauen- oder Männerstimme zu hören.
Hinweis: Der Eingabetext ist auf 400 Zeichen begrenzt.
0 / 400
Die Verwendung der Riva-Fähigkeiten unterliegt den Nutzungsbedingungen für NVIDIA Riva. Ihre Daten werden zur Verbesserung der Produkte und Dienste von NVIDIA verwendet.
Erzielen Sie eine hohe Genauigkeit bei der Transkription zwei- und mehrsprachiger Übersetzungen und stellen Sie vordefinierte, ausdrucksstarke professionelle Frauen- und Männerstimmen mit hochmodernen Modellen bereit, die auf NVIDIA-Supercomputern anhand von Tausenden von Stunden Audiomaterial vortrainiert wurden.
Passen Sie ASR-Pipelines für verschiedene Sprachen, Akzente und Domänen, Vokabulare und Kontexte an, um die bestmögliche Genauigkeit für Ihren Anwendungsfall zu erzielen, und passen Sie TTS-Pipelines für die gewünschte Stimme und Intonation an.
Bieten Sie Ihren Kunden konsistente Erfahrungen für Hunderttausende von Eingangsdatenströmen mit höherer Inferenzleistung im Vergleich zu bestehender Technologie und bei der Bereitstellung Ihrer Wahl – in Rechenzentren, lokal, in der Cloud, am Edge oder in eingebetteten Geräten.
Erstellen und Bereitstellen von vollständig anpassbaren, mehrsprachigen Sprach- und Übersetzungs-KI-Anwendungen für Sprache und Übersetzung mit den richtigen Tools.
Für Einzelpersonen, die Riva kennenlernen möchten, bietet der API-Katalog eine UI-basierte Spielwiese und kostenlosen Zugang zu den von NVIDIA verwalteten API-Endpunkten, die einen idealen Einstiegspunkt bilden.
Für Unternehmen, die Riva testen möchten, bevor sie NVIDIA AI Enterprise für die Produktion kaufen, gibt es zwei kostenlose Einstiegsoptionen:
Ohne Infrastruktur: Für diejenigen, die über keine vorhandene Infrastruktur verfügen, bietet NVIDIA über das NVIDIA LaunchPad kostenlose Praxisübungen an.
Mit Infrastruktur: Für diejenigen mit vorhandener Infrastruktur bietet NVIDIA eine kostenlose Testlizenz an, um NVIDIA AI Enterprise 90 Tage lang zu testen.
T-Mobile uses NVIDIA Riva ASR in their call center to accurately transcribe customer conversations and provide real-time recommendations to help agents quickly resolve customer queries.
T-Mobile verwendet NVIDIA Riva ASR in seinem Call-Center, um Kundengespräche präzise zu transkribieren und Mitarbeitern in Echtzeit Empfehlungen für die schnelle Lösung von Kundenanfragen bereitzustellen.
NCS nutzt NVIDIA Riva TTS, um eine singapurische Stimme mit regionaler Aussprache, Tonlage und regionalem Akzent für Tausende von monatlich aktiven Benutzern von Breeze – einer Begleit-App für Fahrer – anzupassen.
Tarteel verwendet NVIDIA Riva und NVIDIA NeMo, um in großem Maßstab und in Echtzeit Feedback zu Koranrezitationen zu geben und ermöglicht es Muslimen, Instruktoren, Erstellern von Inhalten und Forschern, sich mit dem Koran auseinanderzusetzen.
Mit NVIDIA Riva hat RingCentral eine beispiellose Echtzeit-Transkriptionsgenauigkeit für Videokonferenzen erzielt, die Millionen von Nutzern mit verschiedensten Akzenten und spezifischen Fachsprachen weltweit versorgt.
Data Monsters hat mit NVIDIA Riva eine Sprachpipeline für seine Plabook-App hinzugefügt, um Schülern beim Lesen zu helfen, die Genauigkeit auf Phonem-Ebene zu bewerten und individuelles Feedback zu geben.
Artisight hat intelligente Lösungen für Krankenhäuser entwickelt, die die Aufnahme automatisieren und wartende Patienten über sprachgesteuerte Kioske benachrichtigen. Diese Lösungen integrieren eine maßgeschneiderte Sprach-KI-Anwendung und liefern Echtzeitleistung mit GPU-beschleunigten Text-zu-Sprache-Fähigkeiten von NVIDIA Riva.
Erfahren Sie, wie AT&T, Kore.ai, Deloitte und Sutherland von der Verwendung von mehrsprachiger ASR, Übersetzung und TTS profitieren, um Kunden einen schnelleren und präziseren Selfservice zu bieten sowie die Produktivität von Live-Agenten und die betriebliche Effizienz von Unternehmen zu steigern.
Erfahren Sie von Experten für Datenwissenschaft und KI-Technologie mehr über die innovativen Sprach- und Übersetzungs-KI-Lösungen von NVIDIA Riva, die die Branche revolutionieren – von virtuellen Assistenten und digitalen Avataren für eine verbesserte Reichweite, Schadensverwaltung, Bestellung und Bereitstellung bis hin zu Betrugserkennungssystemen für die Risikominderung.
In diesem On-Demand-Webinar erfahren Sie, wie Sie intelligente virtuelle Assistenten in Form von sprachgesteuerten digitalen Agenten entwickeln können. Wir zeigen Ihnen, wie Sie flexible, vollständig anpassbare Lösungen zur Steigerung der Kundenzufriedenheit einsetzen können.
Sehen Sie sich an, wie Motorola und SoftServe hochpräzise Transkription, Übersetzung und ansprechende Stimmen in der Geschwindigkeit und dem Umfang liefern, die KI-Erfahrungen erfordern.
Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.
Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.
Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.
Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.
Join Motorola and Softserve to learn how to deliver the most accurate transcription, translation, and engaging voices at the speed and scale conversational AI experiences demand.
Lernen Sie die wichtigsten Funktionen in Riva kennen, die Sie beim Erstellen von Sprach- und Übersetzungs-KI-Diensten unterstützen.
Erhalten Sie alles, was Sie benötigen, um Ihre Sprach- und Übersetzungs-KI-Pipelines mit NVIDIA Riva zu erstellen, einschließlich Tutorials, Jupyter Notebooks und Dokumentation.
Lesen Sie eine technische Anleitung, wie Sie Sprach- und Übersetzungs-KI-Anwendungen mit Riva erstellen und bereitstellen können.
Erfahren Sie, wie Sie mit der Integration und Bereitstellung von Riva ASR- und TTS-Modellen in der Produktion mit High-Performance-Inferenz und minimalem Aufwand beginnen können.
Finden Sie die richtige Lizenz, um vollständig anpassbare, mehrsprachige Sprach- und Übersetzungs-KI-Anwendungen zu erstellen und bereitzustellen, oder entdecken Sie weitere Entwicklungsressourcen.
Sprechen Sie mit einem NVIDIA-Produktspezialisten über den Wechsel von der Pilotphase zur Produktionsumgebung mit der Sicherheit, der API-Stabilität und dem Support von NVIDIA AI Enterprise.
Ich möchte aktuelle Neuigkeiten, Updates und weitere Informationen von NVIDIA erhalten.
AI2Labs wurde 2021 in Singapur von Yoozoo Games als lokales Tech-Start-up gegründet. AI2Labs innoviert, experimentiert und entwickelt KI-Produkte und KI-Anwendungen, die effiziente Prozesse ermöglichen und so die Nachhaltigkeit und Geschäftsergebnisse verbessern.
AI2Labs hat Riva in seine Spracherkennungs-API Speakr integriert – eine bereichsspezifische Sprach-KI –, um die Feinheiten asiatischer Sprach- und Geschäftsbereiche abzubilden, und hat damit eine hochmoderne Genauigkeit der Singlisch-Übersetzung erzielt.
Avaya ist auf Lösungen für Cloud-Kommunikation und Workstream Collaboration spezialisiert und bietet mit seiner OneCloud-Plattform Unified Communications, Contact Center, Communications Platform as a Service (CPaaS) und Services.
Avaya hat die NVIDIA Riva Speech-to-Text-Engine für die Echtzeituntertitelung im großen Maßstab integriert. Riva ermöglicht eine bessere Transkriptionsqualität, eine geringere Wortfehlerrate und eine wirtschaftliche Bereitstellung.
For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.
NCS ist eine Tochtergesellschaft der Singtel Group und ein führender Technologiedienstleister im asiatisch-pazifischen Raum. Das Unternehmen arbeitet mit Regierungen und Unternehmen zusammen, um Kommunen durch Technologie voranzubringen. Durch die Kombination der Erfahrung und des Fachwissens seines 12.000 Mitarbeiter umfassenden Teams mit 61 Spezialisierungen bietet NCS seinen Kunden differenzierte und umfassende Technologiedienste mit seinen NEXT-Fähigkeiten in den Bereichen Digital, Daten, Cloud und Plattformen sowie zentrale Angebote in den Bereichen Anwendung und Infrastruktur, Technik und Cybersicherheit. NCS setzt außerdem auf ein starkes Partnerökosystem mit führenden Technologieakteuren, Forschungseinrichtungen und Start-ups, um offene Innovationen und Co-Creation zu unterstützen.
NCS nutzt NVIDIA Riva TTS in Breeze – der Begleit-App für den Fahrer – für die sprachgeführte Navigation, Live-Updates zu Verkehr und Straßenzustand, Parktarife in Echtzeit sowie elektronische Straßenbenutzungsgebühren und Betriebszeiten, um Fahrern in Singapur eine störungsfreie Fahrt zu ermöglichen.
breeze.com.sg/
www.ncs.co
Customer Story
RingCentral ist ein führender Anbieter globaler Unternehmenslösungen für Cloud-Kommunikation, Zusammenarbeit und Contact Center, der Millionen von Benutzern betreut. Die RingCentral-Plattform ermöglicht die Zusammenarbeit von jedem Ort aus und mit jedem Gerät und verbessert die geschäftliche Effizienz und die Zufriedenheit der Kunden.
RingCentral nutzt NVIDIA Riva für die Transkription von Videokonferenzen für 200.000 gleichzeitige Benutzer seiner Plattform.
www.ringcentral.com
GTC Session
Snap ist ein Kamera- und Social-Media-Unternehmen, das die Erstellung von Multimedia-Nachrichten mit Filtern und Effekten ermöglicht. Um interaktivere Erlebnisse zu erschaffen, spielen Snapchat-Benutzer täglich über 6 Milliarden mal mit Lenses – einer Funktion, die Echtzeiteffekte zu Schnappschüssen hinzufügt.
Der für Geräusche und Sprache optimierte Sprach-KI-Dienst Riva von NVIDIA ist in Snap AR Lens Studio integriert, mit dem Ersteller – Künstler und Entwickler – packende AR-Erlebnisse (Augmented Reality) erschaffen können.
T-Mobile ist Anbieter von superschnellem Mobilfunk und bietet ein fortschrittliches 4G LTE- sowie ein transformatives 5G-Netz für ein bestmögliches Kundenerlebnis. T-Mobile implementiert Expert Assist, um Contact-Center-Mitarbeitern die Arbeit zu erleichtern. Diese KI-basierte Software nutzt NVIDIA Riva, um Kundengespräche in Echtzeit zu transkribieren, die in Empfehlungssysteme eingespeist werden und tausende von Agenten unterstützen.
Mit Riva hat T-Mobile eine Feinabstimmung automatischer Spracherkennungsmodelle mit benutzerdefinierten Datensätzen durchgeführt und kann auch in lauten Umgebungen die Sprache der Kunden exakt interpretieren.
www.t-mobile.com
Wir beantworten Ihre Fragen und helfen Ihnen bei der Erfüllung der Anforderungen Ihrer Organisation.
NVIDIA-Datenschutzrichtlinie