IA de Voz y Traducción
Cree e implemente IA de voz y traducción multilingüe totalmente personalizable para su grande modelo de lenguaje y aplicaciones basadas en generación de recuperación aumentada.
Vídeo | Resumen de la Solución | Para Desarrolladores
NVIDIA® Riva es un conjunto de microservicios de traducción y voz multilingües acelerados por GPU para crear pipelines de IA conversacional en tiempo real y totalmente personalizables. Riva incluye reconocimiento automático de voz (ASR), texto a voz (TTS) y traducción automática neuronal (NMT) y se puede implementar en todas las nubes, en data centers, en el edge o en dispositivos integrados. Con Riva, las organizaciones pueden agregar interfaces de voz y traducción con grandes modelos de lenguaje (LLM) y generación de recuperación aumentada (RAG) para transformar los chatbots en asistentes y avatares multilingües atractivos y expresivos .
Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.
Seleccione el idioma y compruebe cómo Riva ASR ofrece una transcripción altamente precisa en tiempo real proporcionando una entrada a través de su micrófono o cargando un archivo .wav desde su dispositivo.
Nota: La duración de cada muestra está limitada a 30 segundos.
Seleccione una voz y escriba una oración de prueba para escuchar la voz masculina o femenina en inglés innovadora de Riva.
Nota: El texto ingresado está limitado a 400 caracteres.
0 / 400
El uso de las habilidades de Riva está sujeto a los términos de uso de NVIDIA Riva. Sus datos se utilizarán para mejorar los productos y servicios de NVIDIA.
Logre una alta precisión de transcripción para traducciones bilingües y multilingües e implemente voces femeninas y masculinas profesionales expresivas y listas para usar con modelos de última generación previamente entrenados con miles de horas de audio en supercomputadoras NVIDIA.
Personalice los pipelines ASR para diferentes idiomas, acentos, dominios, vocabulario y contexto para obtener la mayor precisión posible para su caso de uso y los pipelines TTS para la voz y la entonación que desee.
Proporcione experiencias consistentes a sus clientes para cientos de miles de flujos de entrada con mayor rendimiento de inferencia en comparación con la tecnología existente y en la implementación de su elección: en data centers, en las instalaciones, en la nube, en el edge o en dispositivos integrados.
Utilice las herramientas adecuadas para crear e implementar aplicaciones de IA de traducción y voz multilingües y totalmente personalizables.
Para las personas que buscan experimentar Riva, el catálogo de API ofrece un playground basado en UI y acceso gratuito a puntos finales de API administrados por NVIDIA como un excelente punto de partida.
Para las empresas que quieran probar Riva antes de comprar NVIDIA AI Enterprise para producción, existen dos opciones para comenzar de forma gratuita:
Sin Infraestructura: Para aquellos que no cuentan con una infraestructura existente, NVIDIA ofrece laboratorios prácticos gratuitos a través de NVIDIA LaunchPad .
Con Infraestructura: Para aquellos con infraestructura existente, NVIDIA ofrece una licencia de evaluación gratuita para probar NVIDIA AI Enterprise durante 90 días.
T-Mobile utiliza NVIDIA Riva ASR en su centro de llamadas para transcribir con precisión las conversaciones de los clientes y brindar recomendaciones en tiempo real para ayudar a los agentes a resolver rápidamente las consultas de los clientes.
NCS utilizó NVIDIA Riva TTS para personalizar una voz de Singapur con pronunciación, tono y acento locales para miles de usuarios activos mensuales de Breeze, una aplicación complementaria para el conductor.
Tarteel utiliza NVIDIA Riva y NVIDIA NeMo™ para proporcionar comentarios en tiempo real sobre la recitación del Corán a escala, lo que permite a los musulmanes, instructores, creadores de contenido e investigadores interactuar con el Corán.
Con NVIDIA Riva, RingCentral logró una precisión de transcripción en tiempo real incomparable para reuniones de video, atendiendo a millones de usuarios con diversos acentos y jerga específica de dominio.
Data Monsters agregó un canal de voz a su aplicación Plabook utilizando NVIDIA Riva para ayudar a los estudiantes a leer, evaluar la precisión a nivel de fonemas y brindar comentarios individualizados.
Artisight desarrolló soluciones hospitalarias inteligentes que automatizan los registros y notifican a los pacientes en espera a través de quioscos habilitados por voz. Estas soluciones integran una aplicación de IA de voz personalizada y ofrecen rendimiento en tiempo real utilizando capacidades de texto a voz de NVIDIA Riva aceleradas por GPU.
Explore cómo AT&T, Kore.ai, Deloitte y Sutherland se benefician del uso de ASR, traducción y TTS en varios idiomas para brindar un autoservicio al cliente más rápido y preciso, mejorar la productividad de los agentes en vivo e impulsar la eficiencia operativa de las empresas.
Aprenda de la mano de un experto en ciencia de datos y tecnología de IA sobre las soluciones de IA de voz y traducción de NVIDIA Riva que están revolucionando la industria, desde asistentes virtuales y avatares digitales para mejorar el alcance, la gestión de reclamos, los pedidos y el aprovisionamiento hasta sistemas de detección de fraude para mitigar riesgos.
Mire este seminario web on demand para aprender cómo crear asistentes virtuales inteligentes en forma de agentes digitales habilitados por voz. Mostraremos cómo implementar soluciones flexibles y totalmente personalizables para mejorar la satisfacción del cliente.
Vea cómo Motorola y SoftServe ofrecen la transcripción, traducción y voces más precisas a la velocidad y escala que exigen las experiencias conversacionales de IA.
Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.
Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.
Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.
Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.
Comprenda las funciones clave de Riva que le ayudarán a crear servicios de IA de voz y traducción.
Obtenga todo lo que necesita para comenzar a construir sus procesos de IA de voz y traducción con NVIDIA Riva, incluidos tutoriales, Notebooks Jupyter y documentación.
Lea un tutorial técnico sobre cómo crear e implementar aplicaciones de IA de voz y traducción utilizando Riva.
Explore cómo comenzar a integrar e implementar modelos Riva ASR y TTS en producción con inferencia de alto rendimiento y mínimo esfuerzo.
Encuentre la licencia adecuada para crear e implementar aplicaciones de IA de voz y traducción multilingües y totalmente personalizables, o explore más recursos de desarrollo ..
Hable con un especialista en productos de NVIDIA sobre cómo pasar del piloto a la producción con la seguridad, la estabilidad de API y el soporte de NVIDIA AI Enterprise.
Regístrate para recibir las últimas noticias, actualizaciones y más de NVIDIA.
En 2021, AI2Labs se separó de Yoozoo Games como una startup tecnológica local en Singapur. AI2Labs innova, experimenta y desarrolla productos y aplicaciones de IA, permitiendo procesos eficientes y mejorando la sostenibilidad y los resultados comerciales.
AI2Labs integró Riva en su API de reconocimiento de voz Speakr (IA de voz de dominio específico) para adaptarse a las complejidades de los dominios comerciales y de voz asiáticos y logró una precisión de traducción en inglés de última generación.
Avaya se especializa en comunicaciones en la nube y soluciones de colaboración en workflow, brindando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.
Avaya integró el motor de voz a texto NVIDIA Riva para subtítulos en tiempo real a escala. Riva permite una mejor calidad de transcripción, una menor tasa de errores de palabras y una entrega económica.
Durante más de 10 años, el Applied AI Group de C-DAC en Pune, India, se ha centrado en la investigación y el desarrollo de tecnología del habla. Han creado con éxito un sistema de voz a texto (STT) de vanguardia para idiomas índicos como el hindi y el marathi. El grupo continúa avanzando en su trabajo explorando frameworks, bibliotecas y herramientas de deep learning de código abierto y habilitados para IA para crear aplicaciones STT y habilitadas para voz para otros idiomas índicos y de bajos recursos. Se realizaron experimentos utilizando varias arquitecturas y topologías de redes neuronales del framework NeMo de código abierto de NVIDIA, y las topologías de redes Citrinet y Conformer-CTC demostraron ser efectivas en la construcción y entrenamiento de modelos acústicos neuronales para el reconocimiento de voz. Estos modelos se entrenaron en sistemas de IA Param Siddhi de uno y varios nodos, optimizando el tiempo y el rendimiento del entrenamiento. Finalmente, los modelos se implementaron para inferencia en tiempo real y en modo por lotes utilizando el proceso de producción acelerado por GPU de Riva.
NCS, una subsidiaria de Singtel Group, es una firma líder de servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para hacer avanzar a las comunidades a través de la tecnología. Combinando la experiencia y los conocimientos de su equipo de 12.000 personas en 61 especializaciones, NCS ofrece servicios de tecnología diferenciados y de extremo a extremo a los clientes con sus capacidades NEXT en digital, datos, nube y plataformas, así como ofertas principales en aplicaciones e infraestructura , ingeniería y ciberseguridad. NCS también cree en la construcción de un ecosistema de socios sólido con actores tecnológicos líderes, instituciones de investigación y empresas emergentes para apoyar la innovación abierta y la cocreación.
NCS utiliza NVIDIA Riva TTS en Breeze, la aplicación complementaria del conductor, para navegación guiada por voz, actualizaciones de tráfico y condiciones de la carretera en vivo, tarifas de estacionamiento en tiempo real y tarifas y horarios de operación electrónicos para ayudar a los conductores de Singapur a experimentar viajes de conducción sin problemas.
breeze.com.sg/
www.ncs.co
Historia del Cliente
RingCentral, un proveedor líder de soluciones globales de centros de contacto, colaboración y comunicaciones en la nube empresarial, presta servicios a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, mejorando la eficiencia empresarial y la satisfacción del cliente.
RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200.000 usuarios simultáneos en su plataforma.
www.ringcentral.com
Sesión GTC
Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una función que agrega efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día.
El servicio de IA del habla optimizado para ruido y jerga de NVIDIA Riva está integrado en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear apasionantes experiencias de realidad aumentada (AR).
T-Mobile, un Un-carrier supercargado, ofrece una red 4G LTE avanzada y una red 5G transformadora para la mejor experiencia del cliente. Para empoderar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que alimentan a los recomendadores y ayudan a miles de agentes.
Con Riva, T-Mobile afina los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta con precisión la jerga de los clientes en entornos ruidosos.
www.t-mobile.com
Responderemos a sus preguntas y ayudaremos con las necesidades de su organización.
Política de Privacidad de NVIDIA