AI de Fala

Forneça interfaces baseadas em voz para suas aplicações de AI conversacional.


O Que É AI de Fala?

A AI de fala oferece às pessoas a capacidade de conversar com dispositivos, máquinas e computadores para simplificar e aumentar suas vidas. Um subconjunto da AI conversacional, ela inclui o reconhecimento automático de fala (ASR - Automatic Speech Recognition) e a conversão de texto em fala (TTS - Text-To-Speech) para converter a voz humana em texto e gerar uma voz humana a partir de palavras escritas, tornando possíveis tecnologias avançadas, como assistentes virtuais, transcrições em tempo real, pesquisas de voz e sistemas de resposta a perguntas.

Vantagens em Usar a AI de Fala

Precisão Superior

Ofereça experiências de nível excepcional para seus clientes com a melhor precisão possível com a personalização de modelos de AI de fala.

Suporte a Vários Idiomas

Amplie sua base de clientes oferecendo aplicações baseadas em voz nos idiomas que seus clientes falam.

Alto Desempenho e Escalabilidade

Atenda a mais clientes com aplicações de baixa latência e alta taxa de processamento que podem ser dimensionadas instantaneamente em qualquer infraestrutura: incorporadas, on premise, no cloud ou no edge.

Uma Voz Natural Única Para Sua Marca

Ofereça um diferencial ao seu atendimento ao cliente, fornecendo compromissos rápidos e significativos com a voz única da sua marca.

eBook Gratuito: Criando Aplicações de AI de Fala

Saiba como criar e implantar pipelines de AI de fala em tempo real para sua aplicação de AI conversacional.

Sessões do Speech AI Day

Bate-Papo Sobre IA Conversacional da Pesquisa à Produção

Neste bate-papo, líderes inovadores da Carnegie Mellon University, Hippocratic AI, Suno e Wipro compartilham insights sobre como superar os desafios na implantação de tecnologias de fala multilíngues de ponta e tendências emergentes em todos os setores.

Revelando a Magia da IA Conversacional e Tradução de Ponta a Ponta

Nesta sessão, palestrantes da Motorola e da Softserve discutem como fornecer a transcrição, tradução e vozes envolventes mais precisas para experiências de IA conversacional de forma rápida e escalável.

Transforme Sua Empresa com IA Conversacional

Palestrantes da Deloitte, Kore.ai e PolyAI compartilham seus insights, experiência e histórias de sucesso demonstrando o poder transformador da IA conversacional em ação. 

Como a AI de Fala Está Sendo Usada

Multi-Speaker Transcription

Transcreva Vários Locutores ao Mesmo Tempo

Algoritmos modernos de conversão de fala em texto transcrevem reuniões, palestras e conversas sociais ao mesmo tempo em que identificam locutores e marcam suas contribuições. Com as tecnologias de AI de Fala e SDKs da NVIDIA, você pode criar transcrições precisas para conversas de centrais de atendimento e reuniões de videoconferência ou automatizar a observação clínica durante interações entre médicos e pacientes.

Virtual Assistant Applications

Crie Assistentes Virtuais

Os assistentes virtuais se comunicam com os usuários através de uma interface de fala e auxiliam em várias tarefas, desde resolver problemas de clientes em call centers, ligar a TV como um assistente doméstico inteligente, até navegar até o posto de gasolina mais próximo como um assistente inteligente dentro do carro. Aproveite o NVIDIA Omniverse Avatar Cloud Engine (ACE) para integrar as tecnologias de AI de Fala da NVIDIA para componentes baseados em redes neurais profundas e fáceis de usar em suas aplicações de avatar interativos para oferecer interações precisas, rápidas e naturais.

NVIDIA Custom Voice

Sua Voz Com Sua Marca

Com uma voz de marca reconhecível, as empresas podem criar aplicações que construam relações com os clientes e apoiem todos os clientes, incluindo aqueles com déficits de fala e linguagem. Com o NVIDIA Custom Voice, parte da AI de Fala, você pode facilmente criar uma personalidade de voz única e de alta qualidade para sua marca em horas, em vez de semanas, e com apenas 30 minutos de dados de fala gravados.

Desenvolva Interfaces Personalizáveis de AI de Fala

Reduza o Treinamento Usando Modelos Pré-Treinados

Os sistemas de AI de Fala modernos usam modelos de rede neural profunda (DNN - Deep Neural Network) treinados com grandes conjuntos de dados. Com o tempo, o tamanho dos modelos de AI de fala cresceu tanto que o treinamento deles pode levar semanas de tempo intenso de computação, mesmo usando frameworks de deep learning, como PyTorch, TensorFlow e MXNet em GPUs de alto desempenho.

A AI de Fala da NVIDIA oferece modelos pré-treinados de qualidade de produção no catálogo do NVIDIA NGC™ treinados com vários conjuntos de dados públicos e proprietários por mais de centenas de milhares de horas em sistemas NVIDIA DGX™.

Figura 1: Modelos pré-treinados altamente precisos.

Figura 2: Workflow do NVIDIA NeMo de ponta a ponta.

Personalize Modelos para Aumentar a Precisão

Muitas empresas precisam personalizar modelos de IA de fala e tradução para alcançar a precisão multilíngue desejada para suas aplicações de conversação específicas. No entanto, personalizar modelos de IA de fala do zero geralmente requer grandes conjuntos de dados de treinamento e experiência em IA.

Para acelerar o desenvolvimento e personalizar altamente os modelos de fala, você pode usar o NVIDIA NeMo para criar, personalizar e implantar pipelines de fala, reconhecimento automático de fala (ASR) e conversão de texto em fala (TTS), e processamento de linguagem natural (NLP). Com o NeMo você pode personalizar, estender e compor módulos de IA de fala pré-construídos existentes para criar novos modelos. Os modelos otimizados com NeMo podem ser facilmente exportados e implantados no NVIDIA® Riva no local ou na nuvem como serviço de fala.

Interações Naturais Desenvolvendo Habilidades em Tempo Real

Para habilidades de AI de fala, as empresas sempre tiveram que escolher entre precisão e desempenho em tempo real. Por exemplo, eles não podem fazer uma pergunta e, em seguida, esperar vários segundos para receber a resposta. Além disso, eles não querem que suas aplicações de AI conversacional interpretem mal ou produzam texto sem sentido.

Com o NVIDIA Riva, as empresas podem alcançar precisão de alto nível e executar seus pipelines de AI de fala em tempo real, em poucos milissegundos. O Riva oferece modelos pré-treinados de SOTA no NGC, ferramentas com baixo código como o Kit de Ferramentas TAO para ajustes finos para alcançar precisão de alto nível e habilidades otimizadas para desempenho em tempo real.

Figura 3:  Recursos de habilidades de AI de fala do NVIDIA Riva.

Explore os Últimos Avanços em AI de Fala

A AI de Fala Agora é Multilíngue

As aplicações e os pipelines de AI de fala precisam entender vários idiomas, dialetos e sotaques para serem implantados em todo o mundo. Por exemplo, as pessoas nos Estados Unidos e na maioria dos outros países falam diferentes línguas. Em casos de uso como centrais de atendimento, há momentos em que um cliente usa mais de uma idioma para descrever o que está acontecendo. O próximo passo é ter aplicações de AI de fala que possam lidar com essas situações.

Os desenvolvedores podem usar modelos de fala separados para cada idioma ou um único modelo que possa lidar com mais de um idioma. Saiba mais na página Coleções de Reconhecimento de Fala sobre modelos ASR em diferentes idiomas.

Levando a AI de Fala do Cloud para o Dispositivo

Quando as empresas começaram a usar a AI de fala, todas usavam serviços em cloud por serem fáceis de configurar e usar. Lentamente, as empresas começaram a mudar para soluções on premise para evitar problemas de privacidade com seus dados. Agora, as soluções em dispositivos são o mais recente avanço, não apenas para manter os dados privados, mas também para uma inferência mais rápida e redução de custos. 

O NVIDIA Riva permite que as aplicações sejam implementadas em ambientes integrados, de data center e no cloud para desenvolver interfaces de AI de fala personalizáveis para sua aplicação de AI conversacional.

Comece com a IA de Fala

Obtenha Acesso aos Workflows de AI de Fala

Acelere o tempo de desenvolvimento com workflows de IA integrados para transcrição de áudio e assistentes virtuais inteligentes. Disponíveis na compra do NVIDIA Riva, esses workflows de IA incluem suporte empresarial completo e pacotes de frameworks de IA da NVIDIA e modelos pré-treinados, bem como recursos como gráficos Helm, Notebooks Jupyter e documentação para ajudá-lo a começar a criar soluções de IA.

Comece a Desenvolver com Contêineres e Modelos

Embora implantações em grande escala exijam a compra do NVIDIA Riva, a NVIDIA também oferece uma variedade de contêineres, modelos e ferramentas de personalização gratuitamente.

Acesse Recursos Educacionais

Veja uma Introdução à AI de Fala

Entenda os conceitos básicos de AI de fala e como criar e implantar aplicações de tecnologia de voz.

Desmistifique a AI Conversacional

Saiba como adicionar a AI de fala a aplicações de AI conversacional e como personalizá-la no tempo de treinamento e inferência.

Pesquise os Blogs Sobre AI de Fala

Aprenda o que é a AI de fala e como ela mudou ao longo do tempo, sobre seus principais componentes, desafios e casos de uso e sobre os SDKs de AI de Fala da NVIDIA.

Confira o NVIDIA Riva em Mais Detalhes

Entenda os principais recursos do NVIDIA Riva que ajudam você a criar serviços de AI de fala.

Inscreva-se para receber as últimas novidades sobre a AI de fala da NVIDIA.