Todos os Setores
A Perplexity visa personalizar rapidamente modelos de fronteira para melhorar a precisão e a qualidade dos resultados de busca e otimizá-los para menor latência e alto rendimento para uma melhor experiência do usuário.
Perplexity
IA Generativa / LLMs
NVIDIA NeMo
Perplexity é um mecanismo de respostas inovador impulsionado por IA que fornece respostas precisas, confiáveis e em tempo real a qualquer pergunta.
Embora a internet tenha proporcionado acesso a uma grande quantidade de informações e permita que incontáveis perguntas sejam feitas anualmente, a abordagem convencional de busca de informações exige que os usuários vasculhem várias fontes para encontrar e formular os insights de que precisam.
Para resolver essa questão, a Perplexity criou um "mecanismo de respostas", oferecendo uma maneira mais eficiente de obter informações. Quando é feita uma pergunta, o mecanismo de respostas da Perplexity dá uma resposta concisa diretamente, economizando tempo e aprimorando a experiência do usuário, fornecendo informações diretas e relevantes rapidamente.
Toda pesquisa tem uma intenção diferente, e a Perplexity conta com uma rede de grandes modelos de linguagem (LLMs) para gerar resultados fundamentados. Para viabilizar isso, a equipe da Perplexity precisava de ferramentas que pudessem escalar de forma fácil e eficiente o processo de personalização de modelos com técnicas avançadas de ajuste.
Principais Destaques
O Perplexity adotou o NVIDIA NeMo, aproveitando sua confiabilidade, flexibilidade e facilidade de uso para criar modelos personalizados para seu mecanismo de respostas on-line. Foram utilizadas várias técnicas avançadas de processamento de dados e alinhamento de modelos apoiadas pelo NeMo:
Poucos dias após o lançamento de um novo modelo de código aberto, a equipe tinha um novo modelo do Sonar que apresentava melhorias de 20% em relação ao modelo de base em desempenho de busca.
A Perplexity aplicou ajustes finos em modelos de ponta, como as famílias de modelos Llama e Mistral, e está aproveitando a geração aumentada por recuperação para fornecer respostas precisas e concisas com base nos dados recuperados. Esse nível de personalização permitiu que a Perplexity alcançasse alta precisão e relevância em suas aplicações de IA.
Além disso, a facilidade de uso do NeMo, a ampla gama de arquiteturas de modelos suportadas e o alto rendimento de treinamento permitiram que a equipe da Perplexity experimentasse rapidamente e encontrasse os modelos mais adequados para suas aplicações.
O NeMo permitiu que a Perplexity escalasse o ajuste fino de LLMs de 0,5 bilhões de parâmetros para mais de 400 bilhões de parâmetros, aproveitando a capacidade de dados distribuídos em larga escala e paralelismo de modelos.
O engenheiro de pesquisa de IA Weihua Hu vem liderando um esforço para melhorar as capacidades de recuperação da Perplexity e afirmou: “O NeMo permite que a Perplexity ajuste rapidamente uma variedade de modelos de incorporação de código aberto. Isso aprimorou muito nosso stack de recuperação e levou a um aumento significativo na qualidade das respostas.”
Weihua também observou: “Conseguimos experimentar várias técnicas de pós-treinamento e encontrar a combinação certa de ajuste fino supervisionado (SFT) e otimização direta de preferências (DPO).”
Ao redefinir como as informações são acessadas, a Perplexity visa transformar a forma como os usuários interagem com a internet, tornando-a mais intuitiva e fácil de usar.
“O NeMo permite que a Perplexity ajuste rapidamente uma variedade de modelos de incorporação abertos. Isso aprimorou muito nosso stack de recuperação e levou a um aumento significativo na qualidade das respostas.”
Weihua Hu,
Engenheiro de Pesquisa em IA