Todos los sectores
Perplexity tiene como objetivo personalizar rápidamente los modelos más avanzados para mejorar la precisión y la calidad de los resultados de búsqueda y optimizarlos para disfrutar de menores latencia y un mayor rendimiento que mejoran la experiencia de usuario.
Perplexity
IA generativa/LLM
NVIDIA NeMo
Perplexity es un motor de respuestas innovador impulsado por IA que ofrece respuestas precisas, fiables y en tiempo real a cualquier pregunta.
Aunque Internet ha brindado acceso a una gran cantidad de información y permite que se formulen incontables preguntas cada año, el enfoque convencional de la búsqueda de información requiere que los usuarios examinen múltiples fuentes para encontrar y formular las ideas que necesitan.
Para abordar esto, Perplexity ha creado un "motor de respuestas" que ofrece una forma más eficiente de obtener información. Cuando se le formula una pregunta, el motor de respuestas de Perplexity ofrece una respuesta concisa directamente, lo que ahorra tiempo y mejora la experiencia del usuario con información directa y relevante de forma rápida.
Cada búsqueda tiene una intención diferente, y Perplexity se basa en una red de modelos lingüísticos de gran tamaño (LLM) para generar resultados bien fundamentados. Para permitir esto, el equipo de Perplexity necesitaba herramientas que pudieran escalar de forma fácil y eficiente el proceso de personalización del modelo con técnicas de ajuste avanzadas.
Principales conclusiones
Perplexity ha adoptado NVIDIA NeMo aprovechado su fiabilidad, flexibilidad y facilidad de uso para crear modelos personalizados para su motor de respuestas en línea. Utilizaron varias técnicas de procesamiento de datos y alineación de modelos avanzadas con el apoyo de NeMo:
A los pocos días del lanzamiento de una nueva versión de código abierto el equipo ya disponía de un nuevo modelo de Sonar que mejoraba en un 20% el modelo base de búsqueda.
Perplexity ha aplicado ajustes a los modelos de vanguardia, incluyendo las familias de modelos Llama y Mistral, y aprovecha la generación aumentada por recuperación para ofrecer respuestas breves y precisas basadas en los datos recuperados. Este nivel de personalización ha permitido a Perplexity lograr una alta precisión y relevancia en sus aplicaciones de IA.
Además, la facilidad de uso de NeMo, la amplitud de las arquitecturas de modelos admitidas y el alto rendimiento de entrenamiento han permitido a Perplexity experimentar rápidamente y encontrar los modelos mejor ajustados para sus aplicaciones.
NeMo permitió a Perplexity escalar la optimización de los LLM desde los 500 millones de parámetros a más de 400 000 millones al tiempo que aprovechaba sus datos distribuidos a gran escala y el paralelismo de modelos.
El ingeniero de investigación de IA Weihua Hu ha liderado un esfuerzo para mejorar las capacidades de recuperación de Perplexity y nos cuenta: “NeMo permite a Perplexity ajustar rápidamente diversos modelos de incrustación de código abierto. Esto mejoró enormemente nuestra pila de recuperación y dio lugar a un aumento significativo en la calidad de las respuestas”.
Weihua también señaló: “Pudimos experimentar con varias técnicas posteriores al entrenamiento y encontrar la mezcla adecuada de ajuste supervisado (SFT) y optimización de preferencias directas (DPO)”.
Al redefinir cómo se accede a la información, Perplexity tiene como objetivo transformar la forma en que los usuarios interactúan con la web, haciéndola más intuitiva y fácil de usar.
"NeMo permite a Perplexity ajustar rápidamente diversos modelos de incrustación de código abierto. Esto mejoró enormemente nuestra pila de recuperación y dio lugar a un aumento significativo en la calidad de la respuesta".
Weihua Hu,
ingeniero de investigación de IA