すべての業界

Perplexity、NVIDIA NeMo を使用して、AI を活用した検索エンジンのモデル パフォーマンスを向上

Perplexity

目的

Perplexity は最先端のモデルを迅速にカスタマイズし、検索結果の精度と品質を向上させるとともに、低遅延と高スループットを最適化することで、より良いユーザー体験を実現することをを目指しています。

顧客

Perplexity

ユース ケース

生成 AI / LLM

製品

NVIDIA NeMo

Perplexity を使用して過度な情報負荷を解決

Perplexity は、AI を活用した画期的な回答エンジンで、あらゆる質問に対して正確で信頼できる回答をリアルタイムに提供します。

インターネットでは、豊富な情報にアクセスでき、毎年無数の質問を投げかけることができます。しかし、従来の情報検索では、ユーザーが複数のソースを確認し、必要とする洞察を見つけて形成しなければなりませんでした。

この問題を是正するために、Perplexity は「回答エンジン」を構築し、より効率的な情報の取得方法を提供します。質問されると、Perplexity の回答エンジンは、簡潔な回答を直接提供します。直接的で関連性の高い情報を迅速に提供することで、時間を節約しながらユーザー体験を向上させます。

検索にはそれぞれ異なる意図が含まれます。Perplexity は大規模言語モデル (LLM) のネットワークを利用して、信頼できる結果を生成します。これを実現するために、Perplexity のチームは、高度なチューニング技術でモデルのカスタマイズ プロセスを簡便かつ効率的に拡張できるツールを必要としていました。

Perplexity

要点

  • Perplexity は、直接的で簡潔な回答を提供する「回答エンジン」を導入し、従来型の検索エンジンに大きな変革をもたらしています。時間を節約し、かつ正確な情報を迅速に提供することでユーザー エクスペリエンスを向上させています。
  • 2024 年 10 月現在、このプラットフォームはなんと毎月 3 億 4,000 万件のクエリを処理し、1,500 を超える組織が Perplexity を自社のワークフローに統合し、プロフェッショナル環境においてその価値を強調しています。
  • トレーニングに NVIDIA NeMo™ を使用し、Perplexity は Sonar という独自のオンライン LLM ファミリを開発し、最新かつ事実に基づいた回答を提供しています。

カスタマイズと柔軟性

Perplexity は NVIDIA NeMo を採用し、その信頼性、柔軟性、使いやすさを活用して、オンライン回答エンジンのカスタム モデルを作成しました。NeMo による支援を受け、以下のデータ処理および高度なモデル アライメント技術を活用しました。

  • 教師ありファインチューニング: 複数のノードに分散されたデータを処理する NeMo の機能により、Perplexity はトレーニング プロセスを効率的に拡張することができました。
  • 直接選好最適化 (DPO: Direct Preference Optimization): DPOを使用することで、Perplexity は人間の好みに合わせてトレーニング済みモデルのパフォーマンスを向上させ、モデルをユーザーのニーズにあわせてカスタマイズすることが可能になりました。
  • 近接方策最適化 (PPO: Proximal Policy Optimization): このアライメント技術により、ゲーム プレイやロボット制御など、複雑なタスクのモデルに対するトレーニング成果が改善されました。

新しいオープンソースのリリースから数日以内に、チームは検索での基本モデル比で 20% 改良された新しい Sonar モデルを開発しました。

Perplexity は、Llama や Mistral モデル ファミリなど、最先端のモデルにファインチューニングを適用し、検索拡張生成を活用して、検索データに基づく正確で簡潔な回答を提供しています。このレベルのカスタマイズにより、Perplexity は AI アプリケーションにおいて高い精度と関連性を達成できました。

さらに、NeMo の使いやすさ、幅広い対応モデル アーキテクチャ、高いトレーニング スループットにより、Perplexity は迅速に実験し、アプリケーションに最適なチューニング モデルを見つけることができました。

NeMo を使用した LLM のファインチューニングの拡張

NeMo を使用することで、Perplexity は大規模な分散データとモデル並列処理を活用しながら、LLM のファインチューニングを 0.5B から 400B 以上に拡張することができました。

AI リサーチ エンジニアで Perplexity の検索機能改善の取り組みを率いる Weihua Hu 氏は、次のように述べています。「NeMo を使用することで、Perplexity はさまざまなオープンソースの埋め込みモデルを迅速にファインチューニングできます。これにより、検索スタックが大幅に強化され、回答の品質が大きく向上しました。」

Weihua 氏はまた、「いくつかの事後トレーニング技術を使用して実験し、教師ありファインチューニング (SFT) とDPO (直接的選好最適化) の適切な組み合わせを見つけることができました。」とも述べています。

情報へのアクセス方法を再定義することで、Perplexity はユーザーの Web の使用方法を変革し、より直感的で使いやすいものにすることを目指しています。

「NeMo を使用することで、Perplexity はさまざまなオープンソースの埋め込みモデルを迅速にファインチューニングできます。これにより、検索スタックが大幅に強化され、回答の品質が大きく向上しました。」

Weihua Hu 氏
AI リサーチ エンジニア

さっそく始めませんか?

NVIDIA NeMo を使って、生成 AI を構築、カスタマイズ、デプロイする方法を確認してください。