エネルギー
エネルギー業界のグローバルリーダーである Shell International Exploration and Production Inc. (Shell) は、化学分野の専門知識に特化したカスタム AI チャットボット開発への取り組みを推進するため、NVIDIA NeMo を活用しました。この革新的なソリューションは、検索プロセスの効率化、意思決定の向上、そして本番環境における研究開発の支援により、従業員の生産性を大幅に向上させる可能性を秘めています。
Shell
生成 AI / LLM
NVIDIA NeMo
NVIDIA NeMo Curator
NVIDIA NeMo Framework
Shell は、事業運営の基盤となる膨大で複雑な化学データを管理しています。Shell の研究開発組織全体において、正確な情報への迅速なアクセスは不可欠です。
データ管理を超えて、同社は技術スタッフの日常業務と意思決定の向上も目指し、チームが生産性と業務効率の向上に必要な適切な情報を効率的に取得できるよう取り組んでいます。
この目標を達成するため、Shell は NVIDIA AI を活用して、化学分野を最初の焦点として Shell の社内研究を理解し、正確でコンテキストを考慮した回答を提供できるカスタムモデルを開発しました。
Shell
エネルギー業界に特化したドメイン固有 LLM の高精度を実現するため、Shell は AI ソリューションの基盤として高品質な学習データのキュレーションに重点を置きました。開発プロセスは、膨大な化学文書データセットのキュレーションと前処理から始まりました。当初、Shell は数十年にわたって収集された 30 万件の技術文書にアクセスできました。これらの文書は様々な技術分野をカバーしており、NVIDIA NeMo Curator を使用して 15.4 万件の高品質文書に厳選されました。
キュレーションプロセスには、重複または類似重複コンテンツを除去するための完全重複除去とあいまい重複除去など、複数のステップが含まれていました。Shell はまた、情報不足や書式不良の文書を除去する品質フィルターを適用し、言語検出を使用して英語以外のコンテンツを除外しました。さらに、ドメイン固有ベンチマーク構築のための文書選択にドメイン分類が使用されました。
データセットのキュレーション完了後、Shell は検索拡張生成 (RAG) を超えて NVIDIA NeMo フレームワークを使用し、ドメイン適応事前学習 (DAPT) と教師ありファイーニング (SFT) を実行してモデルのドメイン固有知識と精度を向上させました。DAPT により、モデルは化学業界固有のコンテキストと専門用語を真に理解できるようになりました。同時に、SFT は Shell のニーズに特化したラベル付きデータでの学習により、モデルの性能をさらに向上させました。NeMo の並列化技術を活用することで、Shell は他のオープンソースフレームワークと比較してモデル学習時間 (数百万 GPU 時間) を 20% 短縮しました。
標準的な言語モデルはユーザークエリを誤解釈し、ドメイン固有の洞察ではなく広範で一般的な情報と照合することが多いため、エンタープライズ知識ソースからの正確な情報取得は RAG にとって困難な場合があります。LLM を業界固有の言語に適応させることで、このギャップを埋め、回答の精度と会話品質を向上させることができます。この精度への要求により、Shell は市場製品では利用できない LLM カスタマイゼーションのための社内機能開発を推進し、NVIDIA との協業に至りました。
Shell が開発した AI 搭載チャットボットにより、技術スタッフは詳細な化学文書とデータに迅速にアクセスでき、これらのタスクに要する時間を短縮し、エラーのリスクを軽減できます。知識取得の効率化により、AI チャットボットは研究開発分野における洞察獲得と意思決定を向上させ、イノベーションと業務効率の両方を支援できます。
情報取得の向上に加えて、カスタム LLM は技術文書分析にも活用でき、部門を超えたワークフローの効率化に貢献します。
実世界での相互作用を通じてモデルを継続的に改良することで、Shell は AI エコシステムを適応的インテリジェンス層として位置付け、エンタープライズ知識管理を動的でアクセス可能なリソースに変革しています。
今後に向けて、Shell は学習データセットの拡張とより多様で困難な評価タスクの開発により、ドメイン適応 LLM の機能をさらに向上させる計画です。テキスト対テキストモデルの強化と合わせて、AI チャットボットのマルチモーダル機能を解放することが目標です。これにより、チャットボットは画像や動画を含む様々なタイプのデータを処理、操作できるようになります。
マルチモーダル機能の追加により、より包括的でコンテキストに富んだ情報提供が期待され、これは複雑な意思決定プロセスにおいて特に価値があります。
これらの強化により生産性と業務効率のさらなる向上が期待され、Shell の業務に利益をもたらす市場先行の先進 AI 技術活用への取り組みが確固たるものとなります。
NVIDIA NeMo を使用してマルチモーダル生成・AI とエージェント AI アプリケーションを構築、カスタマイズ、デプロイしましょう。