Énergie

Shell entraîne un chatbot personnalisé basé sur l'IA avec NVIDIA NeMo pour améliorer les opérations

Objectif

Shell International Exploration and Production Inc. (Shell), l'un des leaders mondiaux de l'industrie énergétique, a utilisé NVIDIA NeMo™ pour développer un chatbot personnalisé basé sur l'IA spécialisé dans le domaine de la chimie. Cette solution innovante pourrait améliorer considérablement la productivité des employés en simplifiant les processus de recherche, en améliorant la prise de décision et en aidant à la recherche et au développement dans les environnements de production.

Client

Shell

Cas d'utilisation

IA générative / LLM

Produits

NVIDIA NeMo
NVIDIA NeMo Curator
NVIDIA NeMo Framework

Naviguer dans un contexte spécifique à un domaine

Shell gère un ensemble immense et complexe de données scientifiques qui sous-tendent son activité. Le service de R&D de l'entreprise doit pouvoir accéder rapidement à des informations précises.

Outre la gestion des données, l'entreprise cherche également à améliorer les activités quotidiennes et la prise de décision du personnel technologique, afin de permettre aux équipes de récupérer efficacement les informations nécessaires pour accroître la productivité et l'efficacité opérationnelle.

Pour atteindre cet objectif, Shell a utilisé NVIDIA AI pour développer des modèles personnalisés capables de comprendre les recherches internes de la société et de fournir des réponses précises et adaptées au contexte. Pour commencer, l'entreprise s'est concentrée sur le domaine de la chimie.

Shell

Principales leçons

  • La précision du LLM personnalisé de Shell entraîné avec NVIDIA NeMo a augmenté de 30 % lors d'un benchmark personnalisé par rapport à la version non affinée du modèle de base.
  • Grâce aux techniques de parallélisme de NeMo, Shell a accéléré de 20 % la vitesse d'entraînement de son modèle d'IA par rapport à d'autres frameworks open source.
  • Shell souhaite développer les capacités multimodales du système pour permettre des interactions avec des images et des vidéos dans son chatbot IA.

Organiser et entrainer un LLM personnalisé à partir de données d'entreprise avec NVIDIA NeMo

Pour améliorer la précision de son LLM dédié à l'industrie de l'énergie, Shell s'est concentrée sur organiser des données d'entraînement de haute qualité en guise de fondements pour sa solution d'IA. Le processus de développement a commencé par l'organisation et le prétraitement d'un vaste ensemble de documents relatifs à la chimie. Shell avait accès à 300 000 documents techniques collectés sur plusieurs décennies et portant sur divers domaines. Parmi eux, 154 000 ont finalement été retenus pour leur qualité grâce à NVIDIA NeMo Curator.

Le processus de sélection s'est déroulé en plusieurs étapes, avec notamment une phase de suppression des contenus identiques ou presque identiques. Shell a également appliqué des filtres de qualité afin de supprimer les documents contenant trop peu d'informations ou qui étaient mal formatés, en plus de la fonction de détection de la langue pour exclure le contenu qui n'était pas en anglais. L'entreprise a aussi fait appel à la classification par domaine pour sélectionner des documents destinés à développer des benchmarks spécifiques à un domaine donné.

Une fois le jeu de données organisé, Shell est allé au-delà de la génération augmentée par récupération (RAG) pour utiliser le framework NVIDIA NeMo pour effectuer un pré-entraînement adaptatif au domaine (DAPT) et un affinage supervisé (SFT) afin d'améliorer les connaissances et la précision du modèle dans le domaine choisi. Ce pré-entrainement DAPT a permis au modèle de vraiment comprendre le contexte et la terminologie propres à l'industrie chimique. En parallèle, l'affinage SFT a continué à affiner les performances du modèle en l'entraînant sur des données étiquetées spécifiques aux besoins de Shell. Grâce aux techniques de parallélisme disponibles via NeMo, Shell a réduit de 20 % le délai d'entraînement du modèle (en millions d'heures GPU) par rapport à d'autres frameworks open source.

Transformer les flux de travail d'entreprise pour augmenter la productivité grâce à une IA adaptée à un domaine

Récupérer des informations précises à partir des documents de l'entreprise peut s'avérer difficile pour la RAG, car les modèles de langage standard interprètent souvent mal les questions des utilisateurs et les associent à des informations génériques plutôt qu'à des données spécifiques à un domaine. L'adaptation des LLM au langage spécifique à un secteur permet de contourner cette limitation et d'améliorer la précision des réponses et la qualité des conversations. C'est ce besoin de précision qui a poussé Shell à développer des outils en interne pour personnaliser les LLM (outils qui n'étaient pas disponibles dans les solutions sur le marché) et qui a conduit à sa collaboration avec NVIDIA.

Le chatbot basé sur l'IA développé par Shell devrait permettre au personnel technologique d'accéder rapidement à des documents et à des données chimiques détaillés, et ainsi accélérer ces tâches et minimiser le risque d'erreur. En simplifiant l'accès aux connaissances, le chatbot basé sur l'IA peut améliorer la collecte d'informations et la prise de décisions dans le domaine de la R&D, ce qui contribue à la fois à l'innovation et à l'efficacité opérationnelle.

Outre un meilleur accès aux informations, le LLM personnalisé peut également être utilisé pour l'analyse de documents techniques et ainsi simplifier les workflows entre les différents services.

En affinant constamment le modèle grâce à des interactions réelles, Shell positionne son écosystème d'IA comme une couche d'intelligence adaptative et transforme les connaissances de l'entreprise en une ressource dynamique et accessible.

Capitaliser sur sa réussite : futures améliorations du chatbot basé sur l'IA de Shell

Shell prévoit d'améliorer encore les capacités de son LLM spécialisé dans un domaine en élargissant le jeu de données d'entraînement et en développant des tâches d'évaluation plus diversifiées et plus complexes. Outre l'amélioration du modèle texte-à-texte, l'objectif est d'exploiter les capacités multimodales du chatbot basé sur l'IA. Il pourra ainsi gérer et traiter différents types de données, notamment des images et des vidéos.

L'ajout de capacités multimodales devrait permettre de fournir des informations plus complètes et plus riches en termes de contexte : un point particulièrement utile pour les processus de prise de décision complexes.

Ces améliorations devraient accroître encore la productivité et l'efficacité opérationnelle, et prouver la volonté de Shell de tirer parti de technologies d'IA avancées pour améliorer ses opérations.

Développez, personnalisez et déployez des applications d'IA générative et agentique multimodales avec NVIDIA NeMo.