에너지

Shell, NVIDIA NeMo로 맞춤형 AI 챗봇을 훈련하여 운영 효율성 향상

목표

에너지 산업의 글로벌 리더인 Shell International Exploration and Production Inc.(Shell)는 NVIDIA NeMo™를 활용하여 화학 분야의 전문지식을 위한 맞춤형 AI 챗봇을 개발하기 위한 여정을 강화했습니다. 이 혁신적인 솔루션은 검색 프로세스를 간소화하고, 의사결정을 개선하며, 생산 환경에서 연구 개발 분야의 연구과 개발을 지원하여 직원 생산성을 상당히 향상시킬 수 있습니다.

고객

Shell

사용 사례

생성형 AI/LLM

제품

NVIDIA NeMo
NVIDIA NeMo Curator
NVIDIA NeMo 프레임워크

도메인별 컨텍스트 탐색

Shell은 비즈니스 운영을 뒷받침하는 집약적이고 복잡한 과학 데이터를 관리합니다. Shell의 R&D 조직 전체에서 정확한 정보에 신속하게 액세스하는 것이 필수적입니다.

또한 데이터 관리 외에도 이 회사는 기술 담당 직원의 일상적인 활동과 의사 결정을 개선하여 팀이 올바른 정보를 효율적으로 검색하여 생산성과 운영 효율성을 높이는 것을 목표로 합니다.

이 목표를 달성하기 위해 Shell은 NVIDIA AI를 활용하여 Shell의 내부 연구를 이해할 수 있는 맞춤형 모델을 개발했습니다. 이 모델은 초기에는 화학 분야에 중점을 두고 정확하고 맥락을 인식하는 응답을 제공합니다.

Shell

핵심 요약

  • NVIDIA NeMo로 학습된 Shell의 맞춤형 LLM은 기본 모델의 Fine-tuning되지 않은 버전과 비교했을 때 맞춤형 벤치마크에서 정확도가 30% 향상되었습니다.
  • Shell은 NeMo의 병렬 구현 기술을 사용하여 다른 오픈 소스 프레임워크에 비해 AI 모델 훈련 시간을 20% 단축했습니다.
  • Shell은 AI 챗봇에서 이미지와 영상과의 상호작용을 지원하는 시스템의 멀티모달 기능을 추구하는 데 관심이 있습니다.

NVIDIA NeMo를 통해 엔터프라이즈 데이터에서 맞춤형 LLM을 생성 및 훈련

에너지 산업에 맞게 조정한 도메인별 LLM의 더 높은 정확도를 달성하기 위해 Shell은 고품질 훈련 데이터를 큐레이션하여 AI 솔루션의 기반으로 삼는 데 주력했습니다. 개발 프로세스는 방대한 화학 문서 데이터세트를 큐레이션하고 사전 처리하는 것으로 시작되었습니다. 처음에 Shell은 수십 년간 수집한 300,000건의 기술 문서에 액세스할 수 있었습니다. 이 문서는 다양한 기술 분야를 아우르며 NVIDIA NeMo Curator를 사용하여 154,000개의 고품질 문서로 큐레이션되었습니다.

큐레이션 프로세스에는 반복되거나 중복에 가까운 콘텐츠를 제거하기 위한 정확한 중복 및 퍼지 중복을 포함한 여러 단계가 포함됩니다. 또한 Shell은 품질 필터을 적용하고, 정보가 불충분하거나 형식이 잘못된 문서를 제거하며, 언어 감지 기능을 사용하여 영어가 아닌 콘텐츠를 배제합니다. 또한, 도메인 분류가 도메인별 벤치마크를 구축하기 위한 문서를 선택하는 데 사용되었습니다.

데이터세트를 큐레이션한 후 Shell은 검색 증강 생성(RAG)의 성능을 극대화하는 것 외에도 NVIDIA NeMo 프레임워크를 사용하여 도메인 적응형 사전 훈련(DAPT)과 감독 Fine-tuning(SFT)을 수행하여 모델의 도메인별 지식과 정확도를 개선했습니다. DAPT는 모델이 화학 산업의 고유한 맥락과 용어를 정확히 이해할 수 있도록 지원합니다. 동시에 SFT는 Shell의 요구에 해당한 라벨 데이터로 모델을 훈련하여 모델의 성능을 더욱 개선했습니다. NeMo에서 제공되는 병렬 처리 기술을 활용하여 Shell은 다른 오픈소스 프레임워크에 비해 모델 훈련 시간(수백만 GPU 시간)을 20% 단축했습니다.

도메인 적응형 AI로 엔터프라이즈 워크플로우를 혁신하여 생산성 향상

표준 언어 모델은 사용자 쿼리를 잘못 해석하고 도메인별 인사이트 대신 광범위한 일반 정보와 상호 작용을 수행하기 때문에 RAG는 엔터프라이즈 지식 소스에서 정확한 정보를 검색하는 것이 어려울 수 있습니다. LLM을 업계별 언어에 맞게 조정하면 이러한 격차를 해소하고 답변 정확도와 대화 품질을 향상시키는 데 도움이 됩니다. 이러한 정밀도 필요성으로 인해 Shell은 LLM을 맞춤화하기 위한 시장 제품에서는 제공되지 않는 자체 기능을 개발하여 회사와 NVIDIA와의 협력을 주도했습니다.

Shell이 개발한 AI 기반 챗봇을 통해 기술 담당 직원은 세부적인 화학 문서와 데이터에 빠르게 액세스할 수 있어 작업에 필요한 시간을 단축하고 오류 위험을 줄일 수 있습니다. 지식 검색을 간소화함으로써 AI 챗봇은 R&D 분야에서 인사이트를 얻고 의사 결정을 내릴 수 있도록 개선하여 혁신과 운영 효율성을 모두 지원합니다.

또한 향상된 정보 검색 기능 외에도 맞춤형 LLM은 기술 문서 분석에 활용되어 부서 전반의 워크플로우를 간소화할 수 있습니다.

Shell은 실제 상호 작용을 통해 모델을 지속적으로 개선함으로써 AI 에코시스템을 적응형 인텔리전스 계층으로 포지셔닝하여 기업 지식 관리를 동적이고 접근 가능한 리소스로 전환하고 있습니다.

성공을 기반으로 구축: Shell AI 챗봇의 향후 개선 사항

Shell은 향후 훈련 데이터세트를 확장하고 더 다양하고 까다로운 평가 작업을 개발하여 도메인 적응형 LLM의 기능을 더욱 개선할 예정입니다. 텍스트 투 텍스트 모델을 개선하는 것과 함께 AI 챗봇의 멀티모달 기능을 활용하는 것이 사명입니다. 이를 통해 챗봇은 이미지와 영상을 포함한 다양한 유형의 데이터를 다루고 처리할 수 있습니다.

멀티모달 기능을 추가하면 더 포괄적이고 문맥에 맞는 정보가 제공될 것으로 예상되며, 이는 반복되는 의사 결정 프로세스에서 특히 유용할 수 있습니다.

이러한 개선 사항은 생산성과 운영 효율성을 더욱 향상시킬 것으로 예상되며, 시장 선도적인 고급 AI 기술을 활용하여 운영 이익을 얻으려는 Shell의 약속을 공고히 합니다.

NVIDIA NeMo를 사용하여 멀티모달 생성형 및 에이전틱 AI 애플리케이션을 구축, 맞춤화, 배포하세요.