能源
Shell International Exploration and Production Inc. (Shell),全球能源產業的領導者,利用了 NVIDIA NeMo™ 來推動開發化學領域專業知識的自訂 AI 聊天機器人。這項創新解決方案有可能精簡搜尋流程、改善決策,並支援生產環境的研發,大幅提升員工生產力。
Shell
生成式人工智慧/大型語言模型 (LLM)
NVIDIA NeMo
NVIDIA NeMo Curator
NVIDIA NeMo 框架
Shell 可管理支援業務營運的大量複雜科學資料。快速存取準確的資訊,對於 Shell 研發組織而言至關重要。
除了資料管理,該公司同時致力於強化技術人員的日常活動與決策,確保團隊可高效擷取正確資訊,提升生產力和運營效率。
為了達成此目標,Shell 利用了 NVIDIA AI 來開發可理解 Shell 內部研究的自訂模型,最初著重於化學領域,並提供精確的情境感知回應。
Shell
為了使針對能源產業特定領域定制的大型語言模型 (LLM) 達到更高的準確度,Shell 著重於庋用高品質的訓練資料,作為 AI 解決方案的基礎。開發流程始於對大量化學文件資料集進行庋用和預處理。Shell 最初可存取數十年來收集的 30 萬份技術文件。 這些文件涵蓋各種技術領域,透過 NVIDIA NeMo Curator 庋用而來的 154,000 份高品質文件。
庋用過程涉及多個步驟,包括精確重複刪除和模糊重複刪除,以移除重複或幾近重複的內容。Shell 也採用品質篩選器,移除資訊不足或格式不當的文件,並運用語言偵測技術,排除非英文內容。 此外,領域分類則用於選擇文件,建立領域基準。
一旦資料集經過庋用,Shell 侷越檢索增強生成 (RAG) ,使用 NVIDIA NeMo 框架進行領域自適應預訓練 (DAPT) 和監督式微調 (SFT),強化模型的特定領域知識和準確度。 領域自適應預訓練 (DAPT) 可使模型得以真正理解化學產業的獨特情境與術語。 與此同時,監督式微調 (SFT) 會透過根據 Shell 的特定需求,標記資料來進行訓練,以進一步提升模型表現。Shell 利用透過 NeMo 提供的平行運算技術,與其他開源框架相比,將模型訓練時間(GPU 數百萬時數) 加速 20%。
從企業知識來源擷取準確資訊對檢索增強生成 (RAG) 而言是一項挑戰,因為標準語言模型往往會誤解使用者的查詢,並將其與廣泛的通用資訊相互對照,而非特定領域的見解。使大型語言模型 (LLM) 適應特定產業語言,有助於彌合此代溝,並提升答案準確度和對話品質。這種對精確度的需求促使 Shell 在開發市場上未具備的內部功能,可用於自訂大型語言模型 (LLM),進而促使與 NVIDIA 合作。
Shell 開發的 AI 驅動聊天機器人可讓技術人員快速存取詳細的化學文件和資料,縮短執行這些任務的所需時間,並降低錯誤風險。AI 聊天機器人精簡了知識檢索,可增強研發領域見解獲取和做出決策,支援創新和營運效率。
除了增強資料檢索外,自訂大型語言模型 (LLM) 也可用於技術文件分析,使工作流程更加精簡。
透過真實世界的互動不斷完善模型,Shell 將其 AI 生態系定位為自適應智慧層,將企業知識管理轉化為動態且可存取的資源。
展望未來,Shell 計劃透過拓展訓練資料集和開發更多樣且具有挑戰性的評估任務,進一步提升領域自適應的大型語言模型 (LLM) 功能。除了強化文本對文本模型,還能發揮 AI 聊天機器人的多模態功能。這將讓聊天機器人得以處理各種類型的資料,包括圖片和影片。
多型態功能的加入,預計將提供更全面且情境豐富的資訊,這對於複雜的決策流程而言尤具價值。
預計這些增強功將可進一步提升生產力和營運效率,鞏固 Shell 致力於運用市場領先的 AI 技術促進其營運的承諾。
利用 NVIDIA NeMo 建置、自訂並部署多型態生成式和代理式 AI 應用程式。