以轉換器為基礎的大型語言模型,為即時探索化學世界創造全新可能性。BioNeMo 是一個特定領域的框架,可在 NeMo Megatron 上以超級運算規模訓練和部署生物分子 LLM。它包含 MegaMolBART、ESM-1b 和 ProtT5 的轉換器模型。
MegaMolBART是一種以 14 億個分子 (SMILES 字串) 訓練的生成化學模型,可用於藥物研發中的各種化學資訊應用程式。例如,反應預測、分子優化,以及產生小分子的去 novo 分子。
已證明 ProtT5 和 ESM-1b 等非監督式預先訓練可用於產生具有屬性的學習內嵌,以預測蛋白質結構、函數、細胞位置、水溶性、膜邊界、保存和變數區域等。