NVIDIA BioNeMo サービス

AI を活用したエンドツーエンドの創薬パイプライン。

BioNeMo とは?

BioNeMo は NVIDIA NeMo Megatron をベースに開発された、AI を活用する創薬クラウド サービスで、スーパーコンピューティング規模で大型の生体分子トランスフォーマー AI モデルをトレーニングし、デプロイします。このサービスには学習済みの大規模言語モデル (LLM) が含まれるほか、タンパク質、DNA、RNA、化学物質の一般的なファイル形式をサポートし、データ ローダーとして分子構造用の SMILES と、アミノ酸およびヌクレオチド配列用の FASTA に対応しています。BioNeMo フレームワークはダウンロードすれば、お使いのインフラストラクチャで実行することもできます。

関連製品
関連製品

特徴と利点

LLMs for Chemistry and Biology

化学と生物学のための学習済み LLM にアクセス

BioNeMo には、学習済みの LLM が 3 つ付属しています。 MegaMolBART は 14 億個の分子 (SMILES 文字列) でトレーニングされた生成化学モデルであり、さまざまな化学情報用途に利用できます。

ProtT5 と ESM1-85M は Transformer ベースのタンパク質言語モデルであり、タンパク質構造や特性予測などのタスクで学習済みの埋め込みを生成できます。

Supercoming for Inference

スーパーコンピューティング規模で推論を最適化

BioNeMo を使用すると、開発者は数兆のパラメーターを持つ LLM をデプロイできます。現在のタンパク質言語モデルには、膨大な化学空間で推論するためにスーパーコンピューティング インフラストラクチャを必要とする無数のパラメーターが含まれています。クラウドにはリソースを動的にスケーリングする機能があり、LLM 推論パイプラインはコンピューティング需要に応じて自動的に拡張されます。

Accelerates Drug Discovery Pipelines

AI 創薬パイプラインのすぐに使えるソリューションを利用

BioNeMo を利用すれば、UniRef50 や ZINC のデータベースの学習済みモデル、自動ダウンローダー、プリプロセッサを簡単に始めることができます。教師なし構造化学習により、さまざまなモデル、組み込み、出力を組み合わせてマルチモーダル データをまとめることができます。また、教師なし事前学習では、ラベル付きデータが不要になり、タンパク質の構造、機能、細胞の位置、水溶性、膜結合、保存領域、可変領域などを予測する学習済み埋め込み技術の生成が飛躍的に進みます。

登録して BioNeMo サービスに早期アクセスする