NVIDIA BioNeMo-Dienst

KI-gestützte End-to-End-Pipelines für die Arzneimittelforschung.

Was ist BioNeMo?

BioNeMo ist ein KI-gestützter Cloud-Dienst für die Arzneimittelforschung, der auf NVIDIA NeMo Megatron basiert und dem Training und der Bereitstellung großer biomolekularer Transformator-KI-Modelle im Supercomputing-Maßstab dient. Der Dienst umfasst vorab trainierte große Sprachmodelle (LLMs) und native Unterstützung für gängige Dateiformate für Proteine, DNA, RNA und Chemie, die Datenlader für SMILES für molekulare Strukturen und FASTA für Aminosäure- und Nukleotidsequenzen bereitstellen. Das BioNeMo-Framework steht auch zum Download zur Verfügung, sodass Sie es auf Ihrer eigenen Infrastruktur ausführen können.

Sehen Sie sich verwandte Produkte an.
Sehen Sie sich verwandte Produkte an.

Erkunden Sie die Leistungsmerkmale und Vorteile.

LLMs for Chemistry and Biology

Greifen Sie auf vorab trainierte LLMs für Chemie und Biologie zu.

BioNeMo umfasst drei vorab trainierte LLMs.  MegaMolBART ist ein generatives Chemiemodell, das auf Grundlage von 1,4 Milliarden Molekülen (SMILES-Zeichenfolgen) trainiert wurde und für eine Vielzahl von Cheminformatik-Anwendungen verwendet werden kann.

ProtT5 und ESM1-85M sind Transformator-basierte Proteinsprachenmodelle, die verwendet werden können, um gelernte Einbettungen für Aufgaben wie Proteinstruktur und Eigenschaftenvorhersage zu generieren.

Supercoming for Inference

Inferenz im Supercomputing-Maßstab optimieren.

BioNeMo ermöglicht Entwicklern die Bereitstellung von LLMs mit Milliarden und Billionen von Parametern. Die heutigen Proteinsprache-Modelle enthalten Milliarden von Parametern, die eine Supercomputing-Infrastruktur für die Inferenz auf dem riesigen chemischen Raum erfordern. Die dynamische Ressourcenskalierung in der Cloud ermöglicht es LLM-Inferenzpipelines, automatisch zu skalieren, um die Rechenanforderungen zu erfüllen.

Accelerates Drug Discovery Pipelines

Nutzen Sie eine schlüsselfertige Lösung für KI-Pipelines zur Arzneimittelforschung.

BioNeMo erleichtert den Einstieg mit vorab trainierten Modellen, automatischen Downloadern und Vorprozessoren für UniRef50- und ZINC-Datenbanken. Verschiedene Modelle, Einbettungen und Ausgaben können dank unüberwachten strukturierten Lernmodellen kombiniert werden, um multimodale Daten zusammenzuführen. Unbeaufsichtigtes Vorabtraining beseitigt auch den Bedarf an gekennzeichneten Daten, was die schnelle Generierung von gelernten Einbettungen für die Vorhersage von Proteinstruktur, Funktion, Zellposition, Wasserlöslichkeit, Membranbindung, konservierten und variablen Regionen und vielem mehr ermöglicht.

Melden Sie sich für das Early-Access-Programm für den BioNeMo-Dienst an