엔드 투 엔드 AI 기반 신약 개발 파이프라인입니다.
BioNeMo는 슈퍼컴퓨팅 규모의 대규모 생체 분자 트랜스포머 AI 모델을 트레이닝 및 배포하기 위해 NVIDIA NeMo Megatron에 구축된 AI 기반 신약 개발 클라우드 서비스입니다. 이 서비스에는 사전 학습된 대형 언어 모델(LLM)과 단백질, DNA, RNA 및 화학을 위한 일반적인 파일 형식 지원이 기본으로 포함되며, 분자 구조를 위한 SMILES와 아미노산 및 누클레오티드 서열을 위한 FASTA에 데이터 로더를 제공합니다. BioNeMo 프레임워크는 자체 인프라에서 실행하기 위해 다운로드할 수도 있습니다.
NeMo LLM
BioNeMo는 사전 학습된 LLM 3개가 함께 제공됩니다. MegaMolBART는 14억 개의 분자(SMILES 스트링)로 훈련된 생성적 화학 모델이며 다양한 화학 정보 애플리케이션에 사용될 수 있습니다.
ProtT5 및 ESM1-85M은 단백질 구조 및 특성 예측과 같은 작업을 위해 학습된 임베딩을 생성하는 데 사용할 수 있는 트랜스포머 기반 단백질 언어 모델입니다.
BioNeMo를 사용하면 개발자는 수십억 및 수조 개의 매개변수로 LLM을 배포할 수 있습니다. 오늘날의 단백질 언어 모델에는 방대한 화학 공간에서의 추론을 위해 슈퍼컴퓨팅 인프라가 필요한 수십억 개의 매개변수가 포함되어 있습니다. 클라우드에서 동적 리소스를 확장하면 LLM 추론 파이프라인이 자동으로 확장되어 컴퓨팅 요구 사항을 충족할 수 있습니다.
BioNeMo를 사용하면 UniRef50 및 ZINC 데이터베이스를 위한 사전 학습된 모델, 자동 다운로더 및 사전 프로세서를 쉽게 시작할 수 있습니다. 비지도 구조 학습 도구 덕분에 다양한 모델, 임베딩 및 출력을 결합하여 멀티모달 데이터를 통합할 수 있습니다. 비지도 사전 학습은 또한 라벨링된 데이터의 필요성을 제거하여 단백질 구조, 기능, 세포 위치, 수분 용출도, 세포 내 결합성, 보존 및 가변 영역 등을 예측하기 위한 학습된 임베딩 생성을 더 빨리 완료합니다.
BioNeMo 서비스에 대한 얼리 액세스를 신청하세요.