NVIDIA发布大型语言模型和生成式AI服务以推动生命科学研发
作为NVIDIA AI Foundations的一部分,全新BioNeMo云服务加速生命科学研究、药物研发和蛋白质工程
加利福尼亚州圣克拉拉 – GTC - 太平洋时间2023年3月21日 – NVIDIA今日推出一整套用于自定义AI基础模型的生成式AI云服务。这些服务将加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学等领域的研究。
作为NVIDIA AI Foundations的一部分,用于AI模型训练和推理的全新BioNeMo™ 云服务产品能够加速药物研发过程中最耗时、费用最高的阶段。研究人员能够依靠它在自己的专有数据上对生成式AI应用进行微调,并可以直接通过网络浏览器或者全新云应用编程接口(API)运行AI模型推理,并轻松集成到现有应用中。
NVIDIA医疗业务副总裁Kimberly Powell表示:“生成式AI的革命性力量为生命科学和制药行业开辟了巨大的前景。NVIDIA与该领域先锋企业的长期合作,推动了BioNeMo 云服务的发展。这项服务现在已经被当作一个AI药物研发实验室,它可提供预训练模型,并使用专有数据自定义服务于药物研发流程各阶段的模型。这能够帮助研究人员识别正确的靶向目标、设计分子和蛋白质并预测它们在人体内的相互作用,从而研发出最佳的候选药物。”
早期用户——安进
世界领先的生物技术公司安进(Amgen)已经在使用这项服务推进其研发工作。
安进数字创新研究加速中心、生物治疗研发部执行总监Peter Grandsard表示:“BioNeMo大大加快了我们的生物制剂研发流程。凭借这项服务,我们可以在安进的专有数据上预训练用于分子生物的大型语言模型,使我们能够探索和研发出新一代药物中的治疗性蛋白质来帮助治疗患者。”
生成式AI大幅加快药物研发流程
BioNeMo 云服务包含预训练的AI模型,以帮助研究人员建立AI药物研发流程。该服务已被包括Evozyne和Insilico Medicine在内的药物研发企业用于支持数据驱动的新候选治疗药物的设计。
生成式AI模型能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA和RNA序列的大型数据集上进行训练后,可以预测蛋白质的3D结构和分子与目标蛋白质对接的程度。
新的生成式AI模型在BioNeMo Service上提供早期访问
除了之前公布的MegaMolBART生成式化学模型、ESM1nv蛋白质语言模型和OpenFold蛋白质结构预测模型之外,BioNeMo现在又加入了6个经过优化的全新开源模型,包括:
AlphaFold2:DeepMind开发的一个深度学习模型,其能够将确定蛋白质结构所需的时间从几年缩短到几分钟甚至几秒,仅需要使用蛋白质的氨基酸序列。该模型已经被100多万研究人员使用。
DiffDock:为了帮助研究人员了解药物分子如何与目标蛋白结合,该模型以高精度和高计算效率预测小分子的3D方位和锚定反应。
ESMFold:这个蛋白质结构预测模型使用Meta AI的ESM2蛋白质语言模型,可以基于单个氨基酸序列来预测蛋白质的3D结构,而不需要类似序列的样本。
ESM2:该蛋白质语言模型用于推理蛋白质的机器表示,对蛋白质结构预测、属性预测和分子对接等下游任务很有用处。
MoFlow:用于分子优化和小分子生成,这个生成化学模型重新创建分子,提出潜在治疗药物的各种化学结构。
ProtGPT-2:这个语言模型生成新的蛋白质序列,帮助研究人员设计具有独特结构、属性和功能的蛋白质。
BioNeMo 服务使用户可以通过一个浏览器界面轻松访问这些生成式AI模型,进行互动推理并实现蛋白质结构的可视化。研究人员将BioNeMo与NVIDIA DGX Cloud™上的超级计算资源组合后,就可以在使用NVIDIA Base Command™ 平台和NVIDIA AI Enterprise软件套件的全托管软件服务上自定义他们的模型。
制药公司和初创企业利用BioNeMo优化AI工作流程
制药公司和药物研发初创企业正在使用BioNeMo并且多次取得显著的成果。
安进使用其专有的抗体专利数据对 BioNeMo 的 ESM 模型架构进行了预训练和微调。该公司将在DGX Cloud上训练五个用于分子筛选和优化的自定义模型所需要的时间从三个月缩短到几周。
芝加哥生物技术公司兼NVIDIA初创加速计划成员Evozyne的研究人员与NVIDIA联合开发了一个基于 BioNeMo 的深度学习模型——Protein Transformer Variational AutoEncoder。这个生成式AI模型在Evozyne专有的蛋白质数据上进行了微调,研究人员用它可设计出性能明显高于自然界中的酶的合成变体。
NVIDIA 初创加速计划高级成员Insilico Medicine正在使用BioNeMo加速早期药物研发流程。该流程在过去需要花费四年多的时间,成本约5亿美元。Insilico使用了端到端的生成式AI,只用了三分之一的时间和十分之一的成本就能识别出一种临床前候选药物。该药物预计很快将进入二期患者临床试验阶段。
申请抢先体验BioNeMo。
在GTC上了解AI和医疗行业的最新进展,包括安进演讲者主持的三场分会、Evozyne演讲者主持的一场分会和DeepMind演讲者主持的另一场关于AlphaFold的分会。本届GTC将在线上举办并持续到3月23日(星期四)。