NVIDIA 和 Evozyne 创建用于生成蛋白质的生成式 AI 模型

发布时间:2023-01-13  

科学家使用 NVIDIA BioNeMo 创建出能够生成高质量蛋白质的大型语言模型,以此加快药物研发并助力创造更具可持续性的环境。

 

2023 年 1 月 12 日 - 摩根大通医疗健康大会 - 初创企业 Evozyne 使用 NVIDIA 提供的预训练 AI 模型,创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。


image.png


今日发布的一篇联合论文描述了这一过程及产出的蛋白质氨基酸序列。其中一种蛋白质用于治疗一种先天性疾病,另一种用于消耗二氧化碳以减少全球变暖。


初步研究结果展示了一种加速药物研发的新方法。


Evozyne 联合创始人、论文共同作者 Andrew Ferguson 表示: “令人欣喜的是,这个 AI 模型第一轮产出的合成蛋白质就像自然生成的蛋白质一样,表示该模型已经学会了自然界的设计规则。”


革命性的AI模型


Evozyne使用了NVIDIA的ProtT5。ProtT5是一个Transformer模型,是用于创建医疗AI模型的软件框架和服务——NVIDIA BioNeMo的一部分。


分子工程师 Ferguson 的研究领域涵盖化学和机器学习领域,他表示:“BioNeMo 非常强大,让我们能够训练模型,然后以非常低的成本使用该模型来运行工作任务,在几秒钟内就能生成数百万个序列。”


该模型是 Evovyne ProT-VAE 流程的核心。ProT-VAE 是一个工作流,其将 BioNeMo 与作为过滤器的变分自编码器(VAE)相结合。


他表示:“几年前,还没有人注意到可以使用大型语言模型与变分自编码器相结合的方式来设计蛋白质。”


让模型向大自然学习


就如同人读万卷书,NVIDIA 的 Transformer 模型会读取数百万种蛋白质中的氨基酸序列。该模型运用神经网络用来理解文本的技术,学会了大自然如何构建蛋白质氨基酸序列。


然后,该模型预测了如何组装出能够满足 Evozyne 需求的新蛋白质。


他表示:“这项技术正在助力我们开展工作,以实现十年前无法实现的梦想。”


无限的可能性


机器学习有助于研究海量可能的氨基酸组合,然后有效地识别最有用的序列。


传统的蛋白质工程设计方法,即定向进化,采用的是一种缓慢、无计划的方法,通常一次只改变几个氨基酸的序列。


 image.png

vozyne的ProT-VAE流程采用了NVIDIA BioNeMo中强大的Transformer模型,生成有用的蛋白质,进而助力药物研发和能源领域实现可持续性。


相比之下,Evozyne 的方法只通过一轮,就能改变一个蛋白质中半数乃至以上的氨基酸。这相当于进行了数百次的突变。


他表示:“我们正在实现技术上的飞跃,这使我们能够探索以前从未见过的、具有有用的新功能的蛋白质。”


Evozyne计划使用新的工艺来构建各种能够对抗疾病和气候变化的蛋白质。


缩短训练时间,扩大模型规模


Ferguson表示:“NVIDIA 在此方面是一家非常出色的合作伙伴。”


Evozyne 数据科学家Joshua Moller表示: “他们通过将工作扩展到多个 GPU 来加快训练速度。


这将训练大型 AI 模型的时间从几个月缩短到一个星期。Ferguson 表示:“所以我们能够训练出原本不可能训练出的模型,比如一些有数十亿可训练参数的模型。”


未来将更加令人期待


使用 AI 加速蛋白质工程的前景十分广阔。


Ferguson 注意到了扩散模型近期的发展: “这个领域的发展速度快得令人难以置信,我真的很期待日后的进一步发展。”


“没人知道我们五年后将能够走多远。”


报名参加 NVIDIA BioNeMo 抢先体验计划,了解其如何加速您的应用。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    距离开发下一代细胞疗法又近了一步。 传统的细胞疗法,例如破坏癌细胞或促进损伤后组织再生的方法,需要时间让蛋白质表达和降解,并在此过程中消耗细胞能量。 科学家们此次设计直接产生所需作用的蛋白质,基于蛋白质的......
    开发出一款新的人工智能(AI)工具ProGen,其能从头开始设计出已被证明有效的抗菌蛋白质,最新方法有望用于研制新药。蛋白质由氨基酸链组成,这些氨基酸的顺序决定了蛋白质的形状和功能。在最新研究中,加州......
    开发出一款新的人工智能(AI)工具ProGen,其能从头开始设计出已被证明有效的抗菌蛋白质,最新方法有望用于研制新药。 蛋白质由氨基酸链组成,这些氨基酸的顺序决定了蛋白质的形状和功能。在最新研究中,加州......
    能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA和RNA序列的大型数据集上进行训练后,可以预测蛋白质的3D结构和分子与目标蛋白质......
    Medicine在内的药物研发企业用于支持数据驱动的新候选治疗药物的设计。 生成式AI模型能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA......
    结构预测AI工具RoseTTAFold。RoseTTAFold基于深度学习算法,能够快速且准确地预测蛋白质的三维结构,它通过分析氨基酸序列中的模式来预测蛋白质的折叠方式,对生物学、化学及药物设计领域产生......
    NVIDIA 和 Evozyne 创建用于生成蛋白质的生成式 AI 模型;科学家使用 NVIDIA BioNeMo 创建出能够生成高质量蛋白质的大型语言模型,以此......
    果中含有较多的鞣酸,如果吃完海产品后,马上吃水果,不但影响人体对蛋白质的吸收,海鲜 中的钙还会与水果中的鞣酸相结合,形成难溶的钙,会对胃肠道产生刺激,甚至引起腹痛、恶心、呕吐等症状。最好间隔2小时以上再吃。 5......
    性纤维化跨膜电导调节因子(右)等蛋白质的功能。 图片来源:“深度思维”公司 几乎每个人出生时都携带有50—100个父母没有的突变,这导致了个体之间巨大的基因差异。对医生来说,对某......
    ,通过显微镜研究基本原理,并观察细胞过程中的蛋白质本身发生了什么。他们还可记录电子活动,通过巧妙的电路设计了解蛋白质的功能。 研究人员称,这是利用跨膜蛋白的无细胞合成生物传感器的第一个范例。他们将不必在细胞中生长蛋白质......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>