美国加利福尼亚州圣克拉拉 — GTC — 太平洋时间 2022 年 9 月 20 日 — NVIDIA 于今日宣布与麻省理工学院和哈佛大学旗下的博德研究所(The Broad Institute)合作,为 Terra 云平台提供快速分析海量医疗数据所需的 AI 和加速工具。这将惠及该平台的 25000 多名用户,这些用户包括来自学术界、初创企业和大型制药公司的生物医学研究人员。
此次合作旨在将 NVIDIA 在 AI 领域的专长和医疗计算平台与博德研究所的全球知名研究人员、科学家和开放平台建立连接,重点关注三大关键领域:
美国加利福尼亚州圣克拉拉 — GTC — 太平洋时间 2022 年 9 月 20 日 — NVIDIA 于今日宣布与麻省理工学院和哈佛大学旗下的博德研究所(The Broad Institute)合作,为 Terra 云平台提供快速分析海量医疗数据所需的 AI 和加速工具。这将惠及该平台的 25000 多名用户,这些用户包括来自学术界、初创企业和大型制药公司的生物医学研究人员。
此次合作旨在将 NVIDIA 在 AI 领域的专长和医疗计算平台与博德研究所的全球知名研究人员、科学家和开放平台建立连接,重点关注三大关键领域:
- 在 Terra 平台上提供 NVIDIA Clara™ Parabricks®:Parabricks 是一款用于测序数据二级分析的 GPU 加速软件套件,现可用于六个新的 Terra 工作流。用户现在可以使用 Clara Parabricks,在一个多小时内完成全基因组的分析,而在基于 CPU 的环境中这项工作需要 24 个小时才能完成,并且,使用 Parabricks 计算成本降低一半以上。
- 构建大型语言模型(LLM):为深入探究人类生物学,研究人员将使用今日发布的用于生物学 LLM 模型的 AI 应用框架——NVIDIA BioNeMo,来开发 DNA 和 RNA (生命的“基础构件”)的基础模型。
- 为基因组分析工具包(GATK)带来更加强大的深度学习:NVIDIA 正致力于为 10 多万名研究人员所使用的行业标准工具——博德研究所的 GATK 工具包打造新的深度学习模型,帮助研究人员识别与疾病相关的基因变异。这将助力新药研发人员研究新的疗法。
NVIDIA 医疗业务副总裁 Kimberly Powell 表示: “整个医疗生态系统都需要更先进的计算工具,以便我们在理解疾病、发展诊断学和提供治疗方案的方面取得突破。通过扩大与博德研究所的合作,我们可以发挥大型语言模型的力量,最终提供联合解决方案,让研究人员的深入洞察能够真正地造福患者。”
博德研究所希望通过提供一个开放的云平台,将研究人员相互联系起来,并将研究人员与其实现科学突破所需的数据集和工具连接起来,从而实现新一代生物医学合作研究。
博德研究所首席数据官 Anthony Philippakis 表示:“生命科学领域正处于一场数据革命之中,研究人员迫切需要一种将机器学习引入生物医学的新方法。我们希望通过此次合作,进一步践行‘数据共享与合作流程’的使命,进而扩展基因组学研究。”
用于疾病研究的大型语言模型
NVIDIA的BioNeMo 框架包含蛋白质和化学领域的预训练 LLM 模型,可简化训练、推理和扩展。BioNeMo 是 NVIDIA NeMo Megatron 框架针对化学、蛋白质和 DNA/RNA 序列领域的扩展。
通过 BioNeMo,开发者能够有效地训练和部署具有数十亿参数的生物学 LLM 模型。
双方团队将基于此次合作,共同创建新的模型,将其添加至 BioNeMo 集合中,并在 Terra 平台上提供。
用于特定领域 AI 的 NVIDIA 软件
NVIDIA Parabricks GPU 加速的工作流为研究人员提供更快的周转时间和更低的成本,以进行广泛的基因组数据分析。在博德研究所的 GATK 最佳实践——生殖细胞突变检测分析流中,Parabricks 在 GPU 上进行分析的速度提高了 24 倍,而成本减半。
博德研究所的研究人员还能够访问用于医学影像 AI 的开源深度学习框架——MONAI 以及用于加快数据准备工作的 GPU 加速数据科学工具包——NVIDIA RAPIDS™。后者可用于基因组单细胞分析。
- 在 Terra 平台上提供 NVIDIA Clara™ Parabricks®:Parabricks 是一款用于测序数据二级分析的 GPU 加速软件套件,现可用于六个新的 Terra 工作流。用户现在可以使用 Clara Parabricks,在一个多小时内完成全基因组的分析,而在基于 CPU 的环境中这项工作需要 24 个小时才能完成,并且,使用 Parabricks 计算成本降低一半以上。
- 构建大型语言模型(LLM):为深入探究人类生物学,研究人员将使用今日发布的用于生物学 LLM 模型的 AI 应用框架——NVIDIA BioNeMo,来开发 DNA 和 RNA (生命的“基础构件”)的基础模型。
- 为基因组分析工具包(GATK)带来更加强大的深度学习:NVIDIA 正致力于为 10 多万名研究人员所使用的行业标准工具——博德研究所的 GATK 工具包打造新的深度学习模型,帮助研究人员识别与疾病相关的基因变异。这将助力新药研发人员研究新的疗法。
NVIDIA 医疗业务副总裁 Kimberly Powell 表示: “整个医疗生态系统都需要更先进的计算工具,以便我们在理解疾病、发展诊断学和提供治疗方案的方面取得突破。通过扩大与博德研究所的合作,我们可以发挥大型语言模型的力量,最终提供联合解决方案,让研究人员的深入洞察能够真正地造福患者。”
博德研究所希望通过提供一个开放的云平台,将研究人员相互联系起来,并将研究人员与其实现科学突破所需的数据集和工具连接起来,从而实现新一代生物医学合作研究。
博德研究所首席数据官 Anthony Philippakis 表示:“生命科学领域正处于一场数据革命之中,研究人员迫切需要一种将机器学习引入生物医学的新方法。我们希望通过此次合作,进一步践行‘数据共享与合作流程’的使命,进而扩展基因组学研究。”
用于疾病研究的大型语言模型
NVIDIA的BioNeMo 框架包含蛋白质和化学领域的预训练 LLM 模型,可简化训练、推理和扩展。BioNeMo 是 NVIDIA NeMo Megatron 框架针对化学、蛋白质和 DNA/RNA 序列领域的扩展。
通过 BioNeMo,开发者能够有效地训练和部署具有数十亿参数的生物学 LLM 模型。
双方团队将基于此次合作,共同创建新的模型,将其添加至 BioNeMo 集合中,并在 Terra 平台上提供。
用于特定领域 AI 的 NVIDIA 软件
NVIDIA Parabricks GPU 加速的工作流为研究人员提供更快的周转时间和更低的成本,以进行广泛的基因组数据分析。在博德研究所的 GATK 最佳实践——生殖细胞突变检测分析流中,Parabricks 在 GPU 上进行分析的速度提高了 24 倍,而成本减半。
博德研究所的研究人员还能够访问用于医学影像 AI 的开源深度学习框架——MONAI 以及用于加快数据准备工作的 GPU 加速数据科学工具包——NVIDIA RAPIDS™。后者可用于基因组单细胞分析。
相关文章