微软研究院刘铁岩:AI for Science:追求人类智能最光辉的一面|MEE

发布时间:2023-01-06  

过去一年里,  for Science技术成果集中爆发,在生物医药、材料、物理、化学、甚至数学上发挥出越来越重要的作用,不少学界、业内人士已经看到了在自然科学领域的巨大潜力。

本文引用地址:

for Science背后的价值到底有些什么?

带着这样的追问,微软研究院科学智能中心亚洲区负责人、微软亚洲研究院副院长 刘铁岩和其带领的团队,进行了不倦追寻。

去年,刘铁岩团队发布了用于分子模拟的 Graphormer模型。在MEET2023智能未来大会上,刘铁岩更是全面介绍了他对于AI4Science的理解,以及AI4Science如何作为科学发现的第五范式,和经验范式、理论范式、计算范式、数据驱动范式互相促进、水乳交融,共同推进科学研究的飞速发展。

为了完整体现刘铁岩的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。

关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2023大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。

演讲要点

  • 人工智能还没能反映出人类智能里最光辉的一面—— 认识世界和改造世界 。

  • AI for Science值得称为 第五范式 。

  • 利用AI手段更深一步的目的是修正对已有物理方程的理解,发现新的科学规律, 实现科学研究的闭环 。

  • AI for Science将会 对自然科学产生巨大影响 ,尤其在解释生命奥秘、以及保障环境可持续发展方面。

(以下为刘铁岩演讲全文)

AI for Science:第五范式

最近10年里,AI飞速发展,在很多任务上已经和人类媲美。而且近年来,以GPT-3、DALLE2为代表的大模型让人惊艳。

比如大家现在非常关注的ChatGPT,让我们觉得 通用人工智能离日常生活越来越近。但这些成果主要集中在感知和认知层面,并没有反映出人类智能里最光辉的一面,即认识世界和改造世界。

如果戴上科学的显微镜,就会发现我们之所以成为人类、成为生物,是亿万个细胞、甚至是更多微观粒子相互作用的结果;而如果戴 上科学的望远镜,就会发现我们人类不过是地球上百万物种之一、而地球在苍茫宇宙里也同样是不值一提的沧海一粟。

所以,无论是从微观还是宏观角度看,我们人类自身都是非常渺小的。我们 不应该让AI一味地模拟语音、视觉、语言等人类自身的基本技能,而是要让AI拥有和人类一样认识世界和改造世界的勇气和能力。而认识世界和改造世界正是千百年来,自然科学研究的终极目标。

我在微软的前同事Jim Gray曾经写过一本书,对科学发现四个基本范式做了深刻的总结。

第一个范式叫做 经验范式,基于经验的观察, 是天才科学家对万物万象的总结。比如著名的天文学家开普勒,他通过观察总结出天体运行的规律:“所有的行星围绕太阳运行的轨道都是椭圆的,太阳处在所有椭圆的公共焦点上”。

第二个范式是 理论范式,指数学家 对经验进行数学抽象和推演,比如用于描述经典力学的牛顿运动方程,用来描述电场磁场关系的麦克斯韦尔方程等。

第三个范式是 计算范式,随着计算机的发明,人们开始有能力 求解复杂的物理方程。比如,通过有限元或者有限差分方式求解流体方程,从而有助于人类对于天气预报进行精准预测。

第四个范式是 数据驱动的范式,这个过程中 ML(机器学习)扮演着非常重要的角色,人们使用ML方法来分析数据,寻找规律,并进行预测。

最近这几年,大家开始关注的一种新的范式,叫做 AI for Science,它是前四种范式的有机结合,发挥了经验和理论各自的特长,又把AI和计算科学融合在一起。AI for Science是对科学发现更全面的认知,因此我们称之为科学发现的 第五范式

为了更好地理解AI for Science,我们可以从如图的公式讲起。

第一、对于物理世界 (绿色的X),我们可以利用理论科学对它进行大体的描述,并且可以用AI的手段来加速这些理论方程的求解和推演。这对应了黄色的X(θ)表示的部分,可以看成AI版本的第三范式。

第二、我们需要承认,我们 在科学方面的知识仍然非常有限,已有的理论还不能完美解释所有的科学现象。换句话说,我们承认物理方程的解X(θ)和实际物理世界X之间存在残差ε,这个残差表达的是现有物理方程的边界,可以用实验手段观察,也可以为AI所利用,这就对应了第四范式。当然,这几年AI领域的新发展,比如RL (强化学习)、DL (深度学习)、大模型等等,会为第四范式提供新的加持。

第三、通过AI手段从数据出发,目的不仅仅是为了发掘一些特定的结果,也可以进一步帮助我们 修正对已有物理方程的理解, 丰富我们的科学知识,让我们有机会发现新的科学规律,这样就最终能够实现科学研究的闭环,这对应了AI版本的第一范式和第二范式。

接下来,我们就针对这三个方面进行更加深入的讨论,并介绍我们团队最新的研究成果。

形成科学发现的闭环

第一,如何用AI 求解物理方程?

传统数值解法求解物理方程的效率是一个瓶颈。近年来,人们开始利用AI模型来对物理方程进行更加高效的求解。AI模型的训练数据可以来源于传统的数值解法,而一旦训练成功,在求解新的方程的时候就可以 节省大量的时间

此外,近年来还出现了一种 physics informed training,甚至不需要提前生成训练数据,只需要在训练的过程中,动态验证AI模型的输出是否满足物理方程,定义损失函数即可,而验证方程比求解方程简单得多。

在这个方向上,我们团队有一些最新研究成果,如发表在NeurIPS 2021上的 Graphormer模型,和发表在国际期刊《流体物理》上的 Deep Vortex Net,分别在分子建模和气象模拟领域取得了国际领先的结果。

第二,如何用AI从科学数据中发掘有效信息?

各种实验设备每年都产生海量数据,但显然不能靠人工有效处理;还有每年都有近150万篇论文发表,但任何科学家都没有精力读完。

我和团队提出利用AI方法来自动分析高能粒子对撞的射流数据,在国际期刊《High-energy Physics》上提出了 LorentzNet模型,将洛伦兹等变性构建在模型之中,在新粒子发现领域取得了比前人显著提高的精度。

我们还利用科学文献训练了 SPT模型,对科学文献信息的科学知识进行抽取、总结、和预测。该模型近期在PubMed问答任务上首次达到了人类专家的水准。

第三,如何从实验数据出发,用AI发现新的物理方程,形成科学发现的闭环。

比如物理的守恒定律,一旦实验数据不满足守恒性,往往暗示着一些新物理规律的存在。我们团队设计了一个双通道的AI模型,包含 一个基于拉格朗日神经网络的守恒通路和 一个基于标准神经网络的非守恒通路,可精准地从实验数据中自发地学到很多已有规律。该工作发表在Physical Review上,受到了广泛关注。

我们相信AI for Science将会对自然科学产生巨大影响,尤其在解释生命奥秘以及保障环境可持续发展方面,都有很大的潜力。

沿着这两个方面,我们进行了很多探索,发表了一系列非常有意思的论文,如果大家感兴趣可以参考一下。

为了更好地推动AI for Science这个领域高速发展,今年7月,微软研究院在全球成立了一个新的研究机构,我们称之为 Microsoft Research AI4Science或者是 微软研究院科学智能中心。这个研究中心设立的目的就是利用AI对分子动力学模拟、流体力学模拟等重要的科学计算工具来进行颠覆式创新,从而推动人类关心的重大问题的求解。

非常荣幸,我作为这个中心的 创始成员之一,带着团队一起推动AI for Science的研究。我们也真诚地希望怀揣着科学梦想的同事们能够加入我们,一起探索科学的新边界!

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    反而是一件奢侈的事情。 在美国华盛顿州贝尔维尤的微软互联网部门大楼,陆奇的办公室在26层,沈向洋的办公室在24层。据一位在该大楼工作数年的中国工程师D向新浪科技确认,全部门的人都知道,陆奇每天6点就......
    国内移动网络 IPv6 的发展规模达到了一个标志性的阶段。 IPv6(Internet Protocol Version 6)即为互联网协议第 6 版,是互联网工程任务组(IETF)设计......
    国家超算互联网工作部署启动:加快构建超算生态!; 据 21ic 消息报道,本周在天津召开了国家超算互联网工作启动会,会上多位专家、高校/科研......
    情况下,大会从人工智能基础研究出发,推动人工智能更多的应用、更多的可能,在更多领域的落地。 中国工程院院士、鹏城实验室主任、CCF 会士、ACM、IEEE Fellow 高文在题为《城市大脑2.0......
    联合体工作会议全体合影 会上,43家超算互联网联合体成员授牌仪式顺利举行,联合体成员就超算互联网工作进展等情况进行了探讨,同时就“超算互联网白皮书”资料收集稿展开研讨。梅建平副司长在会中表示,为满......
    性的支持上述探测警报功能。 目前,该规范已作为互联网草案通过互联网工程任务组(IETF)提交。在征求建议期间,与谷歌将合作处理反馈,并将在2023年年底前发布滥用追踪警报规范的生产实践,相关实践将在未来的iOS与......
    电气开创性地将构网技术应用于柔性直流输电系统。渝鄂直流背靠背联网工程是世界上电压等级最高、输送容量最大的柔性直流背靠背输电工程,许继电气研制的构网型先进柔直控制设备在渝鄂联网工程南通道(施州换流站)投运,实现......
    着锤炼工业安全全栈可信能力的创新实践。 "铸网2022"工业互联网安全实网演练面向全国联网工业企业、工业互联网平台企业及标识解析企业,采用端口扫描、系统漏洞利用、账户暴力破解等手段,对目......
    省正紧抓粤港澳大湾区和深圳先行示范区“双区”建设的重大机遇,大力培育以新一代电子信息产业集群为代表的20个战略新兴产业集群,统筹推进制造业高质量发展六大工程,全力推动制造业数字化转型,加快布局5G、工业互联网......
    加速经济数字化转型进程中起到了不可替代的基础性作用。 2020年,我国在工业互联网、大数据中心、5G、人工智能等新基建重点领域投资规模约达1万亿元,其中大数据中心、5G基础设施、工业互联网、人工智能等投资规模分别约为52......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>