长久以来,人类一直想通过超级计算机来探索宇宙万物的复杂奥秘。早在1979年发布的经典科幻小说《银河系漫游指南》中,作者创造性将超级计算机的使命定义为“找出关于生命、宇宙和万物终极问题的答案”,时至今日,超级计算机已经作为基础科学发展和产业创新的底座型研究基础设施,成为全球强国之间竞争的科技创新焦点。
一提到超级计算机,人们往往都会联想到在“全球超级计算机Top500榜单”上赫赫有名的那些国宝级的超算,例如现阶段“全球最快的超级计算机”美国Frontier,或者是曾连续4年占据Top500榜首的中国超算“天河二号”和“神威·太湖之光”等。
超级计算机Frontier 图片来源:维基百科
全球超级计算机Top500榜单是什么?这个排名的评估标准是什么?
全球超级计算机Top500榜单是由全球Top500组织评选出来的“世界上最快的500台超级计算机的排行榜”(对于那些提交结果进行排名的超级计算机来说),它是目前全世界最权威的超级计算机排名榜,从1993年起每年更新两次最新的排名结果,截至2023年底已经更新了62期。
Top500榜单主要的排名依据是超级计算机基准程序Linpack的实测值,考验的是超级计算机的持续速度(Rmax),而不是峰值速度(Rpeak)。这两者之间有什么区别?为什么要用持续速度而不是峰值速度来排名呢?
这是因为超级计算机的峰值速度是所有微处理器峰值性能累计而成的理论性能,是设计时追求的理想值,但由于超级计算机体系结构多种多样,研制水平参差不齐,应用类型不尽相同,其持续速度与峰值速度的差距也就表现得千差万别,这就需要找到一把公认的、客观的、标准的“尺子”,来衡量超级计算机的实际性能。Linpack基准测试程序就是这样一把“尺子”。通俗地讲,就是看谁求解一元N次稠密线性代数方程组的速度更快,最终归结为每秒多少个双精度浮点运算的持续速度。
媒体通常也是从这一评估指标来进行报道,例如在2023年发布的第62届全球超级计算机TOP500排行榜中,美国Frontier以1.194 EFlop/s(每秒百亿亿次浮点运算)的持续速度继续保持领先地位,中国最强的超算神威·太湖之光则以93.01 PFlop/s(接近每秒十亿亿次浮点运算)排到第11位。
不过值得一提的是,由于超级计算机Top500榜单评选时采用了纯粹的运算规模性能指标,这就导致如果只是单纯地以这个榜单为尊,就会错失掉一些其它维度的衡量指标,比如超算的运营功耗大小,又比如超算在解决落地的科研和产业问题时发挥的实际推动作用等。而有时,这些被人们习惯性忽视的维度反而会比单纯运算规模大小更加决定一个国家的整体超算技术应用实力。
这里就不得不提到,除了全球超算Top500榜单所展示的Frontier和神威·太湖之光等顶级通用超级计算机之外,其实还存在一类致力于解决特定问题的专用超级计算机,这是一种专门针对解决特定问题而定制开发的超级计算机,与通用超算采取的CPU、GPU等通用芯片架构不同,专用超算通常会采用ASIC专用芯片架构,来解决CPU和GPU等通用芯片在特定场景下无法满足的算力性能和功耗的问题。
在专用超级计算机领域,美国D. E. Shaw研究所推出的分子动力学专用超级计算机安腾(Anton)最为知名。安腾超级计算机(Anton)专门被设计用于加速分子动力学模拟算法,这是一种对生命科学研究和生物制药研发具有至关重要意义的研究算法。由于安腾超算采用的是ASIC专用芯片架构,所以它只能被用于运行分子动力学模拟算法,甚至都不一定能跑Linpack基准测试运行程序(这可能也是为什么它不去参加全球超算Top500的角逐)。但是,在运行针对分子动力学问题的计算任务时,安腾超算的实测计算效率居然比全球最强超算Frontier还要快近50倍以上,这就是安腾超算通过牺牲了通用性换来的恐怖性能加速。
得益于安腾超级计算机带来的革命性的性能突破,美国成功破解了数十年来一直存在的分子动力学模拟计算的效率难题。自上世纪七八十年代起,由于计算效率限制,分子动力学模拟始终难以跳脱出学术研究的范畴,真正实现规模化的工业产业化应用。比如,人体内的典型大分子蛋白质,通常包含数十万至数百万个原子。若尝试通过分子动力学模拟技术来描绘一个拥有100万个原子的蛋白质在0.001秒内的动态过程,即使运用1000颗主流CPU进行并行运算,其计算所需时间也将超过一个世纪之久。但如今,依靠安腾超算的性能,仅需短短10天即可完成相同任务。
例如,美国制药公司Relay巧妙运用安腾超算第二代(Anton2)进行药物靶点及小分子药物结构的分子动力学模拟筛选,结合实验与计算双管齐下,仅用18个月、不足1亿美元就确认了RLY-4008等药物的结构设计,此举颠覆了传统新药研发的认知——以往认为一款新药的研发周期至少需要10年且投入高达10亿美元。这种快速、低成本的成功案例,在医药界引起了巨大的轰动。
数据显示,最新的安腾超算执行分子动力学模拟的速度比现有通用超级计算机快1000倍以上,也就是说,过去1年才能算完的计算任务,安腾超算只需要不到9个小时就可算完。
我们看到,业内大大有名的安腾超算从来没有出现在Top500榜单上,但是,从分子动力学模拟的计算效率来看,它又完全碾压了传统超算的性能,它也毫无悬念地摘得被誉为超算界诺比尔奖的戈登·贝尔奖。这就有点像我们讨论国内大学排名时,正常人肯定都会想到清华北大,但是如果今天有人对载人航天、探月工程更感兴趣,其实选北航才是更合适的,这就所谓术业有专攻。
几十年来,国外科技、医药各个圈子一直以来靠做标准、做榜单来在全球范围内树立权威和掌握话语权,Top500榜单也是如此。我们是否可以跳出Top500榜单设定的框架,在投入通用超算的基础上也发力专用超算,进行特定问题特定攻坚,在超算领域实现全面开花,既有超算界的“清华北大”也有“北航”。