在服务器CPU市场,英特尔架构一枝独秀,市场份额已连续多年超过90%;POWER和SPARC虽然难挽下滑趋势,但在关键任务领域仍有用武之地;几乎已经退出历史舞台的Alpha架构得益于在中国超算“神威·太湖之光”中的大量应用,被注入了一支强心剂。
相比之下,数年前一度被寄予厚望、曾被视为数据中心低功耗变革动力的ARM架构却似乎慢慢淡出了我们的视线。然而,这并不代表它将在数据中心偃旗息鼓。时值2016年收尾和2017年开张之期,高通(Qualcomm)在ARM领域连番发力,让沉寂许久的ARM服务器阵营重鸣号角。
2016年11月18日,贵州华芯通半导体技术有限公司北京研发中心正式启用。“华芯通”是由贵州省人民政府与高通公司共同出资设立的合资企业,已经获得ARM v8-A 64位处理器架构授权。“华芯通”将通过引进、消化吸收、再创新,重点针对高端服务器芯片指令集CPU微结构、多核互连、SOC等关键技术开展攻关,开发适合中国市场的先进服务器芯片产品。
2016年12月7日,高通宣布全球首款10纳米服务器芯片Qualcomm Centriq 2400开始商用送样,预计2017下半年进入商用市场。作为Qualcomm Centriq系列的首款产品,Centriq 2400采用最先进的10纳米FinFET制程技术,最高可配置48个内核,其所搭载的Qualcomm Falkor CPU,是高通研发的定制化ARM v8内核,通过高度优化可实现高性能,低功耗,特别针对数据中心最常见的工作负载而设计。
高通如此高调地对服务器市场“送秋波”、“秀恩爱”,既吸引了从业者的视线,也不免引发疑问:众所周知,高通是移动芯片领域的顶尖厂商,但缘何它会选择这个时间点发力ARM服务器芯片市场呢?
ARM芯片是否还有“搞头”?
这个疑问的根源,离不开ARM架构在服务器市场曾有的戏剧性发展经历。
大概是2010年,在移动端如日中天的ARM阵营表现出了对于服务器和数据中心的野心。当时,数据中心能耗濒临上限,“大数据”已经露出了爪牙,数据中心迫切地希望找到一种能以较低的功耗来处理大量并行化、轻量化负载的方法,而ARM架构处理器所具备的多内核、高并行、低功耗的特性正好满足了数据中心的这种新需求。
于是,业内普遍认为,ARM芯片将成为数据中心新的“颠覆者”,前景一片光明。随后,Facebook等大型互联网厂商开始定制ARM服务器,Marvel、Cavium、Applied Micro Circuits、三星等芯片厂商纷纷加入ARM服务器芯片的研发,惠普等服务器厂商开始测试ARM服务器,而2012年x86服务器芯片老兵AMD宣布推出64位ARM服务器芯片,更是为ARM进军数据中心加上了助燃剂。
当时,分析师们曾经乐观地预测,到2019年,ARM服务器芯片出货量将占到总体市场的20%~25%。
然而,ARM的数据中心之路走得并不如预料中那样顺畅。2013年底,ARM服务器领域的先驱Calexda成为“先烈”,为ARM在数据中心的发展前景蒙上一层阴影。2016年,Applied Micro表示将出售ARM服务器业务;也有消息称博通也将结束ARM服务器计划;而曾经让人看好的AMD,又将重心转回了x86和GPU。
所以,回顾这几年ARM服务器芯片的发展历程,好似“一壶水被迅速烧热又逐渐冷却”,这种尴尬局面让人不得不对ARM服务器芯片的未来感到困惑。
再回到上面的问题,ARM服务器芯片还有“搞头”么?高通为何在有先驱屡屡失利、甚至成为“先烈”的情况下高调进军服务器和数据中心?高通ARM服务器芯片赖以生存的根基和底气又在哪里?
高通在打怎样的“小算盘”?
高通是一家精明的企业,否则无以成为移动芯片界的龙头企业。在我看来,高通选择在这个时间点高调入局,其根本原因在于看好ARM服务器芯片市场的复苏趋势和发展前景。
的确,ARM服务器市场正在复苏。尽管经历了几年的不温不火,ARM服务器芯片却在近两年,特别是2016年,迎来了一个重要的转折点。
过去几年中,ARM服务器芯片在市场、技术和生态环境方面尚不成熟,而今,不管是市场、技术还是生态方面,它都面临着近年来最佳的一个生长环境。
第一,先看市场。前文提过,ARM的优势在于多内核、高并行、低功耗,这样的能力非常适合数据中心的并行化、轻量化负载,如搜索、Web、CDN、冷存储等。但由于ARM服务器芯片发展过慢,而英特尔x86服务器芯片的能效比也在不断提升,数据中心对于ARM的需求已经不是那么强烈。
如今的市场和几年前已经不可同日而语。时下,互联网日趋繁荣,移动终端数量高速增长,物联网快速发展,云计算、大数据、移动、社交引领了新一轮的技术革命。在这些新趋势中,数据有集中也有分散,不论是贮藏了海量数据的大规模数据中心,还是分散在网络边缘的计算节点,都希望将每瓦特性能放在首位,更加注重空间和能耗的节约,用更少的成本从数据的流动中掘金。
同时,人工智能、深度学习、机器视觉计算等新兴应用负载的大热将异构计算推到了舞台中央,单一的CPU架构已经无法满足这些应用对于浮点计算能力、并行度、能效等方面的需求,于是,近年来CPU+GPGPU、CPU+FPGA等异构计算方式大行其道,其中,ARM+GPGPU、ARM+FPGA也因更具能效优势,被视为一种理想的异构计算方式。
在这些新兴应用和趋势中,单纯的英特尔架构方案已经不能完全让大型数据中心的用户满意,虽然英特尔CPU的能效比在不断提升,并且也具备Xeon Phi协处理器方案,但大型互联网用户更希望追求极致,将数据中心的能效做到更高。
于是,ARM又迎来了新的机会。2013年百度在其南京数据中心首次应用ARM服务器来支撑百度云服务,将TCO降低了25%,存储密度提升了70%。本月初,又有消息称,ARM将与阿里巴巴集团在数据中心业务方面展开合作,阿里巴巴将在自身数据中心的服务器上大量采用ARM架构低功耗CPU,以逐步替换英特尔产品。
第二,再看技术。过去几年中,ARM服务器芯片的绝对性能提升并不高,故而ARM服务器只能被应用于一些轻量化的场景中。
而新近亮相的高通Qualcomm Centriq 2400,则将ARM服务器芯片的规格提升到了一个新的台阶:集成高达48个内核,率先采用10nm工艺(领先于英特尔的14nm),内核经过高度优化,可同时实现高性能与低功耗,专门针对数据中心最常见的工作负载而设计。虽然高通没有公布Centriq的进一步细节,但从核心数量和工艺上来推测,Centriq在性能与功耗方面的综合表现将能够与英特尔的主流芯片一较高下,且很有可能也领先于AMD即将推出的Zen服务器芯片。
另一方面,ARM+GPGPU、ARM+FPGA等异构计算技术也在不断走向成熟,特别是在超算领域。此前,巴塞罗那超算中心就曾采用ARM+GPGPU的异构方式,富士通计划建造的百亿亿次超算也将引入ARM芯片,同样采用异构计算。今年10月,英特尔子公司Altera推出了新一代的Stratix 10 FPGA,其中就采用了四核ARM Cortex-A53处理器。
有趣的是,连英特尔都开始重新接受ARM架构,这足以说明ARM技术的诱人之处。
第三,最后看生态。由于缺少生态系统,特别是软件生态,ARM这些年来发展得不太顺利。而今,互联网的繁荣发展带动了开源生态的发展,也给ARM的软件生态带来了利好消息。
对此,Qualcomm产品管理副总裁乐美科(Americo Lemos)曾表示,软件过去大多是垂直的架构,而现在更多是使用开放源代码软件——这对Qualcomm来说是一件好事,因为入门的门槛变得非常低,不必再投资几十亿美金用于搭建软件架构。
他说:“就像x86系统原来做的那样。开放源代码软件的普及和应用降低了Qualcomm进入这一领域的门槛。”
所以,无论市场、技术还是生态,ARM进军数据中心已经处于一个“临界点”,高通在这个时间点高调入局,称得上是恰逢其时。
高通的底气何在?
不难预见,未来几年ARM架构在数据中心将大有用武之地,也将吸引更多的玩家加入,竞争也将趋于激烈。那么,对于高通而言,未来能否将在移动市场的优势延续到服务器和数据中心领域?我们不妨来简单分析一下。
Qualcomm负责数据中心技术业务的产品管理副总裁乐美科展示全球首款10纳米服务器芯片Qualcomm Centriq 2400
首先,从产品技术角度来看,高通在ARM技术上有着多年积累,过去一直是对ARM架构利用、对其性能发掘最为充分的厂商之一,有着成熟的生态系统。高通在制程工艺上一直领先,这是未来高通能够保持优势地位的一个重要保障。
此外,高通处理器的集成度一直很高,是SoC技术领域的王者。比如它能在移动芯片中集成通信模块、多媒体功能、3D图形功能和GPS引擎,而据外媒透露,高通服务器芯片上将集成以太网、加密和PCIe等功能模块,也将以SoC的形态出现,这也是当前服务器芯片的一个重要发展趋势。
关于高通ARM服务器芯片的持续创新力,也就是它的研发力量,乐美科曾经在接受中国媒体采访时表示,高通已经具备研发服务器芯片的专门团队,同时也吸引了一批非常优秀的与云相关的工程师。此前,高通还曾演示了Qualcomm Centriq 2400 处理器上运行基于 Linux 和 Java 的 Apache Spark 和 Hadoop,对于这两个当前最为流行的大数据处理平台,看来高通已经早已开始着手准备了。
对于高通进军服务器和数据中心市场的优势,乐美科曾经表现得非常乐观:“第一,Qualcomm是真正的SoC设计公司,也就是集成芯片设计公司;第二,我们有最领先的制程技术;第三,我们在这个生态系统中也建立了多年的合作关系,能使我们在这个领域取得成功。”
乐美科谈到的生态系统的关系,其实就是高通的第三大优势。早在高通研发ARM架构服务器芯片之初,它就已经收获了互联网数据中心巨头Facebook的支持,一直在后者的开放计算项目(OCP)中占有一席之地。
2015年时,高通又与Xilinx和Mellanox达成了合作,携手提升ARM服务器芯片与FPGA芯片及数据中心连接解决方案之间的兼容性,预计这项协作的成果有望在2018年面市。在2016年早些时候,高通还与IBM、ARM、Mellanox及Xilinx等厂商共同创建了CCIX联盟,开始更为积极地参与对数据中心专用加速器芯片的标准定义工作,以求能够让自己未来的ARM服务器芯片能与这些加速器组合为具有强大竞争力的异构计算方案。
虽然高通这几次出手,还只是它在服务器生态系统营建方面的部分举措,但一直关注硬件技术的权威网媒Anandtech已经给出了这样的评价:“这足以说明高通在非常认真地对待自己的服务器业务。”
高通的最后一个优势,就是稳稳接上了中国的地气,抓住了进入中国市场的先机。中国市场对ARM有着旺盛的需求,在国家自主发展的政策引领下,中国服务器、HPC等关键信息设备亟需实现国产化,开放的ARM架构是一个重点发展的对象。
实现高通这一战略的关键举措,就是在2016年1月17日高通与贵州省人民政府签署战略合作协议并为合资企业“贵州华芯通半导体技术有限公司”揭牌。根据协议,高通将向华芯通提供服务器芯片技术许可,并提供设计和技术支持。前文曾提及贵州华芯通半导体技术有限公司北京研发中心在同年11月18日正式启用的消息,正是高通和贵州在ARM架构服务器芯片领域通力合作所取得的一个重要进展。
在移动芯片领域,对于如何借助中国手机厂商扩大产业生态,高通已经是个中好手,看来这种经验同样有助于高通扩大服务器芯片的生态。与中国地方政府成立合资公司,不仅有助于华芯通利用高通的技术优势,更为灵活地定制开发,更快地推出适合中国市场的服务器芯片,推动中国自主创新;对于高通来说,面对前景一片大好的中国市场,以这种技术输出的形式能够更快地站稳脚跟,做大中国市场的“蛋糕”。
能否撼动英特尔王座?
从Facebook、阿里、百度等大型互联网公司纷纷对ARM抛出橄榄枝,能够看出英特尔在数据中心的“王座”已经不再那么牢靠。
在云计算、大数据、移动、社交、人工智能、物联网所带来的这场新技术革命中,数据中心正从少数厂商、单一架构、软硬件紧密耦合引领的创新,走向用户引领、多方响应、异构共荣、软件定义硬件的创新。而高通在其中扮演的,正是一个带来活力、创造多样化和更多协作机会的角色。
但是,从唯物辩证法上来看,外因固然重要,内因才是起决定性的因素。数据中心新趋势、市场新需求给每一个ARM架构玩家提供的机会都是均等的,能否抓住机会,更多靠的还是自身的修为。
对于ARM服务器和数据中心领域的“后来者”高通来说,ARM“先驱”和“先烈”们的经验教训很值得参考,其一是要加快产品研发的速度,毕竟英特尔也即将在2017年推出10nm制程工艺;其二是要快速建立生态圈,弥补ARM在软件和应用层面的短板;其三,自然是要找到关键的客户,有了成功案例的刺激和示范作用,才能让ARM架构服务器芯片获得更大的动力和加速度。
未来不远,一切可期。2017年将是关键的一年,且看高通接下来如何出招。
相关文章