当年,乔峰在聚贤庄力战群雄时,众江湖豪杰见识了降龙十八掌的厉害。经思过崖上风清扬传授,令狐冲无内力濒死状态下甚至可以瞬瞎十五名黑衣高手,凭借的是独孤九剑这种上乘功夫。从这些招数的名称可知,这一门功夫下有许多招数,且互相勾连,互相融合。
英特尔一口气就使出了六招,称为“六大技术支柱”——制程和封装、架构、内存和存储、互连、安全、软件。该概念首次被提出是在2018年12月英特尔“架构日”活动上,不到半年,在2019年4月3日英特尔直接发布了一系列以“六大技术支柱”为基础的新品,前者如“武功口诀”,后者则招招逼人,发布会上新品密度非常惊人。
其实英特尔自己都没有察觉,自己的六大技术支柱一口气挑战了业内众多“高手”,同时也在挑战传统。
高手过招——制程和封装
最近几年对于半导体制程的讨论,说的最多的一句话就是“摩尔定律已死”。业界不少大佬都有这样的言论,其出发点无非想表达的是制程的进一步微缩已经变得越发艰难。从技术角度来讲,随着制程工艺提升,以纳米为长度单位的晶体管之间由于距离太短、绝缘层太薄,漏电的情况同样也就随之而来了,这反而增加了芯片的功耗。显然,制程最大的挑战是芯片的物理极限。
英特尔竞争对手显然喜欢将摩尔定律“说死”,毕竟该定律出自英特尔联合创始人之一的戈登·摩尔。但是事实并非如此,正如英特尔中国研究院院长宋继强在此前4月初的媒体纷享会上所说:“创新的趋势中不变的是摩尔定律,虽然其扩展速度正在放缓,但摩尔定律的经济效益将继续存在”。
此外,在今年的CES、四月份的发布会上,英特尔10nm的新品都有重点阐述。在今年一季度财报的电话会议上,英特尔表示,自家的10nm工艺技术进展顺利,而首批10nm CPU将在年底前大规模商用,其即将开始对新CPU进行认证。
由此可以看出,英特尔并没有放弃制程推进,而是不断推动制程发展。其次,英特尔追求摩尔定律经济效益有更加丰富的方法。正如英特尔官方所说:“领先的制程技术,是构建领先产品的关键基础。英特尔继续引领先进制程,并在业界首创Foveros 3D封装技术,在三维空间提高晶体管密度和多功能集成,为计算力带来指数级提升。”
而这里提及的3D封装技术在业内可谓是一场血雨腥风的战斗。在ICinsights最新的2019年全球十大半导体厂商预测榜单中,英特尔回到了龙头位置。但在3D封装技术上,常年在前十榜单上的三位大咖不容忽视——英特尔、三星、台积电。当然在榜单外还有一些OSAT(半导体封装、设计和测试服务的外包提供商)厂。
图片来源:ICinsights(2019年3月)
台积电所亮出是WLSI(Wafer-Level-System-Integration)技术平台,应对异构集成趋势。该平台包括CoWoS封装、InFO封装等晶圆级封装技术。2018年中期台积电又推出了接近 3D封装层次的多芯片堆叠技术 SoIC,主要是针对 10nm 以下的工艺技术进行晶圆级接合。三星方面,在2018年举行的三星晶圆代工论坛上,三星公布了在封测领域的路线图。三星目前已经可以提供2.5D封装层次的I-Cube技术,同时计划2019年推出3D SiP系统级封装。
而英特尔则提出了革命性的Foveros 3D立体芯片封装技术,首次为CPU处理器引入了3D堆叠式设计,堪称产品创新的催化剂,或将成为CPU处理器历史上一个重要的转折点。据资料显示,Foveros 3D封装技术带来了3D堆叠的显著优势,可实现逻辑对逻辑(logic-on-logic)的集成,为芯片设计提供极大的灵活性。该封装技术也成为继2018年推出的嵌入式多芯片互连桥接(EMIB)2D封装技术之后的下一个技术飞跃。
英特尔3D封装的“招数”一个接一个,并非仅仅存在演示中,在2019年CES上,英特尔展示了首款Foveros产品——研发代号为“Lakefield”的全新客户端平台。该平台首次引入了类似Arm big-LITTLE大小核架构,将1个10nm Sunny Cove核心和4个Atom系列的10nm Tremont核心通过 Foveros 3D芯片堆叠技术封装到了一起。确保先前采用分离设计的不同IP整合到一起,同时保持较小的SoC尺寸,功耗也可以控制的非常低。
此外,在今年4月3日的发布会上推出的全新产品家族——英特尔Agilex FPGA,就是完美地结合了基于英特尔10纳米制程技术构建的FPGA结构和创新型异构3D SiP技术,将模拟、内存、自定义计算、自定义I/O,英特尔eASIC和FPGA逻辑结构集成到一个芯片封装中。利用带有可复用IP的自定义逻辑连续体,英特尔可提供从FPGA到结构化ASIC的迁移路径。一个API提供软件友好型异构编程环境,支持软件开发人员轻松发挥FPGA的优势实现加速。
挖掘处理器性能极限——架构
架构一词源于英文“architecture”的翻译,它的原意是建筑,建筑学,设计及构造的方式和方法。这个词应用于处理器(CPU)是指处理器内部各个运算部件的有序安排和构造,达到设计的和谐统一,使之在运行时协调一致达到高效率。如果说,上面提及的制程和封装是内功心法,那这里的构架则是武功秘籍里的招式。
有个常用公式:处理器性能 = 主频 x IPC(IPC:Instruction Per Cycle: 一个时钟周期完成的指令数,单位为“指令/时钟周期”)。显然要提高性能有两个途径:提高主频和提高IPC。从历史角度来看,处理器经历了从兆赫驱动年代,到多核年代。前者遭遇了“功率墙”的阻碍,后者则被“内存墙”拦了去路。而先进的架构可以使CPU在单位时间内执行更多的指令,也就是完成更多的任务。
“架构创新在未来十年会是一个主流。”此话出自英特尔中国研究院院长宋继强之口,这句话显然综合了历史和技术角度。处理器微架构的变化可以改变IPC,效率更高的微架构可以提高IPC从而提高处理器的性能。回顾历代处理器,我们不难发现英特尔在绝大部分时间内都保持业界的领先地位,无论是早期的P5/P6微架构,还是造就辉煌的Core微架构处理器,都已经或者即将促使整个产业的变革。
英特尔对“武功秘籍”的探索似乎很“贪婪”,其构架非常多样化,包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别应用于CPU、GPU、AI和FPGA产品。用英特尔官方话来说,就是“英特尔能够支持所有架构类型,同时拥有独特的设计和制造模式,采用领先的晶体管、创新的封装技术和广泛的IP组合,使得英特尔能够提供业界最具吸引力的产品。”
从技术层面的最新消息来看,在去年12月份的“架构日”上就推出了下一代CPU微架构Sunny Cove,旨在提高通用计算任务下每时钟计算性能和降低功耗,并包含了可加速人工智能和加密等专用计算任务的新功能。并包含了可加速人工智能和加密等专用计算任务的新功能。明年晚些时候,Sunny Cove将成为英特尔下一代处理器(英特尔至强)和客户端(英特尔酷睿)处理器的基础架构。
同样的时间,英特尔推出全新第11代集成图形卡,配备64个增强型执行单元,比此前的英特尔第9代图形卡(24个EU)多出一倍,旨在打破每秒1万亿浮点运算次数(1 TFLOPS)的壁垒。同时英特尔放出消息,计划在2020年推出独立图形处理器。
在人工智能领域,英特尔拥有Movidius Myriad X VPU芯片架构,其由少数专门的计算引擎组成。芯片中包含通用处理器和16个SHAVE(流式混合架构向量引擎)处理器,其配有成像和视觉加速器,一个神经计算引擎,以及把所有内容链接在一起的智能存储器结构。另外,英特尔的Nervana NNP 是专为深度学习定做的架构,拥有新的存储器架构,更高的可扩展性、数值并行化,并且英特尔有将深度学习性能提升100倍的野心,让用户从已有硬件(并非专门为 AI 而设计)的性能限制中解放出来。
在FPGA领域,英特尔全新的FPGA平台Agilex,其采用第二代HyperFlex架构。资料显示,第二代HyperFlex架构相比英特尔Stratix 10 FPGA,性能提升高达40%,或总功耗降低40%。此外,Hyperflex的架构创新更是可以灵活的把其他的种类计算融合进来。
不仅如此,英特尔还对进行架构创新的新探索,比如Loihi神经拟态计算芯片、量子计算。其中Loihi神经拟态计算芯片解决方案中的系统软件、算法、应用、芯片和硬件平台的相互促进为这一进程提供动力。此外,在2018年的CES大会上,英特尔宣布成功设计、制造和交付49量子比特(量子位)的超导测试芯片Tangle Lake。Tangle Lake代表着英特尔开发完整量子计算系统的进程 - 从架构到算法,再到电子控制。实现一个49-qubit测试芯片是一个重要的里程碑,因为它可以让研究人员评估和改进纠错技术和模拟计算问题。
综上来看,英特尔在架构上不断突破,并引领创新。而这又是处理器性能的关键所在,英特尔似乎手握着处理器性能的关键钥匙。如果将上面所提的两大技术支柱结合,“内功”和“武功秘籍”糅合,更是诞生了超异构这样的“武林绝学”——可以把很多现有的、不同节点上已经验证良好的晶片集成在一个封装里。拥有全部“秘籍”的英特尔,未来阻碍其产品创新能力的只有想象力了。
颠覆传统招数——内存和存储
金庸迷们想必对“令狐冲思过崖对阵田伯光”的桥段印象深刻,前几次交手,不管令狐冲如何学习新招数,总是无法破解田伯光的快刀。在风清扬几句点拨之后——“招式之间不要拘泥,要学会变通”,“谁说只有剑是剑,手也可以”。直接大败田伯光。令狐冲怎么也没有想到,之前所练的华山剑法是如此拘泥,稍加颠覆,便有奇效。
英特尔在内存和存储技术的立足点就是颠覆,对于传统的内存技术来说,其本来只分为三级:CPU里面的缓存最快,然后是内存,内存直接被CPU访问,不直接访问的就是存储。随着指数级增长的计算续期,内存也在以线性速率增长。
而传统的模式有两方面弊端:1,内存带宽限制会影响数据管道的运行速度;2,在当前的内存系统基础架构中,依然有两层空白需要填补,这需要更换慢速旋转介质来解决这一问题。这三级之间它的速度差是很大的,百倍到千倍的速度差。如果未来计算需要非常大数据的存储和访问,这样的速度差严重影响性能。
英特尔的颠覆则是往里面加入几级不同的存储技术。封装内存插在缓存和DRAM之间,DRAM和存储之间插入三层:数据中心级的持久内存、还有固态盘、和QLC固态盘。据悉,每一层之间的速度差只有10倍左右,所以是非常平滑的存储结构,这对提高未来系统性能非常重要。
几天前,集英特尔傲腾技术和英特尔QLC NAND技术为一体的固态盘全新上市,采用了M.2规格。这种傲腾混合式固态盘上同时集成高速加速技术和大容量固态盘将造福PC用户日常应用,英特尔这则上市消息中也表明,在本季度末,搭载英特尔傲腾混合式固态盘的第八代英特尔酷睿U系列移动平台将通过各大主要原始设备制造商上市。其能让1,多任务处理状态下,文档打开速度提高2倍;2,多任务处理状态下,游戏启动速度提高60%;3,多任务处理状态下,媒体文件打开速度提高90%。
英特尔的存储技术打破了固有内存的认知,打破了传统,直接重塑内存层级结构,消除数据瓶颈,这一招属于技术常年累计后的自然而然的颠覆。
突破极限的兵器——互连、安全、软件
英特尔的互连战略应该是六大技术支柱最有意思的了,像一条线串起来了六大战略,因为英特尔的互连技术可实现片上、封装内、以及处理器节点间的通信。通过有线网,或者无线网络,数据将在数据中心、边缘设备、以及芯片之间传输。英特尔在所有这些跨越微米到英里传输距离的互连领域都处于领先地位。
据英特尔内部的说法,互连技术领域,英特尔是业内投资部署最广泛的公司之一。
从微米到英里,像一种非常科幻的说法,类似漫威英雄“蚁人”的大小变换。英特尔的官方介绍中将这种“变换”模式分成了四挡。即:处理器级,处理器与设备之间,数据中心内,世界范围内。
处理器级的技术上面都有详细说明。在处理器与设备之间,英特尔具有代表性的是Thunderbolt 3/USB4、CXL技术。
在上个月的一场媒体见面会上,英特尔宣布将释出 Intel Thunderbolt协定规格予USB 推广组织(USB Promoter Group),让其他芯片制造商能够生产与 Thunderbolt 技术相容的芯片,且无需支付权利金。其中新一代USB 规格USB4 是建基于英特尔的Thunderbolt 3协定,提供40Gbps 传输速度,是USB 3.2 Gen 2×2 的一倍。此外,另一项CXL技术为处理器与处理器之间的超高速互联新标准,目前构想是用于数据中心,业界有推断表示未来有机会应用到Intel Xe架构独立显示卡,使多张显示卡(Multi-GPU)可真正共用到存储器资源,也可能会发展出比NVIDIA SLI或AMD CrossFire更先进的Multi-GPU互联技术,CPU与GPU的互联甚或媲美NVIDIA NVLink。
数据中心内的代表技术为英特尔以太网800系列、硅光子、Omni-Path,这里适合用简短的一组数字来表达其速度:800 系列十万兆以太网卡满足 100Gbps 的连接速率;400G硅光子收发器,通过半导体激光和IC集成电路融合在一起,四束激光各有100Gbps的速度,网络协议则全面支持Ethernet、InfiniBand、OmniPath等;英特尔Omni-Path Host Fabric支持每端口 100 Gbps,这意味着每个英特尔 OP HFI 端口可提供每端口高达 25 Gbps 的双向带宽。
在世界范围内的传输,英特尔代表技术有专门面向5G无线接入和边缘计算的网络系统芯片Snow Ridge和可加速多种虚拟化工作负载,包括5G无线接入网络和5G核心网络应用的N3000 FPGA。
从微观到宏观,从片上到世界范围的高速连接,英特尔的互连战略全面突破互连极限。
英特尔六大技术支柱中的安全和软件也是其突破极限的完美“兵器”。英特尔越是丰富的多样化战略布局,越是会面临多重安全挑战,而英特尔可以为多样化的架构、领先的多层级内存和多层次的互连部署额外的安全技术,能从OEM厂商到云服务供应商(CSP)和独立软件开发商(IVS),英特尔将继续引领整个行业创新并推进安全工具和资源,以提高云端应用处理的安全性和隐私保护,提供平台级威胁检测并缩小攻击面。
此外,详细阐述英特尔软件战略的是在去年11月份的一场“英特尔人工智能大会”上,当时英特尔人工智能产品事业部全球数据科学负责人刘茵茵在演讲中,一口气介绍了几大开发工具。虽说英特尔具有非常强的处理计算的能力,但对于全新硬件架构的每一个数量级的性能提升,软件能带来两个数量级的性能提升。
对于开发者来说,拥有一套利用好英特尔芯片的通用工具集,对于获得性能的指数级扩展至关重要。英特尔能够创建统一的软件架构,全面覆盖从云到端的计算。英特尔拥有几乎适用于任何架构的软件工具、SDK、API、库和特殊扩展,并支持开放式平台,让软件堆栈每个层级的开发人员都能为多样化的架构编写代码。此外,英特尔正在开发跨平台软件,进一步简化并延伸整个堆栈中的应用开发。
自通任督二脉
摩尔定律源自英特尔,将其一直发扬至今。当外界只会关注制程微缩的数字变化,却忽略英特尔的综合实力。不难看出,如今制程节点发展速度出现减缓态势,但我们不要忘了摩尔定律的本质,其不仅仅涉及了晶体管,而是包括晶体管、架构研究、连接性提升、更快速的内存系统和软件的结合。单说英特尔六大技术支柱任何一项,都是业内非常能打的状态,英特尔将其进行多维度的创新整合,像是一位武林高手拥有一套羡煞世人的招数,这是非常难能可贵的。
在英特尔对外的演示图中,六大技术支柱被从里到外排在了一层一层的圈中,相互嵌套相互协调。从形态上看,像一个坚固的盾牌,技术组合抵御一切产品挑战。也像一个车轮,载着历史不断前进。像一滴滴落平静湖面的水滴,展开一圈圈涟漪,飘荡到无穷的大海。
综合本文中所例举的产品例子,可以看出,六大支柱带来的是产品的全面创新,所以英特尔有了转型成“以数据为中心”的底气,正如英特尔公司全球副总裁兼中国区总裁杨旭在今年媒体见面会上发表的“万有IN力 新格局”的主旨演讲中提到的那样,“英特尔瞄准的是2022年高达3000亿美元的市场”,这其中就囊括了PC、移动通讯、数据中心、非易失性存储、物联网和FPGA。
相关文章