虽然自去年以来存储行业的下行行情尤为严重,直到2023年Q1整体的存储行情仍未止跌,但是存储在数据中心领域的却在持续增长,这或与全球数据中心需求的持续高涨紧密相关。当前,数据中心行业存在的最大问题是,日益增长的需求与高耗能之间的矛盾,CPU利用效率低造成了社会资源的巨大浪费。
国家能源局预计,到2025年数据中心用电量将突破4,000亿千瓦时,占全社会用电量4.1%,数据中心CPU的低效率运行更加重了用能负担。因此,降能耗成为该行业关注的重点。从CPU架构层面来看,Arm架构采用RISC流水线指令集,能更大程度为数据中心节能减耗。
近年来,Arm在数据中心的市场份额也增加的趋势。市调机构Omdia数据显示,到2022年第二季度,Arm在数据中心的市场份额上升到7.1%,该数字高于2019年1%以内、2020年的2.2%,以及2021年底的5.4%。虽然目前Arm在数据中心的市场份额占比还相对较小,但该架构在数据中心的增长趋势明显,且预计将会继续下去。
实际上,Arm架构不仅是智能手机的基石,也是存储和嵌入式设备的基石。近日,Arm物联网事业部业务拓展副总裁马健女士在2023CFMS上分享了从云到端的智能计算与存储的大趋势、挑战,以及Arm如何赋能存储市场的未来。
有数据的地方就有存储和数据处理
几乎所有的应用演进趋势,比如万物智能、自动驾驶、WEB3和元宇宙等,归根结底都离不开对海量数据的分布式、实时处理。下一代计算和存储无处不在,无论是在智慧家庭、工厂车间、自动驾驶汽车还是智能楼宇,任何产生数据的地方都需要存储和数据处理分析。
不仅如此,Composable(组合式)基础设施的概念正被广泛接受,以提高资源利用率、满足不同应用的需求。蓬勃发展的移动、云、边缘和物联网的应用,对计算、内存和存储提出了不同的要求,促使这些基础资源持续分解,并可以根据负载需求更灵活地进行组合。
随着计算和存储走出数据中心和家庭,不再有物理安全的保护,数据隐私和预防数据泄露变得必不可少。爆发式的数据增长对各类存储设备的需求量都显著提高,但不同应用对存储设备的要求却千差万别。
一方面,云和企业数据中心通常需要长期存储数据,或处理计算密集的数据库操作、海量数据分析和AI模型训练。这些应用在不断挑战存储性能和容量的极限,也需要最高速的计算与存储接口。
另一方面,手机和嵌入式终端设备通常依靠电池组供电,低能耗和高可靠性就变得至关重要。为了支持更快、更高效的数据访问,从用于消费存储的USB,到用于移动存储的UFS,再到用于PC和企业存储的PCIe,各种存储接口标准都在稳步提高速度和带宽,这也对存储控制器的性能提出了更高的要求。
同时,新接口标准也在层出不穷。CXL的横空出世,得到诸多云巨头的支持,着这或将改变数据中心架构。基于Arm Neoverse平台的服务器创新正在推动服务器CPU内核数量和性能的极限,进一步彰显了每个内核、内存、带宽的差距。而CXL使内存创新成为可能,有望摆脱内存得密度和带宽瓶颈的限制。
第一波CXL用例将是服务器本身通过CXL的端口进行内存扩展。未来,分解的内存池可以通过CXL交换机与服务器主机连接,从而实现更可组合的基础架构,提高系统利用率。随着时间的推移,CXL将能在闪存中得到应用。
据马健介绍,Arm一直支持计算和内存的分解趋势。“我们于2019年加入CXL联盟,从CMN-700 Mesh互连IP开始就在全面支持CXL标准。当CXL应用演进到跨多个DIMM的内存池,数据一致性支持就成为必需。如果进一步放大CXL内存池控制器的架构,就可以看到Arm在这个设计中,通过CMN IP实现8个CXL端口和8个DDR控制器一致性连接。”
新兴的计算存储正通过近存储数据处理,来减少数据搬运,使数据中心、边缘服务器、物联网设备、汽车和其他数据密集型设备,变得更实时、更高效、更安全。在计算存储中,一个完整的计算系统包括DRAM、I/O、应用处理器、专用存储和系统软件,这些软硬件被压缩到SSD设备内,在本地执行重复性、数据预处理,或数据密集型任务,从而提高系统整体能效。
此外,随着数字化转型的深入,数据安全得重要性也与日俱增。无论数据是在静止、传输还是使用中的状态,确保数据具有足够的机密性、完整性和可用性,需要整个信息和通信技术堆栈的协同努力。
Arm不直接设计生产芯片,而是通过IP技术许可授权模式,赋能全球科技产业进行创新与转型。据马健介绍,截至目前,基于Arm架构的累计芯片出货量超过2,500亿颗,“以2021财年来看,Arm架构芯片年度出货量超过290亿颗,Arm正在赋能所有需要计算的领域。同时,增量市场对Arm技术的需求也越来越强劲,包括移动领域、云计算和5G领域,我们在存储、物联、车载等市场已经深耕多年。”
Arm在计算与存储的不同细分市场都有突出表现。在未来计算和存储方面,Arm围绕机器学习、矢量计算、安全、自定义指令和CXL方面进行重点投资。2021年,基于Arm架构的存储设备、年出货量已达到30亿。Arm技术在存储市场的应用涉及到硬盘驱动、嵌入式存储,以及消费/车载/企业级SSD。
基于Arm处理器打造的存储行业新生态
再观察Arm Cortex-A/R/M系列处理器在存储市场的表现。
Cortex-A系列应用处理器具备高吞吐量流水线设计、支持最高处理性能,拥有ML、数据处理软件和丰富操作系统的坚实生态支持;Cortex-R系列实时处理器拥有快速的中断延时和实时反应速度,目前已部署到数十上百亿个消费级/企业级/数据中心SSD;Cortex-M系列嵌入式处理器是后端闪存和媒体控制的热门选择,并支持自定义指令,以便客户通过针对独特NAND介质的深度优化来创造差异。
存储控制器芯片需要的不止是处理器,为了进一步简化存储控制芯片设计,Arm还提供了丰富的系统IP,包括互连、Mesh网络、中断控制器、MMU(内存管理单元)以及物理IP。对于存储固件和软件开发,Arm可提供软件开发工具来简化开发流程,加快客户的开发周期,不断壮大的软件开发者社区是Arm生态取胜的关键。
在海量的存储应用中,Arm与合作伙伴构建了完整的生态。马健把Arm存储解决方案产品组合的优势总结为以下几点:
- 经市场验证的面向高性能、高可靠性且高效率处理器的IP、系统IP和工具,以满足各类存储应用的各种需求;
- Arm持续投资于能够强化存储行业产品的技术,如机器学习、矢量计算、安全、自定义指令和CXL;
- 由于Arm在主机和设备側都具有丰富的经验,所以Arm在提供端到端优化CXL节约方案方面具备优势;
- Arm强大的生态系统和开发者社区的高度认可,可以加速存储软件与固件的开发周期。
她举例称,ScaleFlux是Arm在计算存储领域的重要合作伙伴之一。
在去年8月的Flash Memory Summit上,ScaleFlux布了新产品CSD 3000,该新品搭载了Arm处理器。据悉,CSD 3000是业界首款完全基于自研ASIC(不再使用FPGA),全面兼容标准NVMe,并具备规模化量产的可计算存储SSD。
ScaleFlux CEO钟浩表示,选择与Arm合作主要有三方面的原因:第一,许多SSD厂商之前都基于Arm开发了固件,选用Arm处理器有利于新产品的导入、固件的移植;第二,从产品和工具链成熟度方面来看,Arm处理器有非常好的稳定性和可靠性;第三,ScaleFlux认同Arm在技术方面的长期、持续投入。2023年Q1,CSD 3000开始向全球客户送测样品,预计在Q2会开始进入量产。同时,钟浩也指出,存储领域的计算加速将势在必行。过去的几年里,可计算存储主要在一个探索阶段,用FPGA来验证应用场景的收益和有效性。现在,基于ASIC和Arm处理器的芯片,开始大幅度加速可计算存储产品的规模化部署。
值得注意的是,Arm为智能存储和计算存储量身定制了Cortex-R82处理器,它可以更好地支持高密度闪存、PCIe Gen5/Gen6接口、近存储计算,并使用ML等新技术使存储更智能。Cortex-R82是第一款基于Armv8-R架构的64位处理器,并支持Arm Neon矢量加速,性能较上一代的Cortex-R8、在不同负载达到30%到近100%的提升。它既保留了经典Cortex-R确定性、低延时的实时处理能力,也可配置内存管理单元来运行Linux等丰富操作系统。R82能够寻址高达1T的空间,可以满足不断增长的数据量和新兴内存技术的要求。目前,Arm Cortex-R82已经得到多家存储厂商的认可,得一微电子是该芯片的早期采用者之一。
存储性能和创新需求比以往更强烈
软银2022财年第三季度财报显示,Arm公司的销售收入猛增了28%,达到7.46亿美元。其中,Arm在所有目标市场都实现了强劲的收入增长,在汽车、终端(消费类设备)、基础设施和物联网业务方面实现了两位数乃至三位数的收入增长。马健补充说:“Arm开展物联网业务已有数十年,我们的合作伙伴基于Arm架构的芯片的年出货量超过290亿颗,其中约七成采用Cortex-M系列处理器,而Cortex-M系列处理器的设计初衷就是满足物联网和嵌入式应用的需求。”。
去年,存储行业经历了寒冬,但存储行业的下行趋势是短暂的。马健评价说:“如果从更长远的角度来审视这个行业,会发现随着数据中心、物联网和日常生活中各种应用所产出的大量数据,让现在对存储的性能和创新的需求比以往任何时候都更加强烈。我们仍对存储行业的发展持乐观态度,并致力与我们的生态伙伴共同实现创新。我们很多的合作伙伴将艰难的寒冬看作蓄力发展的机遇,加大了研发力度来优化设计与生产流程。我们期望当存储产业春天再次到来的时候,可以看到更多基于Arm技术的创新。”