云计算不仅要算力,还要存力:平头哥推出SSD主控芯片镇岳510

2023-11-01  

AI起飞,国内开启百模大战。当AI模型参数量越来越高,力大砖飞实现了越来越多的智能涌现。


大模型兴起,为行业增添了越来越多的可能性,激发了更多云计算资源需求,大模型与云计算正在成为新世纪的淘金人和卖铲人。但云计算对算力需求越大,也拉升了存力的需求,行业正蓄势待发新一轮存力竞赛。


11月1日,平头哥发布首颗SSD主控芯片镇岳510,标志着它在存力方向,又迈进了一步。


存力也是云计算的关键


云计算也是典型的冯诺依曼架构,即数据从存储设备中取出,通过网络传送到计算单元,运算结果通过网络传输至存储设备中保存。


对云计算来说,算力(CPU、GPU、NPU)、网力(DPU、SmartNIC)、存力(HDD、SDD)三大力量支撑着其发展。


为了满足云上业务的迅猛发展,以CPU为代表的通用算力,以GPU、NPU为代表的的AI算力,以指数级迅速增加;而网络也从25GE、100GE、200GE快速演进,并将进入400GE、800GE时代。而以SSD为代表的存力,同样面临了新的挑战和诉求。



首先,SSD速率制约着AI算力的上限,SSD是计算数据的来源与结果数据的目的地,所以一定需要SSD拥有更强的性能,即更高的读写吞吐速率、

其次,无论是工业应用,还是用户端,都希望拥有极小的延迟,而业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。


另外,绿色、减碳不仅是云数据中心的一贯追求,也是整个产业链的最终目标,只有以更低功耗提供更高性能,才能完成市场这种需要,因此提高能效成为SSD重要课题。


最后,在云上存储的东西越多,云计算释放的能量就越高,提高SSD的存储密度,在单块SSD内提供更大的存储容量,可以有效减少所需部署的服务器数量、交换机/路由器数量。


因此,随着云技术进入深水区,云开始与底层芯片全方位融合联合设计,提供更好的用户体验。云栖大会上,平头哥产品总监周冠锋表示,共有三个关键点:


● 一是消除SSD接口税。通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化;

● 二是全链路QoS优化。延迟敏感型与带宽敏感型IO实现了精细化区分处理,提升延迟敏感型IO的SLA;

● 三是智能卸载。可靠性计算卸载至SSD,实现全路径存储语义校验,同时也减轻了服务器主机算力开销。


1枚更比万块强


平头哥如何解决上述存力的需求呢?镇岳510便是平头哥旗下第一颗SSD主控芯片。


SSD包含闪存、主控芯片和固件三大核心技术,所谓SSD主控芯片,就是SSD的大脑,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理、后台任务、带外管理,SSD的功能、性能与可靠性均由其实现,是实现高性能的关键。


参数方面,镇岳510支持PCIe 5.0接口,支持DDR5.0技术,内置玄铁910 RISC-V多核CPU,采用平头哥自研紧耦合芯片架构,对SSD任务进行高度抽象,可固化任务硬化为加速算子以提升性能,FTL关键任务则运行于玄铁910CPU以保持灵活性。



那么这样的参数意味着什么?可以从量化指标中直观地感受到产品的优势:


● 镇岳510每秒可处理高达340万笔IO,一枚镇岳510的性能,相当于1万块高性能HDD的性能总和;

● 镇岳510拥有极高的能效比,每瓦功耗可提供42万笔IO访问,以一个部署了10万块SSD的数据中心为例,相比目前主流的PCIe 4.0 SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。


镇岳510芯片为云定制,带来更优秀的存储体验,从定制化ZNS协议、IO priority、智能卸载三方面做了定制。


首先,定制化ZNS协议方面。


传统系统方案中,SSD与存储系统分离设计。SSD负责底层闪存数据排布,但无存储语义而无法达到最佳排布;SSD负责后台任务,但无法判断最佳启停时机;而存储系统有存储语义却无法排布闪存数据,有最佳时机却无法启停SSD后台任务。上下的割裂给整个存储系统的性能与寿命带来了额外消耗,这被称为“SSD接口税”。


因此ZNS协议被发展出来,通过将盘内FTL层上移至存储系统,达到了存储系统与闪存特性的完美匹配,消减了“SSD接口税”。2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。


镇岳510实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910CPU维护,保留了对新协议的灵活性。此外,镇岳510定制了Last Sector 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。



其次,IO priority方面。


数据请求可以分为带宽敏感型与时延敏感型,不同的请求应予以不同的处理策略,才能达到业务最佳SLA。NVMe规范中制定了以队列为粒度的标准SQ调度机制,但其灵活性较差,对于业务种类复杂、追求灵活可配的云存储系统来说,它并不是最佳选择。


镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。


在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。


不仅如此,镇岳510芯片内实现了IO/SYS/GC的全链路隔离,极大的降低这些任务之间的相互干扰,提供了既低又稳定的时延表现。



最后,智能卸载方面。


云存储系统的完整数据链路,从计算端开始,通过网络到存储服务器,再通过内部互联到达SSD。为了保障数据的高可靠,全链路应采用语义一致的完整性校验。但NVMe规范只规定了以Sector为单位按照T10 DIF/DIX的校验机制,与存储系统的语义并不相同,因此SSD的校验与存储系统的校验产生了差异。


以IO为粒度,镇岳510遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。



当镇岳遇到盘古


镇岳是利剑,盘古是创世之神,当盘古遇上镇岳会发生什么?


阿里云自身技术专家吴忠杰表示,ZNS是实现发展数据中心SSD的关键,它打破了数据中心与SSD的隔阂。


与FDP、标盘相比,ZNS真正解决了问题。FDP解决,NAND的布局,但所有GC策略都在内部完成,其解决问题是与标盘几乎是一样的,因此,通过ZNS SSD提升盘古分布式存储效能,简单说就是做减法提升效能。



阿里云飞天盘古是阿里云统一存储平台,它拥有四个特点:


● 一是高性能云盘达到100万IOPS,引领行业进入微秒是迟存情时代,针对新至存储介质提出了全球领先的技术架构,通过软硬协同的方式优化全链路IO性能;

● 二是海量、大规模,EB级别存储量,万亿级文件数,支持全场景业务,包括单集群规模超过1万台节点的大数据、高性能搜索、海量对象存储、低延迟近盘等业务;

● 三是构建了业内最大规模的RDMA存储网络,降低存储IO延迟;提出创新的网络协议,引领数据中心存储网络技术发展;持续发表顶会论文,2023年,盘古有4篇顶会论文被收录,其中1能评为Deploved System Best Paper,为国内首次;

● 四是掌握内核技术,从飞天第一行化码开始,自研分布式存储系统历经十余年的时间,不断打磨、发展、突破、全栈自研能力,提出并推动ZNS NVMe国际标发展,推进行业发展。


镇岳SSD则为飞天盘古提供了丰富的功能,通过与镇岳SSD的深度协同设计为客户提供极致的数据存储体验。


一方面,镇岳与飞天盘古深度协同设计,提升了数据可靠性、SLA以及存储效能构建了从芯片到系统的全栈自研分布式存储。


另一方面,镇岳提供的ZNS能力与飞天盘古存储引擎协同,增强了云存储的灵活性,推进数据中心往软件定义闪存方向发展。



过去5年,平头哥已推出多款算力芯片,其云原生处理器芯片倚天710已在阿里云数据中心规模化部署,算力性价比提升超30%,已服务100多家电商、短视频、在线教育等领域客户。


近几年来,RISC-V的能力愈加被证实,全世界都看到了RISC-V的潜力,包括更多物联网及高性能器件应用,而它在SSD上也一直也充当着重要角色。

 

早在2018年,西部数据就曾首发基于RISC-V架构的SSD主控芯片。SSD包含闪存、主控芯片和固件三大核心技术,所谓SSD主控芯片,就是SSD的大脑,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理、后台任务、带外管理,SSD的功能、性能与可靠性均由其实现,是实现高性能的关键。

 

此前西部数据使用的主控芯片是Arm处理器,每年使用量超过10亿颗。但众所周知,Arm整体较为闭环,授权费也很贵,可以预见,未来SSD主控会是RISC-V一大市场。


现在,平头哥已从算力逐渐扩展到存力领域,而下一步,存力也将逐渐深入行业,为云提供更强大的性能。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。