重磅!平头哥发布首颗存储主控芯片镇岳510,实现4μs超低时延

2023-11-01  

作者:电子创新网张国斌

1.jpg

镇岳剑--中国古代名剑,据传周昭王铸,盘古,中国神话中开天辟地的创世神,传说死后天地及万物都由其身躯和器官转化而成,当盘古拿到镇岳,会带来什么样的存储革命?

平头哥首颗SSD主控芯片镇岳510,误码率领先业界标杆一个数量级,将率先在阿里云数据中心部署

11月1日,在2023云栖大会上,阿里巴巴平头哥发布旗下首颗SSD主控芯片镇岳510,该芯片为云计算场景深度定制,实现4μs超低时延,比业界主流降低30%以上 ,误码率低至10^-18,比业内标杆领先一个数量级。镇岳510将率先在阿里云数据中心部署,可应用于AI、在线交易、大数据分析、高性能数据库、软件定义存储等业务场景。

2.jpg

阿里云存储产品线总经理吴结生表示SSD是计算机系统的核心存储部件,其涵盖闪存芯片(数据的最终存储地)、内存芯片(用于暂存SSD内的众多管理表项、数据缓存)以及SSD主控芯片,随着镇岳510的推出,阿里云可以为客户提供更好的存储性能体验。

SSD主控芯片作为SSD的大脑,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理、后台任务、带外管理,SSD的功能、性能与可靠性均由其实现。

和CPU一样,SSD是计算机系统的核心部件,不仅直接影响整个系统的性能,还保障了业务的安全与稳定。

|镇岳510主要特点

3.png

据悉,镇岳510是平头哥旗下第一颗SSD主控芯片,集成了多项创新技术,镇岳510支持先进的PCIe 5.0接口,支持DDR5.0技术,内置玄铁910 RISC-V多核CPU,采用平头哥自研紧耦合芯片架构,对SSD任务进行高度抽象,可固化任务硬化为加速算子以提升性能,FTL关键任务则运行于玄铁910CPU以保持灵活性。

4.jpg

镇岳510每秒可处理高达340万笔IO,一枚镇岳510的性能,相当于1万块高性能HDD的性能总和。此外镇岳510拥有极高的能效比,每瓦功耗可提供42万笔IO访问。以一个部署了10万块SSD的数据中心为例,相比目前主流的PCIe 4.0SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。

xSsejCesmm.png

镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。不仅如此,镇岳510芯片内实现了IO/SYS/GC的全链路隔离,极大的降低这些任务之间的相互干扰,提供了既低又稳定的时延表现。

镇岳510内置了平头哥自研的高性能LDPC纠错算法,编码效率逼近香农极限,同时ErrorFlow相比业内SSD更优一个数量级;同时借助平头哥自研闪存电压预测算法,可以在各种闪存的不同工况、寿命、温度等条件下,准确预测闪存电压漂移,进一步降低LDPC解码器的输入误码率。其实现了低至10^-18的UBER,相当于每读取百亿亿笔数据,才可能有一笔数据纠错失败。

此外,该芯片还针对云计算场景进行了深度优化,芯片与云存储软件系统紧密融合协作,有效降低数据读写的延时,为系统带来了更高的性能。例如,镇岳510在支持NVMe的队列级调度机制的同时,额外实现了更精细、更灵活的IO级调度机制,结合云存储系统,能更好地满足延迟敏感型IO场景的需求。

|云计算时代的存储新需求

6.png

目前,云计算已成数字经济时代必然趋势,算力、网力、存力,共同构筑了云计算的基础。为了满足云上业务的迅猛发展,以CPU为代表的通用算力,以GPU、NPU为代表的的AI算力,以指数级迅速增加;而网络也从25GE、100GE、200GE快速演进,并将进入400GE、800GE时代。而以SSD为代表的存力,同样面临了新的挑战和诉求。

极致的性能。SSD是计算数据的来源与结果数据的目的地,其读写吞吐速率的高低,将制约整个计算系统的性能。

复杂负载下的稳定时延。时延是SSD从收到命令到返回命令响应的耗时。云上为了提高并发能力,业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。

更优的TCO绿色、减碳是云数据中心的一贯追求。如何提升能效,以更低的功耗,提供更高的性能,是SSD的重要挑战。

更高的存储密度。提高数据中心资源利用率是云的核心诉求。提高SSD的存储密度,在单块SSD内提供更大的存储容量,可以有效减少所需部署的服务器数量、交换机/路由器数量。

7.png

随着云技术进入深水区,云开始与底层芯片全方位融合联合设计,提供更好的用户体验。

第一:消除SSD接口税。通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化。

第二:全链路QoS优化。延迟敏感型与带宽敏感型IO实现了精细化区分处理,提升延迟敏感型IO的SLA。

第三:智能卸载。可靠性计算卸载至SSD,实现全路径存储语义校验,同时也减轻了服务器主机算力开销。

针对这些需求,镇岳510很对云计算还做很多定制,例如在传统的系统方案中,SSD与存储系统分离设计。SSD负责底层闪存数据排布,但无存储语义而无法达到最佳排布;SSD负责后台任务,但无法判断最佳启停时机;而存储系统有存储语义却无法排布闪存数据,有最佳时机却无法启停SSD后台任务。上下的割裂给整个存储系统的性能与寿命带来了额外消耗,这被称为“SSD接口税”。

8.png

因此ZNS协议被发展出来,通过将盘内FTL层上移至存储系统,达到了存储系统与闪存特性的完美匹配,消减了“SSD接口税”。2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。

镇岳510完美实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910CPU维护,保留了对新协议的灵活性。此外,镇岳510定制了Last Sector 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。

9.jpg

此外,镇岳510在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。

镇岳510以IO为粒度,遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。

10.jpg

平头哥产品总监周冠锋表示:“算力、网力、存力共同构筑了云计算的基础,算力和网络在过去几年已实现快速演进,以SSD为代表的存储技术也必须与云计算软件系统融合设计,为企业用户带来更优秀的存储体验。”

过去5年,平头哥已推出多款算力芯片,其云原生处理器芯片倚天710已在阿里云数据中心规模化部署,算力性价比提升超30%,已服务100多家电商、短视频、在线教育等领域客户。此次镇岳510的问世,意味着平头哥的芯片产品家族从算力扩展到了存力领域,进一步为云计算行业提供高性价比的技术底座。

文章来源于:电子创新网    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。