云计算不仅要算力,还要存力:平头哥推出SSD主控芯片镇岳510

发布时间:2023-11-01  

AI起飞,国内开启百模大战。当AI模型参数量越来越高,力大砖飞实现了越来越多的智能涌现。


大模型兴起,为行业增添了越来越多的可能性,激发了更多云计算资源需求,大模型与云计算正在成为新世纪的淘金人和卖铲人。但云计算对算力需求越大,也拉升了存力的需求,行业正蓄势待发新一轮存力竞赛。


11月1日,平头哥发布首颗SSD主控芯片镇岳510,标志着它在存力方向,又迈进了一步。


存力也是云计算的关键


云计算也是典型的冯诺依曼架构,即数据从存储设备中取出,通过网络传送到计算单元,运算结果通过网络传输至存储设备中保存。


对云计算来说,算力(CPU、GPU、NPU)、网力(DPU、SmartNIC)、存力(HDD、SDD)三大力量支撑着其发展。


为了满足云上业务的迅猛发展,以CPU为代表的通用算力,以GPU、NPU为代表的的AI算力,以指数级迅速增加;而网络也从25GE、100GE、200GE快速演进,并将进入400GE、800GE时代。而以SSD为代表的存力,同样面临了新的挑战和诉求。



首先,SSD速率制约着AI算力的上限,SSD是计算数据的来源与结果数据的目的地,所以一定需要SSD拥有更强的性能,即更高的读写吞吐速率、

其次,无论是工业应用,还是用户端,都希望拥有极小的延迟,而业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。


另外,绿色、减碳不仅是云数据中心的一贯追求,也是整个产业链的最终目标,只有以更低功耗提供更高性能,才能完成市场这种需要,因此提高能效成为SSD重要课题。


最后,在云上存储的东西越多,云计算释放的能量就越高,提高SSD的存储密度,在单块SSD内提供更大的存储容量,可以有效减少所需部署的服务器数量、交换机/路由器数量。


因此,随着云技术进入深水区,云开始与底层芯片全方位融合联合设计,提供更好的用户体验。云栖大会上,平头哥产品总监周冠锋表示,共有三个关键点:


● 一是消除SSD接口税。通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化;

● 二是全链路QoS优化。延迟敏感型与带宽敏感型IO实现了精细化区分处理,提升延迟敏感型IO的SLA;

● 三是智能卸载。可靠性计算卸载至SSD,实现全路径存储语义校验,同时也减轻了服务器主机算力开销。


1枚更比万块强


平头哥如何解决上述存力的需求呢?镇岳510便是平头哥旗下第一颗SSD主控芯片。


SSD包含闪存、主控芯片和固件三大核心技术,所谓SSD主控芯片,就是SSD的大脑,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理、后台任务、带外管理,SSD的功能、性能与可靠性均由其实现,是实现高性能的关键。


参数方面,镇岳510支持PCIe 5.0接口,支持DDR5.0技术,内置玄铁910 RISC-V多核CPU,采用平头哥自研紧耦合芯片架构,对SSD任务进行高度抽象,可固化任务硬化为加速算子以提升性能,FTL关键任务则运行于玄铁910CPU以保持灵活性。



那么这样的参数意味着什么?可以从量化指标中直观地感受到产品的优势:


● 镇岳510每秒可处理高达340万笔IO,一枚镇岳510的性能,相当于1万块高性能HDD的性能总和;

● 镇岳510拥有极高的能效比,每瓦功耗可提供42万笔IO访问,以一个部署了10万块SSD的数据中心为例,相比目前主流的PCIe 4.0 SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。


镇岳510芯片为云定制,带来更优秀的存储体验,从定制化ZNS协议、IO priority、智能卸载三方面做了定制。


首先,定制化ZNS协议方面。


传统系统方案中,SSD与存储系统分离设计。SSD负责底层闪存数据排布,但无存储语义而无法达到最佳排布;SSD负责后台任务,但无法判断最佳启停时机;而存储系统有存储语义却无法排布闪存数据,有最佳时机却无法启停SSD后台任务。上下的割裂给整个存储系统的性能与寿命带来了额外消耗,这被称为“SSD接口税”。


因此ZNS协议被发展出来,通过将盘内FTL层上移至存储系统,达到了存储系统与闪存特性的完美匹配,消减了“SSD接口税”。2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。


镇岳510实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910CPU维护,保留了对新协议的灵活性。此外,镇岳510定制了Last Sector 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。



其次,IO priority方面。


数据请求可以分为带宽敏感型与时延敏感型,不同的请求应予以不同的处理策略,才能达到业务最佳SLA。NVMe规范中制定了以队列为粒度的标准SQ调度机制,但其灵活性较差,对于业务种类复杂、追求灵活可配的云存储系统来说,它并不是最佳选择。


镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。


在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。


不仅如此,镇岳510芯片内实现了IO/SYS/GC的全链路隔离,极大的降低这些任务之间的相互干扰,提供了既低又稳定的时延表现。



最后,智能卸载方面。


云存储系统的完整数据链路,从计算端开始,通过网络到存储服务器,再通过内部互联到达SSD。为了保障数据的高可靠,全链路应采用语义一致的完整性校验。但NVMe规范只规定了以Sector为单位按照T10 DIF/DIX的校验机制,与存储系统的语义并不相同,因此SSD的校验与存储系统的校验产生了差异。


以IO为粒度,镇岳510遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。



当镇岳遇到盘古


镇岳是利剑,盘古是创世之神,当盘古遇上镇岳会发生什么?


阿里云自身技术专家吴忠杰表示,ZNS是实现发展数据中心SSD的关键,它打破了数据中心与SSD的隔阂。


与FDP、标盘相比,ZNS真正解决了问题。FDP解决,NAND的布局,但所有GC策略都在内部完成,其解决问题是与标盘几乎是一样的,因此,通过ZNS SSD提升盘古分布式存储效能,简单说就是做减法提升效能。



阿里云飞天盘古是阿里云统一存储平台,它拥有四个特点:


● 一是高性能云盘达到100万IOPS,引领行业进入微秒是迟存情时代,针对新至存储介质提出了全球领先的技术架构,通过软硬协同的方式优化全链路IO性能;

● 二是海量、大规模,EB级别存储量,万亿级文件数,支持全场景业务,包括单集群规模超过1万台节点的大数据、高性能搜索、海量对象存储、低延迟近盘等业务;

● 三是构建了业内最大规模的RDMA存储网络,降低存储IO延迟;提出创新的网络协议,引领数据中心存储网络技术发展;持续发表顶会论文,2023年,盘古有4篇顶会论文被收录,其中1能评为Deploved System Best Paper,为国内首次;

● 四是掌握内核技术,从飞天第一行化码开始,自研分布式存储系统历经十余年的时间,不断打磨、发展、突破、全栈自研能力,提出并推动ZNS NVMe国际标发展,推进行业发展。


镇岳SSD则为飞天盘古提供了丰富的功能,通过与镇岳SSD的深度协同设计为客户提供极致的数据存储体验。


一方面,镇岳与飞天盘古深度协同设计,提升了数据可靠性、SLA以及存储效能构建了从芯片到系统的全栈自研分布式存储。


另一方面,镇岳提供的ZNS能力与飞天盘古存储引擎协同,增强了云存储的灵活性,推进数据中心往软件定义闪存方向发展。



过去5年,平头哥已推出多款算力芯片,其云原生处理器芯片倚天710已在阿里云数据中心规模化部署,算力性价比提升超30%,已服务100多家电商、短视频、在线教育等领域客户。


近几年来,RISC-V的能力愈加被证实,全世界都看到了RISC-V的潜力,包括更多物联网及高性能器件应用,而它在SSD上也一直也充当着重要角色。

 

早在2018年,西部数据就曾首发基于RISC-V架构的SSD主控芯片。SSD包含闪存、主控芯片和固件三大核心技术,所谓SSD主控芯片,就是SSD的大脑,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理、后台任务、带外管理,SSD的功能、性能与可靠性均由其实现,是实现高性能的关键。

 

此前西部数据使用的主控芯片是Arm处理器,每年使用量超过10亿颗。但众所周知,Arm整体较为闭环,授权费也很贵,可以预见,未来SSD主控会是RISC-V一大市场。


现在,平头哥已从算力逐渐扩展到存力领域,而下一步,存力也将逐渐深入行业,为云提供更强大的性能。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    采用GAP9 AI算力处理器的智能可听耳机设备;当今世界,智能可听设备已经成为了流行趋势。随后耳机市场的不断成长起来,消费者又对AI-ANC,AI-ENC(环境噪音消除)降噪的需求逐年增加,但是......
    产车型的测试和验证的各项工作已陆续完成,将于今年下半年量产。沈子瑜表示“明年的量产将会非常可观”。 汽车智能化发展使汽车本身越来越具备智能手机的功能,支持高算力的软硬件和零部件需求增长。其中,主控高算力处理器......
    、Qualcomm 和 Apple 的笔记本电脑处理器竞争日益激烈。” 在处理器排名中,Google 和 Amazon 正专注于拥有定制 AI ASIC 的数据中心。博通......
    的软硬件和零部件需求增长。其中,主控高算力处理器会成为智能汽车上的标配,中国汽车行业亟需真正具备高端处理器基因的本土芯片企业,以自研芯片推动产业革新。 中芯聚源管理合伙人张焕麟表示,汽车智能化的发展对于车规高算力......
    汽车处理器市场复合年增长率超 13%; 据业内调查数据显示,汽车处理器市场包含 ADAS 和驾驶舱这两个主要领域的计算收入将以超过 13% 的复合年增长率增长,预计到 2028 年整......
    “周易”,INT8算力可达8TOPS。 此次领克08车型搭载两颗“龙鹰一号”,官方表示,这两颗“龙鹰一号”集成于安托拉1000Pro计算平台,NPU算力高达16TOPS,各项处理能力处......
    了安谋科技自研的、可编程的NPU“周易”,INT8算力可达8TOPS。 此次领克08车型搭载两颗“龙鹰一号”,官方表示,这两颗“龙鹰一号”集成于安托拉1000Pro计算平台,NPU算力高达16TOPS,各项处理能力处......
    高达16TOPS,各项处理能力处于行业领先水平,将充分满足座舱各种智能需求。 封面图片来源:拍信网......
    、停车及自动驾驶等功能提供支持。 2021年中期,Versal AI Edge系列芯片首次亮相,同样基于7nm工艺节点。 从性能上看,该系列主要支持分布式应用,如单一传感器的低算力处理,随后......
    原子晶体的单原子层厚度使其在小尺寸器件中具有优越的短沟道控制能力。该技术将进一步提升芯片的集成密度,满足高算力处理器,高密度存储器及人工智能等应用的发展需求。 ▲ 硅基二维叠层晶体管的概念、晶圆级制造与器件结构 图源:官网 ......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>