当前,伴随千行百业的数字化转型,由服务器、存储、网络等组成的数据中心,作为支撑数字化转型的基础,迎来高速发展。关于存储,NAND全闪介质的SSD固态硬盘因其高性能、高可靠、低能耗的特点,可满足人们对更快速、更安全、更绿色的存储需求,且随着Flash颗粒单位容量成本不断降低,SSD固态硬盘正在加速替代磁介质的HDD机械硬盘成为市场主流存储介质。
如何应用好更强性能的SSD硬盘,却并非易事
首先,在SSD硬盘高性能下,以往面向磁盘设计的传统存储操作系统的时延,在整体IO时延占比达到90%以上,存储系统性能瓶颈已经从后端硬盘转移到存储软件栈,SSD硬盘的性能无法充分展现。其次,由于NAND Flash颗粒具有需要将数据先擦除后写入的特点,而NAND Flash颗粒的可擦写次数有限,导致SSD硬盘的寿命受其限制,且随着NAND Flash颗粒容量密度的增加,擦写次数越来越少(如MLC和TLC介质的可擦写次数相差约5倍)。另外,虽然Flash颗粒单位容量成本不断降低,但SSD硬盘的容量成本仍然比HDD硬盘高。
如何充分发挥出SSD硬盘的性能优势、高效利用擦写次数以保证其寿命、降低单位有效容量的成本,与SSD硬盘相适应的存储全闪软件栈成为解决这些问题的关键所在。浪潮信息面向闪存介质创新设计的集中式存储全闪栈,通过ROW追加写、全局垃圾回收算法、盘控协同等技术,释放SSD介质性能,创新加速存储业务增长。
性能和寿命兼得
ROW (Redirect on write)追加写
浪潮信息集中式存储全闪栈采用ROW (Redirect on write)追加写的方式,每次写IO都重新分配空间,并将随机小块IO凑成大块IO,达到满足RAID满条带写的条件后落盘,这样就避免了RAID写流程中的读惩罚,并降低了写惩罚,即降低校验数据更新频率,从而简化和缩短了数据写流程,提高了IO执行效率,有利于数据写请求快速下发至SSD硬盘,发挥SSD的性能,缩短IO时延。同时也降低了写入SSD硬盘的总数据量和IO总数量,减少SSD硬盘的擦写次数,保证其寿命。
RAID满条带写的方式,也解决了RAID各盘上数据写入量和写入频率不均衡导致的热点问题,从而避免热点盘频繁擦写甚至擦写次数快速耗尽,保证SSD硬盘的寿命;也避免热点盘上IO压力变大、IO时延变长,成为性能的瓶颈盘风险,有利于存储系统的性能发挥。
ROW追加写
全局垃圾回收
ROW追加写产生的老数据(即垃圾数据)所占用的空间需要被回收用以保存新写的数据。对于不全是垃圾数据的空间,需要将其中的有效数据进行迁移,并修改对应的元数据,这就意味着要尽量减少垃圾回收过程中搬迁的数据量。同时需要尽量搬迁较冷的数据(短时间内成为垃圾数据概率低的数据),避免搬迁的数据在短时间内变为垃圾数据,提高迁移操作的价值。另外,相同冷热程度的数据,较短时间间隔内都发生更新从而变为垃圾数据的概率较大,相应的保存这些数据的空间内的无效率数据就会更多,意味着需要搬迁的数据更少,有利于垃圾回收高效的回收空间。
浪潮信息集中式存储全闪栈采用创新的全局垃圾回收算法,全局实时监测已用单位空间中的无效数据含量、有效数据权重(冷热程度等),全局查找无效数据更多、有效数据更冷的空间进行回收,减少空间回收时的搬迁数据量,降低迁移数据短时间变为垃圾数据的概率。同时,根据数据冷热程度预判,将元数据、新写的数据和GC搬迁的数据区分存放,从而提高垃圾回收效率,降低对系统性能和SSD硬盘寿命的影响。
盘控协同
浪潮信息集中式存储全闪栈利用SSD硬盘提供的多流技术,下发IO时也将这些数据的冷热分类标记下发至SSD硬盘,SSD硬盘将不同分类的数据分区存放,提高硬盘内垃圾回收的效率,降低盘内NAND的擦写磨损,延长其寿命,并保障其性能。
支持前后端UNMAP功能
前端UNMAP功能配合主机软件,全闪栈将主机软件UNMAP区域的数据标记为无效数据,相应空间可以被回收,既提高空间有效利用率,又提高全闪栈的全局垃圾回收效率。同时,全闪栈全局垃圾回收功能回收空间时,利用后端UNMAP功能,配合SSD硬盘通知它相应区域的数据无效,从而增加SSD硬盘内无效数据量,减少SSD硬盘内垃圾回收的搬迁数据量,提高SSD硬盘垃圾回收的效率。
元数据管理
ROW追加写、全局垃圾回收和重删、UNMAP等特性,在实际业务中,触发元数据随时随刻被访问和发生变化,全闪存储系统性能的发挥需要高效的元数据管理系统的支撑。浪潮信息集中式存储全闪栈通过元数据读写缓存,结合log、B+树和hash表的组织方式和智能管理算法,提高元数据查找和更新的效率,保证IO在软件栈中的执行效率,充分发挥后端SSD硬盘的性能。
智能资源调度
浪潮信息集中式存储全闪栈中创新的智能资源调度技术,对IO任务中内聚性高的业务进行分组,并跟CPU分组进行亲和性绑定,减少不同业务之间的影响,提高各业务执行效率,更充分有效的利用CPU资源,发挥软件栈的能力,将业务压力更及时的下发到SSD硬盘,充分发挥SSD硬盘的性能优势。
性价比和能效比之选
浪潮信息集中式存储全闪栈支持全局重删、字节级硬件压缩、数据拼接、模式数据识别等数据缩减功能,数据缩减比可达5:1,以更低的价格和能耗提供更高的单位有效容量。通过智能感知业务压力自适应调节数据缩减算法,达到数据缩减功能开启后对性能影响小于20%。
近年来,浪潮信息基于存储即平台战略,围绕客户应用需求变化,打造集中式和分布式全闪存储两大平台型产品。同时推出具有单端口和双端口两种形态的新一代SSD高速存储介质,并支持全路径端到端保护和国内外加密算法,使数据更持久可靠,通过多档精细功耗调节实现能耗比提升15%~37%,通过极致可靠设计提升故障后数据恢复率,进一步保障数据安全,实现数据永不丢失。
浪潮信息坚持推动从介质到软件栈到系统的全方位闪存化升级。以极致的技术创新,满足用户性能、安全、低能耗需求,持续释放数据价值,助力千行百业的用户数字化转型升级。
稿源:美通社