在AI+大数据时代浪潮下,存储领域爆发新的市场需求,其中在AI训练过程中发挥关键作用的QLC NAND SSD风头正盛,这意味着NAND闪存或将迎来新的发展契机。
探究QLC NAND,真正魔力
目前来说,闪存主要分为NOR和NAND闪存,其扩容方式主要体现在结构、逻辑两种。从NAND闪存上看,结构方面,目前NAND闪存已从2D升级到3D,从空间上改变提升闪存容量,增加堆叠层数的同时达到优化成本的效果。其次是逻辑上,即提升存储单元存储的位数,从而提高闪存存储容量和降低成本。目前,闪存技术从只能存储1bit数据的SLC、MLC(2bit)、TLC(3bit)发展到能存储4bit数据的QLC,后者便是下文中将要探讨的存储技术。
从原理上看,QLC全名为Quad-Level Cells,指的是每个存储单元(Cell)可记录4个位(bit)的NAND闪存。每个单元有着自身的标准尺寸,相较于传统的SLC、MLC、TLC,QLC技术可以实现更高的数据密度,从而在相同空间内存储更多的数据。
图片来源:十铨科技官网
与SLC NAND闪存相比,QLC NAND闪存可以67.5%的芯片尺寸存储相同数量的信息,不过业界称,若想进行更多运行和读取的操作,就要增大单元状态的密度。相应地,由于单元状态之间的空间狭窄,更大的密度会使性能降级并出现读取错误的可能性,这将影响设备的寿命。
图片来源:SK海力士官网
从优势来讲,业界数据显示,QLC闪存的优势主要体现在以下几个方面:容量上,QLC相较于目前主流的TLC闪存颗粒,理论上QLC存储密度提升了33%;成本上,在同一片晶圆切割相同数量的闪存颗粒情况下,QLC闪存的存储容量高于TLC约33%左右,对比下来,QLC单位存储容量的成本也就低于TLC闪存,具有更低成本的优势;在TCO上,相较于传统的HDD,以QLC闪存为存储介质的SSD,具有更低的TCO,TCO是一个综合成本的考量,包括存储密度、可靠性及功耗等;而在写入性能方面,QLC相比其他技术略微逊色,但在读取性能方面尚佳。
但QLC技术仍面临着一些挑战,业界分析称,由于数据存储在更多的电荷层中,这增加了数据的脆弱性,对错误校正和数据保护提出了更高的要求。QLC存储设备通常需要更先进的错误校正算法和更强大的数据保护机制,以确保数据的完整性和可靠性。不过随着技术的不断进步,未来可以预见QLC技术将在存储领域扮演越来越重要的角色,将为整个信息产业带来革命性的变化。
QLC NAND,正打入AI SSD主战场
目前SSD使用的NAND闪存颗粒包括TLC、QLC等。QLC NAND已成功进军消费级SSD、企业级SSD领域,当前市场上浮现出大量的QLC SSD产品。
企业级QLC SSD拥有大容量、低成本、低TCO、读取性能尚可等亮点特性,目前备受应用市场热爱。例如以ChatGPT为代表的智能AI大模型、以及正流行的视频点播、短视频应用等,据悉包括大数据、云存储、人机交互HCI等大量以读取密集型为核心的新场景新应用,正在部署和应用QLC SSD。
其中,许多数据中心大量部署了成本较低的HDD,但HDD无法满足现代工作负载对数据更快读取访问速度的需求。从劣势上看,HDD占据数据中心的较大面积,会增加空间、电源、散热和替换方面的成本。相比较HDD,企业级QLC SSD更加轻便,性能更高,功耗更低,容量更大。据业界数据,QLC SSD顺序读性能是HDD的25倍,随机读性能是HDD的5700倍,平均延迟是HDD的1/23,性能方面远超越HDD。
不过针对QLC SSD的市场攻向,不少人认为,QLC SSD并非是为了取代TLC SSD,而是与HDD相争。虽然QLC SSD相比较TLC SSD性能和寿命更低,但大容量和性价比的优点仍让业界刮目相看,QLC SSD被看作是TLC SSD的补充,更适合读取密集型和部分读写混合型业务,比如人工智能、内容交付网络、机器学习ML等。
在AI应用中,TrendForce集邦咨询指出,SSD应用于AI推理服务器,可在推理过程中协助调整、优化AI模型,尤其SSD可以实时更新数据,以便微调推理模型结果。AI推理主要提供检索增强生成(RAG,Retrieval-Augmented Generation)和大型语言模型(LLM,Large Language Model)服务,而SSD可以储存RAG和LLM参考的相关文档和知识库,以生成含有更丰富信息的响应。此外,随着更多生成信息是以影片或相片显示,其数据存储量也相应增加,因此,TLC/QLC 16TB以上等大容量SSD便成为AI推理主要采用的产品。
目前,三星、SK海力士旗下Solidigm、西部数据、铠侠等在QLC SSD领域占据重要地位。从动态上看,Solidigm已开发并交付了D5-P5336 61.44TB QLC SSD等产品,Solidigm SSD D5-P5316的耐用性水平产品远远超过了HDD。
西部数据已将重心转往PCIe界面产品开发,并扩大与第三方主控厂商合作PCIe 5.0,推出QLC大容量产品。例如今年6月,韩国SSD主控厂商FADU宣布,与美国西部数据建立合作伙伴关系,双方将合作开发下一代企业级SSD技术“FDP”。
三星已开始量产1Tb QLC的第九代V-NAND存储器,这将使其能够提供全系列先进的SSD解决方案,满足AI时代的需求。三星称,随着企业级SSD市场快速增长,对AI应用的需求不断加强,三星将通过QLC和TLC的第9代V-NAND存储器来巩固其领先地位。
铠侠第八代BiCS FLASHTM 2Tb QLC已开始送样,全新的QLC产品架构可在单个存储器封装中堆叠16个芯片,为业界提供领先的4TB容量,将推动包括人工智能在内的多个应用领域的增长。除2Tb QLC之外,铠侠还推出了1Tb QLC版本。相较于容量优化的2Tb QLC,1Tb QLC的顺序写入性能还能再提升约30%,读取延迟提升约15%。另外,1Tb QLC更适用于高性能领域,包括客户端SSD和移动设备。
QLC SSD,似一轮春风
针对QLC SSD的未来发展,近期多位业界人士均表示,看好QLC SSD,并强调对于数据中心、云存储服务提供商、需处理海量数据的企业而言,它无疑是一个福音。
QLC Enterprise SSD供应商Solidigm亚太区销售副总裁倪锦峰此前表示,目前AI使得HDD局限性愈发明显,公司QLC SSD可突破HDD在AI领域的限制,大幅度提升AI存储功耗效率,帮助生态系统更加完善。
三星表示,AI模型规模持续扩大,训练数据量成比例增长,导致对更高存储容量的需求增加,同时推理应用也需要大量数据库存储,从而推动64TB至128TB SSD需求的上升,三星的QLC企业级SSD出货量在2024年下半年预计会比上半年增长三倍。
QLC SSD逆势增长,业界认为它或许可以成为NAND闪存市场的翻盘利器。针对QLC将带来的影响,TrendForce集邦咨询表示,北美CSPs(云端服务业者)已开始在Inference AI Server(推理用人工智能服务器)大量采用QLC Enterprise SSD,尤其是大容量规格,并预估,QLC将贡献2024年NAND Flash位元出货量20%,此比重2025年将再提升。
图片
图片来源:拍信网
此外,未来,QLC或将进军消费类嵌入式eMMC、UFS领域,据悉目前已有原厂的UFS采用了QLC作为存储介质发布产品。业界机构预测,2025年大容量QLC Enterprise SSD(企业级固态硬盘)将崛起、智能手机将采用QLC UFS(通用闪存存储)。