作者: 付斌
AI大模型的爆火,使得算力获得了巨量提升。而对大模型来说,算力、存储、网络三要素缺一不可,但凡其中之一跟随不上发展,算力的全部能力便无法发挥。
在做这种情况下,面对日益暴增的数据量和吞吐量要求,不仅要升级数据中心的SSD,还要升级边缘端的SSD。
日前,美光就推出了首款PCIe 5.0数据中心9550 SSD、以及首款采用276层 NAND(G9 NAND)的消费SSD两款产品,以应对现阶段存储面临的挑战。
9550 SSD:高性能数据中心SSD
美光 9550 NVMe SSD是美光使用176层NAND的PCIe gen 4 7450 SSD和232层NAND 7500的后续产品,它采用232层的美光第8代NAND(G8 NAND)构建。
9550 SSD实现了两个首次:一是美光首款PCIe 5.0产品,二是首款基于E3.S的SSD:凭借PCIe gen 5总线支持、相同的6平面设计以及美光的内部控制器ASIC和固件,9550 SSD成为目前速度领先的数据中心SSD,也是AI工作负载性能和能效的行业领先者;9550 SSD将提供E3.S(1T)的7.5mm版本、U.2版本(又称2.5英寸、15mm版本)和E1.S的15mm版本。
根据美光存储事业部产品管理总监Bill Bollengier介绍,9550 SSD系列专为高性能细分市场打造,在产品组合中扮演着提供卓越数据中心SSD性能的角色,并吸引了众多云和企业客户。
随着人工智能市场的兴起,该系列应运而生。从SSD的视角来看,人工智能对性能提出了更高要求。同时,美光也意识到了提升效率的重要性,这不仅仅关乎性能与电力消耗,能耗更是所有数据中心客户的核心关注点,因为电力成本对他们而言相当高昂。
因此,美光设计了9550 SSD系列,在保障高性能的同时,也实现了高效率。最后,数据中心非常复杂。美光的目标是利用许多行业标准规范来帮助9550 SSD简化设计。
9550 SSD是美光技术力的体现,也是全部技术的集合体,Bill Bollengier表示,其整合了美光的自有部件,采用了美光的G8 NAND,搭载了美光新款控制器,配备美光DRAM,使用美光设计和开发的固件,包含了SSD中常见的所有评论和安全功能。与此同时,产品在新加坡和马来西亚的工厂进行生产,从设计到制造,全程由美光自主完成。
从性能角度看,9550 SSD在“四角”上都展现出了极高的性能,即顺序读取、顺序写入、随机读取和随机写入均表现出色。
在顺序读取、随机读取和随机写入方面,9550 SSD在数据中心速度表现卓越。这得益于美光的控制器、NAND以及专为制造高性能SSD而开发的美光架构固件。
此外,9550 SSD还针对各种AI工作负载进行了优化,同时兼顾了性能和能耗。这一优化基于NVIDIA H100 GPU平台,并特别考虑了利用大加速器内存的图神经网络(GNN)工作负载。
在AI工作负载性能测试方面,在NVIDIA H100 GPU 平台使用BaM 和 GIDS 进行GNN 工作负载测试中,美光 9550 SSD实现了 290 万 IOPS的性能。
美光9550 SSD不仅性能卓越,效率也极高。在利用BaM进行GNN训练时,9550 SSD平均功耗降低了多达43%,整体系统能耗减少了可达29%。这一显著成效得益于其高性能,使它能迅速完成任务并转入下一项工作,而同类产品可能仍在执行任务并消耗更多能量。
9550 SSD系列满足客户对不同规格的需求,提供从4TB~32TB的多种容量选择,分别归类于9550 PRO型号和9550 MAX型号,为客户提供灵活多样的选择。
在使用寿命方面,Bill Bollengier坦言,对其客户来说,拥有一个适用于多代的通用架构非常重要,因为数据中心规模庞大,而SSD的合格认证既昂贵又耗时。美光致力于通过完全垂直整合的美光设计来提供这种通用架构,使得美光的产品能够在不同代际之间保持大量共通性。其次,在数据安全方面,美光支持所有最新的行业标准,这些功能是DICE的一部分,能够为客户提供了额外安全保障,确保使用的是真正的美光SSD,并且如果有任何固件更新,固件都来自美光。看似很简单,但实际上,并不是所有厂商都能做到这一点,这就是美光超越同行的关键之一。
在大模型大爆发的现如今,Bill Bollengier也分享了其对于存储行业方面的一些观察。他表示,行业中的一个关键趋势是更大的NAND裸片密度,这有助于推动更大容量的SSD,使系统构建者能够设计更多的服务器,以便拥有更大的容量或将更多的GPU或CPU放入服务器中。鉴于此,特别是随着人工智能的发展,GPU直接存储的能力变得愈发重要。美光与NVIDIA紧密合作,确保包括9550 SSD在内的产品能够与GPU直接存储兼容。
另一个关键点是效率,即每瓦性能。美光认为,在这个全球都关注气候和可持续性的世界里,这一点非常重要。当然,数据中心会使用大量能源。因此,在提升效率上,美光投入了大量时间。从9550 SSD的测试结果中可以看到这一点。
2650 SSD:率先搭载G9 NAND
“G8 NAND已上市已经将近一年,我们遵循英特尔的Tick-Tock模式,正式过渡到G9 NAND。G9 NAND技术具备高达3.6 GB/s的数据传输速率,提供出色的数据读写带宽,并已在美光2650 NVMe SSD中实现批量出货。” 美光存储事业部 NAND 产品生命周期管理及应用工程总监Daniel Loughmiller如是说。
美光的G9 TLC NAND内存共276层,比美光上一代TLC NAND的232层有所增加。其芯片尺寸约为48.9mm2,与美光较旧的 176L NAND 的 512Gbit TLC 芯片的芯片尺寸相当。同时,276层NAND仍然使用六平面架构,该架构最初是在232L一代推出。
相比232层TLC NAND(G8 NAND),276层TLC NAND(G9 NAND)的密度提高了44%。凭借卓越的NAND输入/输出(I/O)速率,G9 NAND技术能够满足数据密集型工作负载的高吞吐需求,其数据传输速率比当前SSD中的NAND技术要快50% 。
根据Daniel Loughmiller的介绍,在带宽方面,与市场上现有的同类 NAND 解决方案相比,美光 G9 NAND每颗芯片写入带宽和读取带宽分别高出99%和88%。这些优势共同提升了 SSD和嵌入式NAND解决方案的性能与能效。在密度方面,G9 NAND的密度提高了73%,并且封装尺寸更小,端口面积比其他产品小28%。
G9 NAND适用于多个领域,包括数据中心和客户端SSD。客户端SSD也是G9 TLC NAND首次出货将投入的应用领域,即2650 SSD。此外,G9 NAND也将进入汽车和嵌入式应用以及移动应用。总之,美光已经成为业界首家实现里程碑的厂商之一。
在性能方面,美光2650 SSD在 PCMark 10测试中表现优异,在日常计算方面带来一流的用户体验,与竞争对手相比,性能提高了38%。在带宽方面,提高了36%。平均访问时间比其他产品低40%。2650 SSD提供256GB~1TB容量规格。