通过Rambus提供的IP产品、开发工具套件,以及全面系统级集成支持,减少了客户设计实现的难度,大幅缩短了开发时间。
近年来,随着人工智能应用(人工智能和机器学习,即AI/ML)的兴盛,对算力与内存带宽的要求又推到了一个新层次,据统计,从2012年到2019年,人工智能训练集增长了30万倍,每3.43个月翻一番,支持这一发展速度需要的远不止摩尔定律所能实现的改进,这需要从架构开始,做算法、硬件和软件的共同优化,才能不断提升系统性能以满足人工智能训练的需求。内存带宽对系统整体算力的影响至关重要,业界为了拓展内存带宽绞尽脑汁,在高带宽数据通信、数据靠近计算和寸内计算等多个方向持续研究,志在减少数据在存取环节消耗的时间,打破“存储墙”。
其中,高带宽数据通信是目前进展最迅速且商业化最成功的方向之一。近日,在存储接口技术上有30多年技术积累的硅知识产权(Silicon IP)和芯片提供商Rambus——从公司名可以看出该公司与存储接口技术的联系,即英文随机存储器RAM和总线Bus的组合——举行线上新品发布会,宣布推出新一代高带宽存储产品解决方案HBM2E,Rambus将HBM2E的性能正式提高到4.0 Gbps。
Rambus HBM2E 4Gbps 发送端眼图
高带宽内存( High Bandwidth Memory )是一种立体(3维或2.5维)堆叠存储方案。该概念最早由AMD在2008年引入,以解决PC系统对存储容量提升导致的功耗和尺寸不断增加的问题,通过与韩国海力士等公司合作,由海力士在2013年生产了第一批HBM存储器,该技术也于当年10月被标准组织JEDEC(电子元件工业联合会,Joint Electron Device Engineering Council)接受为标准JESD235。
此后HBM技术发展不断向前推进,2016年JEDEC通过HBM2标准JESD235a,在2018年末,JEDEC宣布对HBM2规范更新至HBM2E,以提升带宽和容量。当传输速率上升到每管脚3.6Gbps时,HBM2E可以实现每堆栈461GB/s的内存带宽。此外,HBM2E支持12个DRAM的堆栈,内存容量高达每堆叠24 GB。
Rambus IP核产品营销高级总监 Frank Ferro表示:在人工智能训练领域,厂商对带宽的需求已经超过1TB每秒,Rambus的HBM2E正是瞄准人工智能训练市场。籍此HBM2E发布,Rambus将会为人工智能/机器学习的客户提供更加完整的解决方案,帮助客户进一步地提高带宽,满足客户在带宽上的需求。
Rambus IP核产品营销高级总监 Frank Ferro
据Frank Ferro介绍,HBM2E的开发过程,也得益于生态伙伴的相互配合与协作。例如SK海力士,SK海力士推出的第一代HBM2E产品数据传输速率达到3.6Gbps,在Rambus和SK海力士的通力合作下,双方又将HBM2E内存的速率提升到了4.0Gbps。在开发HBM2E产品过程中,Rambus还与世芯电子(Alchip)合作,以解决硅中介层(interposer)和封装的挑战,而封装的具体实现则是由台积电来完成,利用2.5D CoWoS(Chip on Wafer on Substrate)技术,台积电为Rambus产品打造了封装的完整解决方案。
Rambus在HBM上优势体现在方案完整与经验丰富上。Rambus提供完全集成而且经过验证的PHY(物理层)以及内存控制器IP解决方案,在物理层面实现完整的集成互连,除了内存子系统之外,Rambus提供的PHY也经过了硬核化处理,集成了输入输出(IO)与去耦(Decap)电路,也完备了时序收敛工作,Rambus还提供包括内插板和封装参考设计在内的系统级设计支持,利用Lab Station(实验站开发环境),用户可以实现PHY与DRAM互连的调试。通过Rambus提供的IP产品、开发工具套件,以及全面系统级集成支持,减少了客户设计实现的难度,大幅缩短了开发时间。在竞争激烈的市场中,越短的上市时间,越接近成功。
高带宽存储技术对信号完整性要求很高,Frank Ferro表示,自创立开始,Rambus就以擅长信号完整性处理著称,30多年来更是积累起很多独家窍门(Know-how)。在整个HBM与中介层互连的过程中,至少包括上千条不同的数据链路,这些链路有不少是跑在Gbps级别速率。要确保系统信号完整性,就需要从多个层面着手。首先,必须要确保所有链路之间留出足够的物理空间,并对关键路径做完整的信号完整验证。其次,中介层材料选择对信号完整性影响极大,尤需慎重。“我们必须要考虑材料的厚度,以及电磁辐射相关的物理参数,在所有方向上都要去做信号完整性分析和仿真,这些分析和仿真结合Rambus历史数据库,就可以实现极佳的系统信号完整性。”
而且,自2017年起,Rambus就已经推出了HBM的解决方案,是市场上最早提供HBM解决方案厂商之一。到2020年10月,Rambus已经又有第三代PHY和第二代内存控制器,在全球范围有50过个成功项目案例。除了在台积电7纳米工艺上开发了HBM2E,Rambus也与其他晶圆代工厂有广泛合作,在格芯(Global Foundries)采用14纳米与12纳米制程生产HBM2,速率达到2.0Gbps,Rambus还在配合格芯用12纳米制程开发HBM2E产品;在三星,Rambus正在就HBM2E在14及11纳米制程上实现进行合作。Frank Ferro对Rambus的项目经验非常自信:“基于我们非常丰富的产品线,Rambus与所有主流晶圆厂商都有合作,也支持所有主流制程和工艺节点。”
面向人工智能训练领域的中国新兴芯片公司燧原科技就采用了Rambus的HBM2E解决方案。Rambus可靠的HBM2内存子系统IP提供了AI芯片所需的超高带宽性能,非常适合燧原科技的云AI培训需求。作为该接口IP的补充,Rambus还提供硅中介层和封装参考设计,并支持信号和电源完整性 (SI/PI)分析。
Rambus大中华区总经理Raymond Su
Rambus大中华区总经理Raymond Su表示,Rambus已经注意到中国市场在全球人工智能发展方面走在相对前沿位置,中国市场对于Rambus全球市场至关重要,Rambus中国团队会致力于在中国不断地扩大和深化和中国客户的合作关系联盟。Rambus的产品主要聚焦于基础架构许可、硅IP授权以及内存缓冲芯片业务,经过30多年积累,Rambus已经先后取得过2900多项专利和应用授权。
“Rambus将会为中国市场带来最新和最先进的技术,紧密地和中国云厂商、OEM和ODM合作,推动内存产业生态系统建设。我们我们会和广大的中国客户一起携手努力,紧密协作,扎根中国、深耕中国!” Raymond Su最后强调。