泰克科技产品技术应用总监张欣与清华大学集成电路学院高斌老师探讨忆阻器、类脑计算科研进展
人工智能内容生成(AIGC)技术在近一年来引起了科技界的广泛关注,因为它对各个行业有着颠覆性的影响。但是,要支持AIGC技术,需要消耗很大的功率和算力,随着摩尔定律接近极限,新的计算架构和信息器件成为了学术界和产业界的研究重点。
高精尖创新中心由北京市教委支持,依托清华建,现为第二期,与北大共建,有众多设备和工作人员,有一百多人的工程师队伍,包括芯片设计、测试及其他支撑人员。除研发高端芯片外,还为北京市提供测试平台,服务清华各院系,也满足周边中关村芯片相关企业的测试需求。
清华大学吴华强、高斌团队在氧化物忆阻器的科研领域有着十多年的积累,更重要的是,他们在边缘端的人工智能训练和推理方面实现了领先的突破,为未来大模型的架构提供了全新的研究范式。在本次采访中,高斌老师分享了自己团队最新的研究成果,并深入分析了在大模型中的潜在应用。
此外,他还就器件的刻画和验证提出了发展性、建设性的意见。这对于从事忆阻器、类脑计算等领域的科研工作者来说,是一种不同的思路、一种先进的系统和器件协同的测试、表征方法,可以助力科研、加快科研进展。
新型器件创新支持大模型
张欣:您去年参加了 IEDM2023 会议,能否分享下感受。
高老师:IEDM 是集成电路领域三大紧急会议之一,因疫情前两年线上开,去年终于现场开。感觉国际学术领域有变化,摩尔定律下行难度增大。国际上虽有大公司论文研究更先进工艺,如堆叠三维基层晶体管,但门槛高,只有少数公司如 imac 能做。新器件工艺方面,看到新方向单片三维集层,与较热的 chiplet 平行,在一个衬底上尽量将多器件三维堆叠,器件间带宽更高,是新趋势,可用新型 TFT 材料、薄膜氧化物、二维材料等尝试做成后端兼容器件。去年 IEDM 还有专门讨论大模型的 专题环节,因大模型很火,国际上几个大公司都在研究如何用新器件、新工艺去支持大模型,技术路线各不相同,有传统的,也有尝试新器件新工艺的。
张欣:现在科研领域都这么卷了,大模型更多是商业行为,都卷到器件新型器件创新去支持大模型了。
高老师:没错,大模型不仅在算法和应用上,底层算力支撑也非常重要,这两年 IEDM 特别关注提高算力、存储带宽和权重密度。我们组 2023 年在 IEDM 上有四篇文章、四个报告,都与忆阻器方向相关,也涉及将忆阻器与其他器件进行单片集成。
张欣:距上次专访大概两年半,这期间您肯定有很多科研成果和进步,能否介绍下这期间工作的突破。
高老师:这两年我们尽量将存算一体技术往应用推进,寻找应用牵引,主要布局三件事。一是与企业合作,如海迪士,尝试在实际边缘智能场景做芯片设计,除芯片设计,还研究在实际场景下的可靠性,发现器件电阻状态保持在很多实际场景中存在随机漂移的 relaxation 效应,需投入精力抑制随机漂移,以满足未来应用需求。二是我们需要大模型,要设法提高密度,因为之前小卷积网络加速不需要高密度,但大模型确实需要,这是工艺上的研究。三是做更前沿、创新的内脑学习,去年十月我们在 Science 上发过一篇相关论文,还布局了几个难度更大的学习。
看整体算法效果,要关注整体而非器件个体
张欣:希望未来一两年能看到高老师的进展,一方面往产业化走要解决可靠性、集升度问题,同时布局新型真正类脑计算的前沿方向。
高老师:摩尔经济黄金时代,不太注重器件与系统协同,只要把器件做快做小,芯片性能就上去了,但后摩尔时代要将器件与系统做协同设计,根据系统需求优化器件。典型的是存算一体,最终目的是人工智能加速,而人工智能对器件性能要求复杂,不是单纯把器件组织调稳就能达到系统要求。如加速深度神经网络,其中卷积层、连接层等各种层对器件要求都不同,很难抽象出器件指标来确保做出的芯片很好,更多是做成阵列或有一定功能的简单电路,通过这个去测试,最终测的还是器件特性,反馈成电路甚至系统,将算法神经网络算法直接运行在阵列上。看整体算法效果,关注整体而非器件个体,最后落实在器件上做优化,调节器件中电子离子的输运。
张欣:这是全新概念,对于产业界落地有挑战,产业界要求器件种类越少越好,参数越集中越好,以便大规模降低成本和提高良率,担心实际商业应用的路还很远。
高老师:也没有那么远,可以先找到较容易的场景,将各种指标和可靠性清晰拆解,在小地方先用起来,让商业之路走起来,一是可以反馈给学术界下一步研究方向,二是在一些地方用起来后,让产业界和学术界更有信心,这也是这两年开始考虑与几个企业一起往产业化推的原因。高精尖中心的定位是把学校高精尖技术往产业化推,学校与企业中间有很大差距,希望高精尖中心能在产业创新方面尽量填平这个差距。
张欣:您团队是国内做主机忆阻器或氧化物忆阻器的顶尖团队,想了解未来氧化物忆阻器的突破点及器件本身性能指标细节方向有无可能突破。
高老师:未来有好几个突破点,一是可靠性,希望器件能实现多比特存储提高计算效率,但中间组态稳定性限制其应用,对测试是挑战;二是密度,需与 M3D 高密存储器拼密度,尝试做成 HBM 方式堆多片阻阻器,还需在片内把忆阻器尺寸做小,涉及忆阻器与晶体管的匹配及共同优化工艺,需与很多公司合作。大模型对功耗和成本需求高,预计忆阻器用到大模型里能效比有数量级提升,端测中忆阻器高能效有很多优势。
张欣:国内有很多研究者做神经形态计算方面研究,感觉与忆阻器像,最初认为是卷积神经网络,仔细研究是脉冲神经网络,询问两种体系关系及未来是否融合或演化出不同应用和产品。
高老师:忆阻器有三个阶段,做存储、存算一体加速人工神经网络、类脑计算,本质是利用其动力学特性,可能产生更高阶智能和更复杂学习推理功能,在学术界值得探索,但短期落地难,因大规模实现无论工艺还是算法都有很多挑战,学校做探索是好方向。
张欣:提到忆阻器离子输运的动力学过程,想起曾有老师对忆阻器时间参数特性要求高,其氧控位控制精细,形成和消除导电吸丝快,测试要求高,需皮秒级脉冲激励和电流读取,说不定未来可用于高速器件和高速场景。
高老师:还在做更成熟的高速存储方向,用忆阻器研究忆阻器,其读写速度更快,可多值存储,带宽和速度提高,应用空间充满期待。
测试测量设备未来与时俱进,充满想象力
张欣:谈测试方面的挑战和需求,提到忆阻器测试的几个转变,从单器件到小阵列,测试精度从低到高,涉及频繁读写操作,AC 和 DC 频繁切换,请高老师详细剖析一下测试需求。
高老师:希望监控电阻状态,需高精度测量,以前 memory只关注两个窗口,现在要关注绝对电阻数值。动态方面要调电阻值,加写脉冲读取一段时间状态,涉及很多读写切换,速度越快越好,习惯在几纳秒时钟周期内完成切换。用传统毫秒量级切换,器件测试结果无法直接转化到芯片中,所以器件测试时要模拟芯片实际工作状态。
张欣:作为测试测量仪器公司,我们还有很长路要走,您能给我们提些如何更好服务中国科研行业和市场的建议吗?
高老师:我能想到的就是两件事吧,一是多与中国高校、研究院所交流,了解更多需求,有助于开发更好产品;二是与时俱进,有没有可能将 AI 技术融入测试设备,使交互更方便,做出更多新功能,这是所有电子设备大趋势。或许将来一台测试设备就是一台智能设备,测试设备里用到的忆阻器的边缘训练和学习能很快实现。
上述为本次访谈内容,针对忆阻器领域,后续高斌老师还有关于大模型时代的存算一体芯片专题的相关详细课程,敬请期待:
背景:大模型与存储墙
概念:存算一体芯片技术
进展:存算一体器件、工艺与芯片
展望:存算器件的发展及测试需求