近日,清华大学官宣交叉团队发布中国 “太极(Taichi)”,该研究成果于 4 月 12 日发表在了最新一期学术期刊《Science》上。
据介绍,“太极” 光芯片架构开发过程中的灵感来自中国典籍《周易》,团队成员以 “易有太极,是生两仪” 为启发,建立了全新的计算模型,实现了光计算强悍性能的释放。
正所谓巧妇难为无米之炊,算力是训练 AI 大模型、推理任务的关键,也是人工智能的硬件基础。
光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。
光芯片具备高速高并行计算优势,被寄予希望用来支撑大模型等先进人工智能应用。如何制造出兼具大算力和高能效的下一代 芯片已成为国际前沿热点,而本次清华大学发布的 “太极” 光芯片将有望为大模型训练推理、通用人工智能、自主智能无人系统等提供强大的算力支持。
光电智能技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授)
作为近年来新兴的计算模态,智能光计算具备高速、低功耗等特性,在后摩尔时代拥有超越硅基电子计算的潜力,可以突破性解决人工智能领域的算力与功耗难题。
可是其痛点在于,光的计算优势被困在了 “水土不服” 的电架构中,导致计算规模受限,无法支撑复杂大模型智能计算。
对此,清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃了传统电子深度计算范式构建智能光计算通用传播模型,另辟蹊径地首创了分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片 “太极(Taichi)”,实现了 160 TOPS/W 的通用智能计算。
相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极” 光芯片架构源自光计算独特的全连接与高并行属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
每一个研究成果都汇集了每一位成员的心血,方璐教授将本次科研比拟为浪漫的双向奔赴:从算法架构上自顶向下探索,在硬件芯片设计上自底向上推演。
据论文第一作者、电子系博士生徐智吴介绍,在 “太极” 架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式 “大感受野” 浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
团队以周易典籍 “易有太极,是生两仪” 为启发,建立干涉-行射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。
论文报道,“太极” 光芯片具备 879 T MACS/mm^2 的面积效率与 160 TOPS/N 的能量效率。首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。
清华大学团队在实验环境下,实现了片上(on-chip)1396 万光神经网络(ONN),可用于复杂的千类别级分类和人工智能生成内容任务。
此外,太极光芯片的计算能效超现有智能芯片 2—3 个数量级,可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。
方璐教授表示,之所以将命名为 “太极”,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。