10月17日夜间,美国又开始收紧制裁了,引发行业众怒。
一方面,在AI芯片禁令中加入了三条新规:
把性能密度作为出口管制标准,即单芯片超过300teraflops算力/性能密度超过每平方毫米370 gigaflops芯片都会禁止,同时,英伟达A100/A800/H800/H800/L40/L40S/RTX4090、英特尔Gaudi 2、AMD计划的中国版GPU等特供版AI芯片的供应;
先进芯片出口许可范围扩大到40多个国家;
对21个国家提出芯片制造设备许可要求,全面限制中国的14nm以下先进芯片制造能力。
另一方面,将壁仞、摩尔线程等国产AI芯片公司列入实体清单。
美国的疯狂程度令人咋舌,连比H100效率低十倍的RTX4090都不放过。故技重施,不断用小手段干扰国产发展,这从侧面说明,国产AI芯片发展迅速,现在开始,再也不能小看国产的力量了。
付斌丨作者
电子工程世界(ID:EEworldbbs)丨出品
不是每种芯片都叫AI芯片
虽然我们每天都在茶余饭后攀谈AI芯片,但实际上,大部分人对于AI芯片并没有什么实际的概念,加之厂商直接以“AI芯片”命名,所以很难与器件关联挂钩。
所谓AI芯片,顾名思义,就是计算AI算法的芯片。AI算力需求究竟有多夸张?据OpenAI测算,2012年开始,全球AI训练所用计算量呈现指数增长,平均每3.43个月便会翻一倍,目前计算量已扩大30万倍,远超算力增长速度。
计算任何算法的芯片,都归属于AI芯片,这既包括最具代表性的深度神经网络(Deep Neural Network,简称DNN)、循环神经网络(Recurrent Neural Network,简称RNN)、卷积神经网络(Convolutional Neural Network,简称CNN),也包括与人脑更为类似的脉冲神经网络 (Spiking Neural Network,简称SNN) 。
理论来说,任何数字芯片都能算AI,毕竟数字芯片,就是算数的芯片,但如果效率巨低、能耗巨大,就没有意义了。就比如说,CPU作为中央处理器,什么类型计算都能胜任,但计算AI的效率明显没有GPU高,所以服务器中都是使用CPU+GPGPU的形式,让GPGPU作为AI计算的主力。
此外,很多MCU中也会搭载DSP或者NPU来增强AI计算能力,但这种芯片一般不会单独叫做AI芯片,毕竟它们针对的场景并非大规模AI算法,也并非堆砌AI算力的主力,而是靠近边缘的AI算力。
因此,按照上述分类方法,AI芯片主要分为GPGPU(通用图形处理器)、FPGA(可编程逻辑器件)、ASIC(专用集成电路)、存算一体和类脑芯片几种。根据在网络中的位置,又可以分为云端AI芯片 、边缘和终端AI芯片。
GPGPU:与GPU不同,GPGPU就是将GPU图形显示部分“摘掉”,全力走通用计算,特别适合用在深度学习训练方面;
FPGA:可编程的灵活性是任何其它计算芯片无法替代的,同时它在AI领域也具备一定计算能力,但相对来说,FPGA的成本就相对高一些了,而且FPGA开发也很难,软件生态没有GPGPU的CUDA那么方便;
ASIC:性能强、功耗低,Gaudi 2就是一种ASIC,NPU也是加入神经单元的一种ASIC,不过针对特定算法计算,算法是无法修改的,想要做另一种算法就要再造一种ASIC芯片,前期开发需要FPGA辅助进行;
存算一体:能耗比极佳,能够突破存储墙和功耗墙,但目前只在自动驾驶领域有商业化;
类脑计算:性能更强、功耗更低,算法也变成了SNN,但全世界都在研究之中,还未商业化。
适用于AI计算芯片主要类型,制表丨电子工程世界
类脑芯片主要类型和研发进度,制表丨电子工程世界
每种AI芯片国产发展如何了?
首先,是GPU方面,天下苦英伟达已久。
多家媒体报道显示,英伟达的数据中心GPU价格贵得惊人,国产还难以替代,此外今年6月起,英伟达就曾多次涨价。
国内GPU融资高峰期主要在2020年,到现在GPU相关融资总额已超过200亿元。仅2020年~2021年,GPGPU领域就有近20起融资事件发生。
目前来看,初创公司如芯瞳半导体、芯动科技、摩尔线程、天数智芯、壁仞科技均产品陆续推出产品,并获好评,龙芯中科、海光信息、寒武纪、芯原股份几家上市公司也持续耕耘GPU业务。不止如此,也均在替代CUDA上做了一些工作。
国产GPU厂商不完全统计,制表丨电子工程世界
其次,在ASIC方面,分为多种玩家。
一种是专门设计制造ASIC的公司,包括寒武纪、地平线、耐能科技等厂商,分别专注AI芯片的细分领域,采用“大客户捆绑”模式进入大客户供应链。
另一种,是各种跨界选手:vivo先于2021年9月发布ISPV1,再于2022年4月发布升级产品V1+,并在2022年11月发布V2;OPPO在2021年12月发表能强化手机图像处理性能的NPU MariSilicon X,之后在2022年12月揭露采用台积电6nm RF制程的蓝牙音讯SoC MariSilicon Y;阿里巴巴在2019年9月发布AI芯片含光800。
国内ASIC芯片玩家不完全统计,图源丨 偲睿洞察
FPGA方面,电子工程世界历史文章《英特尔分拆FPGA业务,国产发展几何?》中介绍,目前国内与FPGA相关研发企业数量超过28家,其中已在A股上市的企业包括复旦微电子、安路科技、航锦科技,成都华微电子上市“已问询”。此外,紫光同创、高云半导体、京微齐力、中科亿海微、智多晶、遨格芯微、易灵思的表现值得关注。
具体来说,复旦微电在国内较早推出亿门级FPGA,新一代十亿门级产品正在研发中,并且有可编程片上系统的技术储备;紫光同创覆盖高、中、低端等多层次FPGA市场;安路科技在FPGA/集成CPU、FPGA、数据处理专用引擎等单芯片产品方面都有储备,量产供货产品已覆盖100K以内的逻辑单元规模,并且PHOENIX1 系列中逻辑单元为 400K 的新产品已成功流片;京微齐力基于22nm工艺制程的FPGA已成功量产;易灵思基于RISC-V软核的FPGA已商用,并在16nm、40nm有长期的产品规划。
通过对比国际尖端产品,核心参数差距依然较大。虽然大器晚成,不过,国内也非常注重软件生态的建设。
除此之外,百度也曾经使用FPGA做AI加速,此后又推出专用于AI计算的昆仑芯(开始是FPGA,后来是基于FPGA的XPU)。
国内FPGA企业不完全统计,制表丨电子工程世界
存算一体芯片方面,电子工程世界在历史文章《清华研发出“全球首颗”,这种芯片要火了?》中介绍,前几年,国内涌现了大量存算一体公司,这批公司在两年前大多还处在A轮以前,彼时多家公司获亿元融资,短短两年时间许多明星公司又获2~3轮新融资,赛道热度依旧,资本依然看好这项新技术。
并且,有很多产品也逐渐浮现:
今年5月,后摩智能正式发布首款存算一体智驾芯片——鸿途H30。12nm工艺制程下,该芯片物理算力达256TOPS,在Int8全精度的计算提供下,计算延时只有1.5ns,能效比为30~150TOPS/W,比业界同等精度计算条件下的水平提高了3倍以上,而且它是车规量产支持L4,而这也存算一体在大算力这一领域走在了前列;
苹芯科技已开发实现多款基于SRAM的存内计算加速单元,致力于为人工智能行业提供了低成本、高效率、低能耗、高性能的芯片解决方案;
九天睿芯拥有自有专利的模拟预处理与6T SRAM存算一体技术,解决了传统计算架构的瓶颈和耗电散热难题,做到更低的延迟和更快的处理速度;
达摩院研发的存算一体芯片是全球首次采用混合键合(Hybrid Bonding)的3D堆叠技术,将计算芯片和存储芯片 face-to-face 地用特定金属材质和工艺进行互联。
国内存算一体芯片企业不完全统计,制表丨电子工程世界
类脑芯片方面,全球范围内,参与神经形态计算芯片开发的机构主要包括三类:英特尔、IBM、高通等为代表的科技巨头企业,斯坦福、清华为代表的高校/研究机构以及初创企业。
国内研究则包括清华大学、浙江大学、复旦大学、中科院等顶级学府和机构,同时近两年不断涌现初创公司,如灵汐科技、时识科技、中科神经形态等。其中以清华大学的天机芯和浙江大学的达尔文芯片最具代表性。
国内类脑芯片企业不完全统计,制表丨电子工程世界
可以说,国内已经在各种形态的AI芯片上都有所布局,而国产的芯片算力也越来越强大,美国已经开始忌惮。
当另一方面,国内也在加强制造能力建设。ASML的2023Q3最新财报显示,Q3'23相比Q2'22中国净销售额占比从24%增长至46%。
要知道,半导体产业高度全球化,美国这样一定会自食其果。而我国商务部也表示,美方不当管制严重阻碍各国芯片及芯片设备、材料、零部件企业正常经贸往来,严重破坏市场规则和国际经贸秩序,严重威胁全球产业链供应链稳定。美国半导体企业损失巨大,其他国家半导体企业也受到影响。
参考文献 [1] 财经十一人:美升级对华AI芯片制裁力度,美芯片企业提出担忧.2023.10.18.https://mp.weixin.qq.com/s/a6r3faTG1t4PCn5hQVdrWw [2] 偲睿洞察:大模型背景下,AI芯片厂商面临怎样的机遇与挑战?|深度研报.2023.6.25.https://mp.weixin.qq.com/s/EUzg3R8vLrjS6KzIBRjaDw [3] 拓墣产业研究:中国芯片自主化风潮将进一步带动ASIC市场.2023.7.5.https://mp.weixin.qq.com/s/ZF6EuAh4oGOfj-KJntFc9A [4] ASML阿斯麦光刻:https://www.asml.com/en/investors/financial-results/q3-2023