中美合造AI芯片?假的

2024-06-25  

这两天,美国又出新“制裁”了,禁止美国人对中国的芯片和AI等领域进行投资。在AI及大模型的快速发展下,AI芯片起到重要的作用,相关的讨论也此起彼伏,其中就夹杂了一些不实信息。


比如说,6月24日,外媒集体报道,为降低高端芯片的采购成本,确保芯片稳定供应,字节跳动(ByteDance)正在与美国芯片设计商博通公司(Broadcom)合作开发先进的5nm ASIC(应用特定集成电路)AI处理器。但被字节跳动证实,这是假消息。


AI时代,世界对于AI芯片的焦虑又更进一步了。


自研芯片,早有着手


互联网巨头字节跳动,一直都很关注AI。无论是在火山引擎上当“价格屠夫”,还是在其产品中推出各式各样的AI应用,至少对字节跳动来说,对AI算力的追求是无止境的。


外媒炮制字节跳动与博通合作的消息,无疑是进一步加剧国内对于AI芯片的焦虑感。根据外媒的说法,字节跳动与博通合作开发的ASIC,将会交由台积电5nm供应代工,并且该芯片符合美国对华限制政策。


之所以消息看起来很“真”,是因为字节跳动真的博通合作过,二者曾经在2022年起建立的商业合作关系。当时博通公开声明,字节跳动已购买博通的Tomahawk 5nm高性能交换芯片,以及Bailly交换机,这些产品都能极大推动超大规模数据中心和AI计算集群的建设。


外媒还继续透露,为了增强AI算力,字节跳动储备了大量英伟达A100和H100芯片,以及英伟达为中国市场设计的A800和H800芯片。并且,字节跳动去年还购买了华为的Ascend 910B芯片。


事实上,与其他跨界造芯的互联网巨头一样,字节跳动也曾经积极推进自研芯片。


2022年7月,字节跳动副总裁杨震原在“2022火山引擎原动力大会”上接受媒体采访时确认,字节跳动正在开展自研芯片。


与此同时,字节跳动当时表示,现在并没有CPU、GPU这样的通用芯片业务的商业计划,自研芯片主要围绕自身视频推荐业务展开,研发团队将为字节大规模视频推荐服务专用场景定制硬件优化,如视频编解码,云端推理加速等,以期提升性能,降低成本。


目前,字节跳动在其网站上发布了数百个与半导体相关的职位,其中包括15个ASIC芯片设计师的岗位。此外,字节跳动还在积极从其他中国AI芯片公司招募顶尖人才,以提升在AI芯片领域的研发实力。


总之,字节跳动是渴望自研力量的,但并不是和美国合作开发,而是靠自己。


用ASIC,突破AI算力困境


从上面的新闻中不难看出,字节跳动的重点在于自研ASIC。那么,为什么偏偏是ASIC,而非GPU?


随着英伟达的市值步入全球第一,人们才意识到,都是做AI芯片的,英伟达一家独大了。


看似踩着AI浪潮“走狗屎运”的英伟达,其实每一步都踩中了公式,猜对了AI时代下一步的需求,就这样拿着它的CUDA、NVLink等技术“卡着全世界的脖子”。换句话说,想做GPU,先跨过英伟达的专利大山和生态,毕竟强如英特尔、AMD,都很难取得领先优势。


更困难的是,英伟达在2024年3月的“CUDA禁令”,更是把这护城河拓成了护城海,好似在说:“AI计算的果子是我的,其它硬件谁也别想碰瓷使用CUDA。”


对比起来,GPU也许不是最适合AI计算的硬件,只不过现阶段还没有更优的解决方案。


FPGA又贵又难,很难大规模部署起来,只适合对时延要求高的应用。存算一体、类脑芯片都刚刚起步,成本也不够划算。


ASIC算力强劲,所谓的VPU、TPU、NPU都是它,但算法固化,设计好了就没法更改了,而且没有GPGPU通用,但也仅此能够拼过英伟达。


ASIC芯片分为全定制、半定制和可编程三种。全定制ASIC性能最优,算力超半定制8倍。半定制ASIC结合标准逻辑单元和自定义设计。可编程ASIC(PLD)通过编程满足特定需求,具灵活性。这就要看厂商自己对于芯片上的取舍,要一些灵活性,还是追求极致的算力。


适用于AI计算芯片主要类型,制表丨电子工程世界


所以,大多数厂商都开始使用ASIC当作自己AI芯片的主要类型,毕竟固定跑AI任务,此时就能发挥ASIC高性能、低功耗、小尺寸的优势,而且价格上比较低。加之融合32位微处理器、存储单元和网络接口等组件,形成SoC(片上系统),继续发挥强势性能。


比如说,英特尔Guadi 3的定价最近被曝光,128GB的ASIC芯片售价为15650美元,对比英伟达80GB H100卡的30000美元,售价只有其一半,同时在流行的大语言模型(LLM)训练速度方面比英伟达H100平均快了40%。


科技巨头,也纷纷将注意力放在ASIC上。博通是全球第二大人工智能芯片公司,仅次于英伟达,ASIC销售额达到数十亿美元。谷歌正在与Broadcom合作,正在牵头开发第五代张量处理单元 (TPU),这些芯片在处理AI工作负载时比GPU快10倍。微软与Global UniChip和 Marvell建立合作伙伴关系,开发出Maia 100和Cobalt 100芯片。在汽车领域,特斯拉与Alchip 联手,推出专为自动驾驶汽车而设计的 AI 超级计算芯片 Dojo。


只能说,未来的ASIC形态的AI芯片,市场非常广阔。摩根士丹利预计2023年至2027年间,专用于人工智能的ASIC芯片市场每年将增长85%,达到300亿美元。


AI芯片的自主力量


国内的ASIC芯片,分为多种玩家。


一种,是专门设计制造ASIC的公司,包括寒武纪、地平线、耐能科技等厂商,分别专注AI芯片的细分领域,采用“大客户捆绑”模式进入大客户供应链。


另一种,是各种跨界选手:vivo先于2021年9月发布ISPV1,再于2022年4月发布升级产品V1+,并在2022年11月发布V2;OPPO在2021年12月发表能强化手机图像处理性能的NPU MariSilicon X,之后在2022年12月揭露采用台积电6nm RF制程的蓝牙音讯SoC MariSilicon Y;阿里巴巴在2019年9月发布AI芯片含光800。


国内ASIC芯片玩家不完全统计,图源丨 偲睿洞察 


总的来说,目前全球ASIC市场还没有特别明显的头部厂商,而且国产性能也与国外没有太大差距。比如说,Ascend 910在BF16和INT8算力钧超越Goggle TPUv4,遂原科技和寒武纪产品整体性能与Google比肩。所以,在AI芯片赛道上,国产ASIC或许会是突破算力困境的关键。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。