大算力需求下的SoC芯片

2023-12-01  

潜力无限。


随着汽车电动化智能化发展,单车芯片用量持续上涨。据测算,到2025年,燃油车平均芯片搭载量将达1243颗,智能电动汽车的平均芯片搭载量则将高达2072颗。还有一个数据是,据预测,2025年中国新能源汽车销量将高达1524.1万辆,其中智能电动汽车渗透率将高达80.1%。


大算力需求下的SoC芯片


所以,随着智能电动汽车市场需求不断增强,未来汽车行业对车规级芯片的需求也将膨胀。而这个需求涉及到的汽车行业最热的技术点,有两个,智能座舱和自动驾驶,同时,这也是SoC芯片的两大应用方向。


系统级芯片(SoC,System-on-chip,片上系统)相比MCU在架构上,增加了音频处理DSP、图像处理GPU、神经网络处理器NPU 等计算单元,常用于ADAS、座舱IVI、域控制等功能较复杂的领域。


实际上,SoC芯片的销量也将水涨船高。根据168 Report最新调研报告,2023年全球自动驾驶SoC市场规模大约为33.05亿美元,预计2029年将达到130.2亿美元,未来几年年复合增长率CAGR为25.7%。


另一份报告也差不多,ICV报告的最新数据,2022年智能座舱SoC全球市场规模为30.92亿美元,预计到2025年这一数字将突破50亿美元,CAGR约为14.1%。


大算力需求下的SoC芯片


从市场份额来说,“赢家通吃”的集中度特别高。全球范围内,自动驾驶SoC主要生产商包括Mobileye、Nvidia、Tesla和地平线等,其中2022年前五大厂商占有大约94.6%的国内市场份额。那么,对于后来者来说,难度就变得非常高了。


造芯,得有钱


汽车正逐渐成为“车轮上的数据中心”,而SoC的数据对OEM来说至关重要,因为只有掌握这些数据,OEM才能前瞻性地部署无线(OTA)更新来解决当前车辆的问题。


但汽车开发周期较长,新车型从研发到上市验证需要至少两年的时间,意味着汽车芯片设计必须具有前瞻性,能够满足顾客今后3~5年内的前瞻性需求。同时,车规级芯片也表现出产业化周期长、供应体系阈值高等特点。


比如,从芯片功能定义到流片/封装测试完成,大约需要2年时间,如果早期车规芯片不涉及功能安全,那么这个过程可以加速。但从芯片测试完成→量产,大约需要1年半~2年时间,这个环节时间必不可少,因为涉及AECQ100,ISO 26262等功能安全认证,还有夏季冬季认证,一级软件认证等。


大算力需求下的SoC芯片


图表来源于网络


实际上,进入汽车电子主流供应链体系要满足多项基本要求:


  1. 满足北美汽车产业所推出的AEC-Q100(IC)、101(离散元件)、200 (被动零件)可靠度标准;


  2. 遵从汽车电子、软件功能安全国际标准ISO 26262;


  3. 符合ISO 21448 预期功能安全,覆盖基于非系统失效导致的安全隐患;


  4. 符合ISO21434 网络安全要求,合理保证车辆及系统网络安全;


  5. 满足零失效供应链品质管理准则IATF 16949 标准。


基本上一个芯片车规级认证一般需要3~5年的时间,这对于芯片厂商来说是巨大的技术成本,生产成本和时间成本考验。Mobileye用了整整8年才获得第一张车企订单,英伟达主力芯片Xavier的研发耗资达20亿美元。


根据 IBS 的估计,开发一块芯片的成本,包括IP许可、 EDA(电子设计自动化)软件、研发、tape out(最终设计过程)、包装和测试费用,对于16nm技术节点,总计流片费用为1.06亿美元。对于7nm技术节点,总计流片费用为2.98亿美元;而对于5nm技术节点,流片费用为5.42亿美元。


大算力需求下的SoC芯片


因此,要烧得起钱,才能进行先进制程流片,此外,能否拿到先进制程的产能,也是能否大规模量产的关键因素。像中国手机巨头OPPO宣布,停止“造芯”计划,解散研发公司,就是一个无奈而悲壮的事。


SoC 芯片核心壁垒


自动驾驶领域所用的大算力SoC芯片的设计和制造具有很高的门槛,要综合性能、功耗、成本、车规安全多方面因素。所以,国内虽然有那么多芯片设计公司,能跑出来的毕竟是金字塔的塔尖。


首先,异构、多核SoC设计和优化能力直接决定了大算力AI芯片的性能、可靠性和安全性等。所以,对于SoC这种集成度高、需深度运行软件算法的AI计算控制芯片,里面有两大技术难题。


其一,要深入了解AI算法,尤其背后使用的神经网络。否则,等芯片研发出来后发现算法与硬件架构兼容性差将会使芯片效率大大降低。另外,要对各种IP授权深刻理解,才能设计出好用的芯片。


第二点,是性能/功率比为评价AI芯片的关键指标,并且创业公司要有足够资金进行先进制程流片。


大算力需求下的SoC芯片


像英伟达的Drive Orin能够达到3.6TOPS/watt的性能,Mobileye的EyeQ4也可以从0.83TOPS/watt 上升到1.6TOPS/watt,并且在即将推出的Ultra 版本中超过1.76TOPS/watt。特斯拉已经在2019年的 HW3.0中实现了2.0TOPS/watt,下一代HW4.0平台中会有更实质性的改进。


持续提高AI芯片性能的方法有:一、持续优化SoC架构。如引入更强大的ASIC芯片——神经网络加速器(NNAs)、NPU 或 DLAs;二、采用更先进的芯片制造技术可以有效降低整体功耗。


而自动驾驶领域用的SoC芯片,目前市面上主流的架构方案分为三种:(1)CPU+GPU+ASIC,(2)CPU+ASIC,(3)CPU+FPGA。就产品类型而言,目前CPU+ASIC+GPU是最主要的细分产品,2022年占据大约58.5%的份额。不过,未来会是CPU+ASIC的天下。


而各大自动驾驶SoC芯片厂商将自研“XPU”IP作为竞争重点。比如,特斯拉经历了早期使用黑盒方案的Mobileye EyeQ3,到较为开放的Nvidia Drive平台,再到如今NPU芯片自研。并且,将芯片、算法紧耦合,尽管目前特斯拉芯片算力不是最高,但其软硬一体的融合度效率高于其他 OEM方案。


大算力需求下的SoC芯片


而国内的黑芝麻智能则先后打造了NeuralIQ ISP图像信号处理器和深度神经网络算法平台DyanmAI NN引擎两大核心IP。前者是让车“看得更清楚”,后者是让车“看得懂”。通过NeuralIQ ISP图像信号处理器处理后的图片,将传递到深度神经网络算法平台DyanmAI NN引擎上。


从跨域融合到Zonal架构


随着汽车电子技术的不断发展,以及跨域融合趋势如火如荼,很多企业将目光放远至更加前沿的第三代Zonal架构(区域架构)。


除了芯片,从车辆计算系统到Zonal架构,Zonal架构作为一种终极形态,具有模块化设计、分布式控制、可靠性设计和开放式接口等优势,未来将会应用于更广泛的应用领域,实现更高级的自动驾驶和智能交通功能。


在Zonal架构物理分区基础之上,计算芯片根据“端侧-区域-中央”分布层级可归为三类:负责端侧部件智能化的轻量级AI计算芯片;负责区域就近计算、智能分配电、承载车辆骨干通信节点的域处理器;负责大计算任务的中央计算芯片。


业内的共识是,未来5-10年中,中国本土主机厂将逐步实现从跨域融合到Zonal架构演变,域控制器和域处理器将是AI计算芯片的竞争热点。


大算力需求下的SoC芯片


随着架构进一步集中化发展,主机厂将向One Brain车云计算架构迈进,彼时中央计算芯片将切实成为新的核心布局点。


在“软件定义汽车”浪潮下,芯片产品早已不再局限于芯片本身这一硬件,软硬协同能力成为衡量芯片产品性能的重要指标,尤其对于SoC这种集成度高、需深度运行软件算法的AI计算控制芯片。于是,“芯片+算法+工具链”成为行业内主流芯片产品方案。


芯片厂逐渐向上布局软件,以开放平台吸引主机厂与之合作,两者之间的合作模式随之逐步走向开放透明。从黑盒模式到IP授权,芯片厂逐渐聚焦核心IP研发,而由主机厂定义上层软件及应用,芯片开发与整车开发深度融合、协同,整车开发流程因而缩短、产品迭代加速。


由于芯片厂与主机厂的联系越发紧密,车规级芯片供应链正由传统的“主机厂→Tier1→芯片厂”固定链条式结构向更加扁平的网络状结构演进,产业中各个环节之间都将构建起更紧密的网络,而这种紧密的产业协同将成为车规级芯片产业发展的主旋律。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。