最近特斯拉再次成为了焦点。一方面,CEO马斯克在推特的一举一动引发话题;另一方面特斯拉公司陷入各种困境:上海工厂停产计划延期、大量订单被取消、股市表现崩盘......
山雨欲来风满楼,内忧外患之中的特斯拉身上的光环似乎正在变弱。尽管存在许多挑战,特斯拉自研芯片的进度却并没有太受影响。近日供应链消息显示,特斯拉将使用4纳米制程打造其下一代自动驾驶芯片,这一订单可能会让特斯拉成为第七大客户。特斯拉在自研芯片上的努力,对于其他车企来说又能学到什么?
特斯拉的造芯之路
2021年在全球车企因缺芯大幅减产的时候,2021年特斯拉美国和中国的工厂开工率一直保持着9成左右,数据显示2021年特斯拉全球交付量超过93万,同比增长了87%。在各大车厂都因为缺芯发愁时,“特斯拉为何不缺芯”成为了各个车厂研究的课题。
究其原因,一方面,特斯拉在新冠疫情扩大的情况下也并未下调产量计划,这对其从零部件厂商手中获得稳定采购发挥了有益作用。另一方面,特斯拉针对缺货的半导体,通过改写软件为这些产品找到了替代品,由此减少了半导体缺货对生产带来的影响。由此可见,掌握芯片核心技术,是特斯拉的竞争力之一。
特斯拉的造芯之路经历了从买到造的过程。特斯拉的智能驾驶功能经历了从 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升级,其硬件系统也从 Hardware 1.0 逐步升级至 Hardware 3.0。
在 HW 1.0 时代,特斯拉采用了来自 Mobileye 的 EyeQ 系列芯片。进入 HW 2.0 时代,特斯拉找到了英伟达作为 Mobileye 的替代,采用定制版的英伟达 Drive PX2 自动驾驶计算平台(由 1 颗 Tegra Parker 芯片和 1 颗 Pascal 架构 GPU 芯片构成)。后来又升级为 HW 2.5,增加了一颗 Tegra Parker 芯片。但马斯克认为无论是Mobileye还是Nvidia,都无法满足特斯拉对于性能、研发进度、成本、功率方面的要求。自此,特斯拉走上了自研芯片之路。
2016年,前AMD 首席架构师Jim Keller加入特斯拉,任职Autopilot硬件工程师总裁。自此,特斯拉开启了自研芯片之路。
特斯拉的自研芯片
特斯拉的自研芯片FSD用于HW 3.0 完全自动驾驶计算平台中。2018 年 12 月,特斯拉开始使用新的硬件和软件堆栈对员工汽车进行改造。2019 年 3 月,特斯拉开始在其 Model S 和 Model X 汽车中批量出货 FSD 芯片和计算机。特斯拉 Model 3 的量产发货于 2019 年 4 月开始。
FSD芯片采用三星的14纳米工艺。包含 3 个四核Cortex-A72集群,总共 12 个 2.2 GHz 的 CPU,一个 1 GHz 的 Mali G71 MP12 GPU,2个2 GHz 的神经处理单元,以及各种其他硬件加速器。FSD的图像处理器能够提供0.6TFLOPS计算能力,运行频率为1GHz;2个神经网络处理器运行在2.2GHz频率下能提供72TOPS的处理能力。
为了提升神经网络处理器的内存存取速度以提升计算能力,每颗FSD芯片内部还集成了32MB高速缓存。HW 3.0的图像处理速度提升了21倍,成本降低了20%,代价仅仅是功耗从 57w 增加到了 72w。
安全系统方面FSD包含一个双核锁步CPU,该CPU对汽车执行器进行最后决策,该CPU确定FSD控制器上的两个FSD芯片生成的两个策略是否匹配,以及是否可以安全地驱动执行器。在相机接口方面,FSD芯片具有一个摄像头串行接口,该接口能够进行每秒高达25亿像素的处理。
在视频编码器方面,FSD芯片集成了H.265(HEVC)视频编码器,可用于各种应用,例如备用摄像头的显示,行车记录仪和云剪辑记录等。在图像信号处理器方面,FDS芯片集成了内部带有24bit流水线的信号处理器(ISP),该流水线旨在处理特斯拉汽车上配备的八个HDR传感器,并能够每秒处理十亿像素。而且具有降噪能力。
在神经处理单元方面,FSD芯片集成了两个定制的NPU,每个NPU都封装了32MB的SRAM,用于存储临时数据,从而减少数据存入主存储器。
每个周期,NPU从SRAM读取256字节的激活数据和另外128字节的权重数据到MAC阵列中。每个NPU拥有96x96 MAC,另外在精度方面,乘法为8x8bit,加法为32bit,两种数据类型的选择很大程度上取决于他们降功耗的努力。在2GHz的工作频率下,每个NPU的算力为36.86TOPS,FSD芯片峰值算力为73.7TOPS。在点积运算之后,数据转移到激活硬件,最后写入缓存,以汇总结果。FSD支持许多激活功能,包括ReLU、SiLU和TanH。每个周期,将128字节的数据写回SRAM。所有操作同时且连续地进行,重复直到完成整个计算。
特斯拉将一些硬件简化,虽然这会增加软件的复杂性,但这样可以降低芯片的成本。
只有深入了解软硬件之间的相互作用是什么,才能清楚到底应该用什么样的芯片去支持什么样的算法。FSD芯片彻底奠定了特斯拉在自动驾驶领域的领先地位。通过自研芯片特斯拉让硬件能与自家的软件算法更加契合,获得更好的兼容性和匹配度,提升产品核心竞争力。
特斯拉除了在自动驾驶芯片上有成果,更是在2022年推出了Dojo处理器芯片。该芯片由台积电制造,采用7纳米制造工艺,拥有500亿个晶体管,芯片面积为645mm²,小于英伟达的A100(826 mm²)和AMD Arcturus(750 mm²)。据Dojo项目负责人Ganesh Venkataramanan介绍,特斯拉Dojo是史上最快的AI训练计算机。相比于业内其他芯片,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空间节省5倍。而使得Dojo完成训练AI算法的重任,就是特斯拉自研神经网络训练芯片——D1芯片。
一家车企,不但攻克了自动驾驶芯片,还攻克了AI芯片。这样的车企在现阶段只有特斯拉一家,这是特斯拉在同行中芯片研发实力最好的体现。
特斯拉的特别之处
人们总把特斯拉与苹果相提并论,特斯拉高度的定制化,是市场将特斯拉视作另一个苹果的重要原因。与苹果一样,特斯拉经历了买芯片到完全自主研发的过程。苹果从过去产品高度依赖英特尔的芯片,到现在M系产品性能完全不输英特尔。特斯拉也是从依靠英特尔、英伟达到自研核心芯片。
同苹果一样,特斯拉是的大客户。根据预测特斯拉或将在2022年成为第七大客户;此外,据产业内消息,特斯拉Hardware 4.0 将由代工并在美国生产,未来特斯拉在对于或许会更加重要。业界以特斯拉生产计划预估,特斯拉明年生产规模将有望从300万辆起跳。如果特斯拉最新自动驾驶芯片在 2023 年开始量产,并且在 2024 年开始大批量上车的话,那么特斯拉的仍然会处于全球最领先的水平。
话说回来,车企造芯并不是什么新鲜事。虽然中国造车新势力都宣称要开启自研自动驾驶芯片之路,但特斯拉是首先拿出成果,实现自动驾驶芯片量产的车企。还有一批车企,更多的是通过合作、投资其他公司的方式布局芯片赛道;并且他们选择了门槛相对较低的MCU、IGBT等芯片。在没有新的车企发布自研芯片之前,特斯拉仍将在同行中一骑绝尘。毕竟这么多年,也没有几个手机厂超越了苹果。
离不开中国市场的特斯拉
中国市场是新能源汽车最大的市场,作为电动汽车销量最高的车企,特斯拉离不开中国市场。为了降低成本,特斯拉也在中国投资了多个企业。特斯拉在中国山东济南成立合资企业,注册资本额为1.5 亿美元。显示特斯拉除了正在利用台积电庞大的产能,为自己的车用与超级运算的芯片提供重要来源之外,也在车用芯片的设计上积极布局。
根据上图,特斯拉带动了相当一部分中国的供应商的业务。对于中国供应商来说,特斯拉来了,为了跟成本更低的中国品牌竞争,肯定要大规模国产,这导致供应链必然更倾向于中国本地厂商或者将原供应商引入中国。不管怎么样,特斯拉对应的供应链、产业链要在中国落地生根。这也就带动了中国的新能源汽车供应链。
总的来看,虽然面临着多事之冬,特斯拉的芯片实力仍在。如果说特斯拉在芯片领域存在竞争,那么最大的对手并非其他车企,而是来自英伟达与高通。就在特斯拉自研芯片发布后,英伟达推出了最新的Orin 芯片,单芯片算力还是计算平台算力达到了250TFLOP;2020 年初,高通发布了 Snapdragon Ride 自动驾驶计算平台,其算力和能效比都碾压了特斯拉 HW 3.0;2022年英伟达公布Thor芯片,单颗芯片算力达到2000TFLOPS,将于2025量产,这一芯片更是将汽车芯片算力带到了新时代。
随着汽车算力竞赛开启,特斯拉还能领先多久?或许正在推特忙碌的马斯克,并不知道答案。
相关文章