在推特号称「绿神」的@greentheonly 最近公开了特斯拉最新HW4.0的硬件实物图片。
这些信息非常有价值,我们可以一窥HW4.0中二代FSD芯片的最新进展和相关技术水平。
HW4.0的硬件是「绿神」拆解自最新款的 Model X 车型。
据悉,特斯拉HW 4.0或将在特斯拉举办的投资者日上正式亮相,并开始全系量产上车。
从硬件实物来看,全新的HW 4.0不仅拥有性能更强的芯片,摄像头分辨率、数量以及位置也发生了相应变化,同时 HW 4.0 还将新增一个4D毫米波雷达。
01
特斯拉二代FSD由三星代工,采用7纳米工艺
早在2021年,外界就有传闻FSD二代将由三星代工,也有一种说法是特斯拉与三星联合开发。
到了2022年下半年,又有传闻称FSD二代由台积电代工完成,且言之凿凿地说是5纳米甚至4纳米,还有消息称这是第一颗车载4纳米芯片。
特斯拉二代FSD芯片真身,根据芯片表面丝印的数字,编号H2238,可以推断出这是三星代工,并且极有可能只是7纳米,不是5纳米。
上图为初代FSD芯片,编号H1834
另外,Green在推特上说「still samsung exynos IP」,这一点信息有误。
众所周知,三星自研CPU架构早在2015年就停止了,现在三星都是采用ARM的公版架构,没有自主IP,并且初代FSD是三星代工的,所以用「still」,实际上是二代FSD仍然由三星代工。
芯片代工捆绑程度很高,如果一开始选定某家晶圆厂代工,需要双方合作建立该芯片制造工艺的library,想要中途改换,需要重建library,时间周期很长,最少需要1年时间,浪费大量研发成果。
特斯拉为什么选择三星?
主要原因恐怕还是成本——7纳米芯片,三星的代工价格不到台积电的1/3 甚至1/4,三星低价抢单后果就是晶圆代工部门营业利润很低,2021年大约 6%,2022年大约10%,而台积电是接近50%,是三星的5倍。
台积电的产能一向不宽松,相对于苹果、高通、英伟达和AMD动辄千万上亿的出货量,特斯拉的订单台积电根本看不上。
5纳米,台积电更是完胜三星,3纳米也是如此。
无论闸极还是内联线宽,台积电都完胜三星。这意味着在功耗方面,三星比台积电逊色不少。
特斯拉选择三星,就不大可能选择还不太成熟的5纳米工艺,因为三星的5纳米比7纳米提升不多,功耗也偏高。
特斯拉选择三星只能选7纳米,因为工艺更成熟。
此外,还有地理优势。
特斯拉总部目前在德克萨斯州奥斯汀哈罗德格林路,特斯拉最大工厂也在奥斯汀,特斯拉Cybertruck唯一工厂也在奥斯汀,而三星的晶圆代工厂跟特斯拉在同一个城市,也在德克萨斯州的奥斯汀。
准确地说是在奥斯汀略微偏北的Taylor,离特斯拉并不远,双方可以互相高效沟通。
2021年11月月,三星响应美国政府号召宣布在美国德州投资170亿美元建立S2-2晶圆厂。
此前的S2-1工厂最高只有11纳米,S2-2厂可以到7纳米,预计2023年年初投产。
特斯拉的二代FSD芯片应该就在S2-2厂代工。
台积电在美国也在建厂,不过地址在亚利桑那州的大凤凰城,且在2024年底才能投产。
02
详解 HW 4.0,特斯拉第二代 FSD 究竟实力几何?
特斯拉HW4.0正面PCB如上图,Green在推特上说二代FSD的CPU内核由12个增加至20个,运行频率在1.37GHz-2.35GHz之间。
初代FSD使用了12个ARM Cortex-A72 CPU内核。
A72 是 ARM 在 2015 年推出的架构,性能大约为6.1-6.5DMIPS/MHz,最高运行频率差不多也是2.4GHz,像后来推出的A76、A77、A78最高运行频率可以达到3GHz以上。
从搭载CPU的性能来看,这也反证特斯拉HW4.0使用的还是2015年的 A72。
按初代频率2.2GHz计算,20内核A72的算力是20*2.2K*6.5=286K,与英伟达Orin的12核心 A78AE比稍微低一点,Orin是300K DMIPS。
与HW3.0 相比,HW4.0一个明显的区别是HW4.0元件更多。
HW4.0上下还各多了24路供电,尤其下面的12路供电,电感体积颇大,并联的钽电容阵列也颇为壮观(大概率是松下的高精度钽电容)。
HW3.0的供电只有4路,HW4.0则多了20路。我个人推测是因为二代FSD的功率大幅度增加了,估计每片二代FSD的功率是80-90瓦,甚至有可能是100-120瓦,否则没必要增加这么多路供电。
这同样也反证了二代FSD采用的是7纳米工艺。
为什么这么说?
这实际上与电脑主板供电类似。
上图是典型的电脑主板,完整的CPU供电设计一般都需要包含上述部分。
PWM芯片起到总控制作用,每一相完整的供电都是由:
1-2个电感(一般是并联或倍相的情形)
1-4个MOS(一般是高级的Dr.MOS/2~4个就是常规的上桥+下桥)
数个滤波电容(中低端主板固态电容,高端主板用钽电容)等构成
电脑主板供电和车载运算系统供电是完全相同的:一般是开关电路。
开关电路是控制开关管开通和关断的时间和比率,维持稳定输出电压的一种供电系统,主要由电容、电感线圈、MosFET场效应管以及PWM脉冲宽度调制 IC 组成。
这一电路系统发热量低,转换效率高,而且稳压范围大、稳压效果好。
一般来说,功率65瓦的电脑 CPU 一般是4相或者6相供电,250瓦的显卡一般需要8相供电,500瓦的RTX 4070 Ti显卡一般是12+3(12路GPU,3路显存),更为高级的是16+4路。
多相供电的好处很多:
提供更大的电流;
降低供电电路的温度,因为电流多了一路分流,每个器件的发热量自然减少了。多相供电电路可以非常精确地平衡各相供电电路输出的电流,以维持各功率组件的热平衡;
利用多相供电获得的核心电压信号也比单相的来得稳定。
但多相供电的缺点是成本较高,而且对布线设计、散热的要求也更高,因此功率越大的产品所用的供电相数越多。
特斯拉使用了24相供电(估计两颗FSD是18路,6 路是显存的),尽管采用了水冷,推测两颗FSD的功率仍然有大约150-200瓦。
而Orin是多少呢?顶配64GB的Orin AGX最大功率为60瓦。
与HW3.0不同,HW4.0的背板多了8颗内存,FPGA代号为D9ZPR,实际型号是MT61M512M32KPA-14 AAT:C,特斯拉不惜血本,用上了最顶级的GDDR6。
GDDR是Graphics Double Data Rate的缩写,为显存的一种。
GDDR有专属的工作频率、时钟频率、电压,因此与市面上标准的DDR存储器有所差异,与普通DDR内存不同且不能共用。
一般来说,GDDR比主内存中使用的普通DDR存储器时钟频率更高,发热量更小,更适合搭配高端显示芯片。
GDDR则是电脑爱好者熟悉的高级显存,GDDR6是英伟达2018年发布20系列显卡才开始出现的。
目前最强的消费级内存是2020年英伟达携手美光推出的GDDR6X。
不过和AI训练用芯片普遍使用的HBM2内存还是差距明显,当然了,HBM2 价格远高于GDDR6X。
车载领域目前都是LPDDR,特斯拉又开创先河:第一次在车载领域用 GDRR。
为什么之前没有车企使用?
一是算力需求不高;二是GDDR功耗高,用于车载领域并不适合。
不过特斯拉不在意,台式机的GPU都敢放在车里,更不用说功耗略高的GDDR了。
LPDDR参数
GDDR6参数
GDDR6最高运行频率远高于LPDDR5,最高可达1750MHz,传输速率大约是12800MT/s,是LPDDR5的两倍,代价是——功耗也差不多是 LPDDR5 的两倍。
特斯拉不惜血本,用了16 GDDR6,总计32GB,仅此一项成本就有大约200-250美元,HW3.0则是8颗LPDDR4,总容量16GB,估计要20美元。
Flash存储方面,HW3.0是东芝的THGAF8G8T23BAIL,这是32GB的UFS,不过是较为陈旧的UFS2.1标准。HW4.0改用三星的KLUDG8J1ZD,容量提高到128GB,但依旧是UFS2.1标准。
03
二代FSD的算力有多高?
对于特斯拉这种One Shot型的NPU,增加算力就是增加晶体管数量,同样的Die大小就要提高密度。
二代FSD的Die面积看起来差不多大小,考虑到A72的核心增加到了20个,也会占用部分Die面积,估计算力最多提高三倍,也就是216TOPS,仍然低于Orin。
不过FSD的SRAM容量比较足,这是特斯拉一贯特色,二代FSD的实际算力和理想值会比较接近。
左边是HW4.0,右边是HW3.0
上面一层是座舱车机,下面一层是智能驾驶
单从接口看,HW4.0至少有两个以太网接口,从连接器判断是标准的单对线车载以太网,不是早期的EAVB以太网。
在两片FSD下面似乎有两片车载以太网物理层芯片,应该是较新的 88Q2112。
新增以太网接口正是为了对接特斯拉自己开发的4D毫米波雷达,传统毫米波雷达用CAN或CAN-FD连接,4D毫米波雷达信息量大,需要用百兆以太网。
板子中间最下方可能是以太网交换机,HW3.0是Marvell的88Q6321。
HW4.0显然不会在使用这种相对落后、非严格车规以太网芯片。
据推测,HW4.0应该换成了性能较为先进的博通BCM8956X或BCM8947X,也有可能是来自中国台湾瑞昱,因为车机板上的以太网交换机正是瑞昱的产品。
左图是HW3.0的智能驾驶接口。右图是HW4.0,上面一层是HW4.0的智能驾驶的接口,座舱有两个显示屏输出接口。
智能驾驶方面:
红色作为预留接口;
蓝色代表驾驶员行为监测。
白色为连接两个后向摄像头;
黑色为前视摄像头,可能两个都是500万像素。
我个人推测,特斯拉HW4.0减少了一个前视摄像头,增加了一个后向摄像头。
特斯拉用了两片4路解串行芯片,估计是美信的MAX96712,这个芯片在国内非常抢手。还有一片可能是2路解串行。
HW3.0则是两片德州仪器的DS90UB960和一片DS90UB954,尺寸明显比美信的要小。
其余地方差别不大,仍然是Spansion的64MB Nor Flash做Boot Loader。
电源管理似乎还是美信的MAX20005。U-BLOX的GPS被取消了,换成了更高级的三波段GPS。
这是HW4.0的车机部分,将CPU与GPU合二为一,放在一张PCB板上。
车机背板,无线通信模组还是AG525R-GL,蓝牙与WiFi还是LG INNOTEK的ATC5CPC001。
总结一下,HW4.0与HW3.0相比,进行了如下的更新:
(1)HW4.0比HW3.0的面积更大,集成度更高。例如HW4.0的车机部分,将CPU与GPU合二为一,集成在一张PCB板上;
(2)内核部分升级不大,HW4.0 CPU内核从12个增加到20个,最大频率2.35GHz,默认频率1.37Ghz,TRIP内核数量从2个增加到3个,最大频率2.2GHz。
(3)HW4.0 NPU芯片封装面积增大,供电部分加强,HW4.0功耗大概是HW 3.0的2倍;
(4)HW4.0开创先河,在车载领域率先使用GDDR,HW4.0将显存升级到16G GDDR6每核心,超过HW3.0每核心8G LPDDR4,推测FSD整体算力得到3-5倍提升;
(5)在域控模块的PCB板上,摄像头接口增加:由HW 3.0的9个接口增至12个摄像头接口。具体来说,由原来的前置三目摄像头变为了双目,布局为:2个侧视摄像头,1个前摄像头、1个倒车影像摄像头、4个侧向ADAS摄像头以及座舱内的1颗摄像头,一共11颗,还有1颗备用摄像头。前向感知摄像头从120万像素提升到了500万像素。
(6)GPS模块升级,使用了三频GPS天线模块,新增L5频率,以提升定位精度;
(7)新增了毫米波雷达接口以及雷达加热器;
(8)HW4.0主板整体采用对称设计,配置均为双备份;
总体而言,HW4.0的升级主要集中在FSD芯片和传感器架构。
英伟达Orin是2019年12月推出,特斯拉的二代FSD估计是2020年开始设计。
两相对比,谁更优秀,相信聪明的读者已有答案。
相关文章