将在纽约州布法罗市(Buffalo)投资5亿美元建造“”超级计算机,之所以决定在该州建超级计算机,是因为当地有着“可靠的电力供应、强大的人才梯队,以及项目所需的可用空间”。
本文引用地址:是在2021年的「AI Day」活动上首次公布的自研超级计算机,旨在帮助推进其尚未实现的制造汽车的目标。特斯拉计划利用这台超级计算机处理从其电动汽车上获取的大量视频数据,以训练目前为其最先进的驾驶辅助软件提供动力的人工智能,为其全系统(FSD)提供支持。
对于特斯拉的意义
推出Dojo超级计算机平台对特斯拉的FSD技术的推进具有重要意义。特斯拉一直致力于通过软件定义汽车,并且深知对于特斯拉的战略意义。马斯克就表示过,特斯拉的市值和能否完善自动驾驶技术密切相关,而软件是决定自动驾驶的关键因素FSD则需要大量的数据处理才能进行更新和迭代。
可以将所有特斯拉汽车理解为一个个的终端,或者理解为一个个的传感器,而Dojo才是核心。通过把每个终端采集的数据传输到超算系统,由这套超级计算器对采集信息进行不断的分析,在每次分析中即可做到学习和进步 —— 在Dojo架构之下,特斯拉汽车的智能驾驶系统的“大脑”就能不断的被训练,实现每个终端的不断成长,能够让自动驾驶越来越可靠、越来越安全。
因此,特斯拉将尽快部署Dojo超级计算机,以加速FSD的落地。相比于英特尔的泛用计算模型,Dojo超级计算机将大幅加快特斯拉的AI模型改进进度。据悉,仅需4个Dojo超级计算机就能完成相当于4000个GPU的自动标记工作。
值得一提的是,Dojo的价值其实也完全可以溢出到特斯拉之外。马斯克在2020年就曾经表示,有可能会将Dojo像亚马逊的AWS那样开放出来作为一种订阅服务;另外,如果我们把Dojo项目的关注范围转移到特斯拉汽车之外会发现,特斯拉的人形机器人业务Optimus实际上也是在运行FSD软件。
在马斯克的长期商业愿景中,Opitmus也是特斯拉价值体系的重要承载者,它未来的产量甚至会远远超过特斯拉的汽车数量。从这个角度来看,Dojo不仅仅是在特斯拉汽车业务的FSD提供支撑,也是在为数量可能会更为庞大的特斯拉人形机器人业务的FSD提供支撑。而FSD在汽车和机器人业务上的落地数量越大,Dojo的潜在价值就会越大。
Dojo已经不仅仅是特斯拉用来在云端训练自动驾驶模型的超级计算机;实际上,它已经成为整个特斯拉AI业务体系发展的基础设施。Dojo V1是面向大体量的视频训练而高度优化的,并非是面向通用目的AI,但Dojo V2将解决这样的限制。这意味着,Dojo在未来演进到某个阶段之后,除了对FSD进行支持之外,还非常有可能被用于解决通用人工智能(AGI)的问题。
从更大的角度来说,Dojo其实也是马斯克AI野心的关键承载者。马斯克认为Dojo超级计算机是一个高风险、高回报的项目,表示特斯拉在Dojo上的花费将"远远超过10亿美元",并计划扩大规模推出Dojo 1.5、Dojo 2、Dojo 3等等。
自动驾驶变为的比拼
其实,这里有一个大前提是:伴随着特斯拉车辆的销量增加,以及它要在自动驾驶层面实现的功能复杂度提升,使得特斯拉所要处理的视频数据体量出现了指数级增长,这对特斯拉在云端进行模型训练的能力提出了更高的要求,其中的关键就是基础设施。
基于这个前提,马斯克给Dojo设定的技术特征是:拥有大算力,能够处理大量的视频训练数据,能够高效运行带有大量参数、大内存和超高带宽的超稀疏(hypersparce)阵列。所以这次5亿美元的投资虽然是一笔巨款,但特斯拉今年在硬件上的花费将超过这个数字,另外特斯拉透露除了也将会使用AMD芯片,没有具体说明是哪一款,但很大概率会是Instinct MI300系列。
眼下,特斯拉无疑依旧是离不开,它还有很多AI任务要运行GPU之上。但是,对于马斯克来说,在他下定决心做Dojo项目的那一刻,特斯拉与英伟达在云端计算机和AI层面的分道扬镳就已经注定了。
Dojo由D1芯片提供动力。根据特斯拉公布的数据,与英伟达的A100 GPU相比,每一颗D1芯片(配合特斯拉自研的编译器)在自动标注(auto-labeling)任务中最高能够实现3.2倍的计算性能,而在占用网络(occupancy network)任务中最高能够实现4.4倍的计算性能;如果从总体目标来看,在同样的成本之下,所构建的Dojo超级计算机能够实现4倍的性能,能耗比提升1.3倍,计算系统的占地面积也会缩小为以往的5倍。
在Dojo之前,特斯拉在AI和自动驾驶领域的布局已经非常深入,无论是自研算法还是车端的FSD芯片,都显现出了让业界惊叹的实力。特斯拉之所以自研Dojo,其目的与它自研FSD芯片一样,也是为了垂直整合,减少对英伟达GPU的依赖。而从技术维度上整体来看,特斯拉决定自研Dojo,也是它保持自身战略自主能力的一次重磅举动。
Dojo超级计算机在构建过程中,除了要解决算力运行层面的芯片、内存、带宽等技术难题,也要解决与之运行密切相关的软件、功耗、冷却等问题。实际上,秉承着软硬件一体化和全栈自研的原则,特斯拉通过自研软件和开源软件的结合,为Dojo打造了一个专属的全栈软件系统,其中包括底层驱动软件、编译器引擎、PyTorch插件和上层的神经网络模型等。
伴随着Dojo的发布,特斯拉成为一家真正拥有从云侧到端侧、从芯片到算法、从硬件到软件的全栈自研和垂直整合技术能力的人工智能企业。当传统车企和造车新势力都进入市场进行竞争时,特斯拉从产业价值链上寻找技术制高点来提高竞争力,并构建“数据+算法+算力”的完整智能生态体系,持续提高技术竞争壁垒。
当前,汽车行业正在加速向智能化转型升级,特斯拉超级计算机的投产,将进一步推动自动驾驶技术落地应用和产业发展,并有望带动传感器、智能云、车规级AI芯片、智能座舱等相关产业高速发展。
动力来源于压力
特斯拉发布了近来“最不赚钱”的季报和年报:2023年Q4毛利率为17.6%,为2019年来最低;全年毛利率18.2%,2017年以来首次负增长,同比下滑7.35个百分点。年度总营收为967.73亿美元,同比增长19%,归母净利润也同比增长19%至149.97亿美元,但若扣除非经常性损益利润,则同比下降23%至108.82亿美元。
更重要的是,此次特斯拉没有给出2024年的销售指引(预计销售目标),对于此前40-50%的中期年复合增长目标,特斯拉首席财务官Vaibhav Taneja在财报电话会上明确表示:“销量增长将会较低”。而2023年四季度,比亚迪以52.64万辆的全球纯电销量,超过了特斯拉(48.45万辆),成为新的全球季度销冠。但究其增长放缓的原因,下一代平台产品并不负主要责任。
首先,汽车业务仍是特斯拉的核心营收来源。2023年特斯拉汽车、能源、服务业务营收分别为824.2、60.4和83.2亿美元,其中汽车业务占比总营收的85%,同比2022年降低了2.6个百分点。
而降价却导致特斯拉2023年的汽车销量增长了个“寂寞”:2023年Q4交付量同比2022年Q4增长19.5%,但营收仅同比增长1.2%;从价格来看,特斯拉Q4单车收入44505美元,同比下降15.3%,环比下降1.3%。
中美特斯拉Model Y长续航和标准续航版价格和成本(实线表示价格,虚线表示成本;蓝色美国、红色中国)
在中国,激烈竞争的价格战仍未有停歇的迹象,并且已经蚕食了不少利润。有分析师的数据显示,特斯拉在中国的售价于2022年Q1开始低于美国成本,在2023年Q3开始接近成本价。
与此同时,特斯拉已经逼近规模效应的极限。Vaibhav Taneja表示,尽管特斯拉在每个环节和链条上致力于降本,但“未来不能同样的预期来考虑成本削减情况。因为我们当前的平台(model 3/Y的平台)正在达到(成本下降)的极限。”
随着现有平台达到成本极限,特斯拉“预热”数年的廉价车终于迎来了较为明确的量产时间点:2025年下半年或年底,新一代平台产品将在得州工厂率先量产,之后在墨西哥工厂建成后投产;2025年年初,将寻求在北美以外的地区建立第三个工厂生产新平台车型。
新一代车型“盒装模式”的投产将是堪比model 3的量产地狱。仅依据目前的官方信息,很难想象各构件之间采用何种技术进行拼接,以及全车电子电气架构如何布置和打通,考虑到船舶制造业也有类似的盒装模式,开箱工艺对零件、构件的公差要求将极其严格。
在财报发布前夕,大量来自车主的特斯拉FSDV12 1.2版本测试视频在网上出现,马斯克在电话会上表示:“我们将在未来几周内向所有要求完全自动驾驶的美国客户推出(V12版本)。”目前,特斯拉仅北美地区可应用V12的车辆保有量就有40万辆,特斯拉每天能够获得从人类真实驾驶场景中回传的「1600亿帧视频」数据作为V12系统迭代的燃料。去年,特斯拉在训练计算上花费超过20亿美元,已启动一万张英伟达H100构成的超级数据中心。不难看出,下一步特斯拉将采用英伟达和Dojo“两条腿”走路的方式:一方面继续“买卡”,另一方面则继续建设Dojo。
2023年9月份,摩根士丹利发布的报告指出,Dojo可以为特斯拉节省高达65亿美元的成本,会为其在潜在价值10万亿美元的自动驾驶市场中带来不对称优势,并且将会为特斯拉带来高达5000亿美元的市值增幅。
需要注意的是,2023年12月份,知情人士透露特斯拉Dojo超级计算机项目负责人Ganesh Venkataramanan已于2023年11月份离职,而据悉他领导Dojo项目长达5年,这可能会对该公司的自动驾驶努力造成打击。目前,Dojo项目由苹果前高管Peter Bannon负责。