谈纯视觉,绕不过的就是特斯拉。 先说第⼀点:纯视觉这这条路真的⾮常难⾛。 「纯视觉这条路不好⾛」 参考特斯拉。也是在不断地找⽅法,让其纯视觉算法变得更好。 去年特斯拉AI Day 上,特斯拉着重强调了⾃⼰的BEV ⽹络(更多⽤于静态物体的识别)。
但是今年,特斯拉基本上没有太多去提BEV 相关内容,⽽是⼜新推出占⽤神经⽹络(the occupancy network),直接通过摄像头来构建真实世界三维模型。
同时,增加了对动态物体以及运动状态可能发⽣变化的物体的识别,⽐如这个公交:
此外,特斯拉还准备引⼊更多新的神经网络,⽐如NeRF((Neural Radiance Fields) 神经辐射场,提升重建三维场景的能⼒。
举特斯拉的例⼦其实是为了说明:「纯视觉这条路并没有那么好⾛,技术路线可能随时会发⽣调整。」 就好像现在BEV ⽹络被占⽤⽹络替代⼀样,后续很有可能还会被新的⽹络模型所替代。 「纯视觉⽅案能⼒上限:逼近L3」 特斯拉FSD 基本上代表了纯视觉的最⾼⽔平,这⼀点⼤家不否认吧。 ⽽从能⼒实现层⾯,在海外,就说美国本⼟吧,「现在特斯拉FSD Beta 能⼒已经⽆限逼近L3。」 不管是城市、⾼速,亦或者是没有⻋道线的乡村⼟路,特斯拉FSD 都能去开上⼀开。 特斯拉的⽜逼之处就在于使⽤普通的导航地图,就能实现类似⾼精地图的能⼒。 不过,特斯拉⽬前在两⽅⾯去继续钻研:「能⼒和体验。」 「能力」 能⼒层⾯,⾏⻋「这⼀块差不多实现七七⼋⼋」,仍在啃⼀些⻓尾场景的硬⻣头,⽐如说这种路边随处停着的⼀台⻋,⽆法分辨这台⻋的状态(动态or 静态):
「在拿掉超声波传感器之后,特斯拉纯视觉正式向泊⻋域开进」,将会解决此前此前特斯拉泊⻋⽅⾯的问题(⽐如⽆法识别空⻋位、泊⻋识别率和泊⼊成功率等)。 「体验」 体验层⾯,特斯拉引⼊打分机制,提升FSD 使⽤舒适度:
「纯视觉领域的玩家」 其实,不仅仅是特斯拉,还有好⼏个玩家都在纯视觉领域摸索。 ⽐如Mobileye。这位也是纯视觉领域的⼤拿。 EyeQ 系列芯⽚在⾏业⾥出货量很多,很⼤⼚商都在采⽤EyeQ 芯⽚来提供视觉感知,⽐如早期的特斯拉、蔚来、理想,都和Mobileye 有很深的合作。 接下来说Mobileye 在纯视觉领域的进展。 Mobileye 开发了两套⾃动驾驶系统:纯视觉:摄像头⼦系统Mobileye SuperVision和雷达/ 激光雷达⼦系统,两台系统独⽴运⾏,互为补充。 不同于特斯拉,Mobileye 会⽤到众包⾼精地图。 摄像头⼦系统Mobileye SuperVision,也就是纯视觉这套,已经在国内新实⼒⻋企极氪上量产,能⼒差不多是L2+ 的样⼦:
但是由于没能解决地图问题,很多能⼒⽐如领航辅助都⽆法解锁。 今年9⽉,Mobileye 宣布与吉利控股集团进⼀步扩⼤业务合作:极氪还将在两款新⻋型上搭载Mobileye SuperVision,并与Mobileye 共同开发基于激光雷达的新功能。 基于环视视觉打造的系统预计将于今年年底通过OTA 更新实现全部功能释放。
虽然国内Mobileye SuperVision能⼒看着很差,但它真正的实⼒不容⼩觑(要不然吉利也不会扩⼤和它的合作)。 和特斯拉⼀样,Mobileye SuperVision也要看它在海外的能⼒。今年8⽉,Mobileye 完成了为期数天的洲际公路之旅,对其下⼀代Mobileye SuperVision开展了测试,基于现有REM 的⾼精地图,⽤4 天⾏驶近2000 公⾥,穿越南欧和中欧6 国。 「翻译⼀下就是,Mobyeye 这套纯视觉解决⽅案适⽤性⾮常强,只要有REM 众包地图,不管是在哪个国家或者地区,都能很快应⽤起来。」 ⽬前,关于下⼀代Mobileye SuperVision,我们能够得到的信息是: 1、采⽤两块EyeQ6HEyeQ6H 芯⽚(⽬前极氪⽤的那套还是EyeQ5芯⽚); 2、能⼒⽅⾯,可实现可脱⼿/ 眼睛需注视的L2++ 系统。
「纯视觉路线的前景」
还是那句话,我们不知道⾃动驾驶的最终哪条路能⾛通。我们分为三种情况来看:
1、只有纯视觉这条路⾛得通
2、纯视觉和激光雷达路线都可以⾛通 3、只有激光雷达路线⾛得通 「1、只有纯视觉这条路⾛得通」 但是如果只有这条路真的⾛通了,那么特斯拉⼜将成为开创者。 就像现在她在电动⻋领域创造的辉煌⼀样,作为头⽺,可以吃到最⼤最多的红利。 ⽽且,纯视觉路线成本很低,毕竟摄像头也没多少钱。随着⻋辆⼤规模交付,规模效应之下,成本会更低。 也不⽤说那么远,现在特斯拉拿掉毫⽶波雷达和超声波传感器,根据⻋拆解团队Munro Live 公开的分析报告显示,「这样操作特斯拉平均每辆⻋节省114 美元,约合⼈⺠币817 元。」 这都是实打实的好处。 「2、纯视觉和激光雷达路线都可以⾛通」 这就很意思了。 如果激光雷达路线也能跑通,但是各项成本算下来,似乎纯视觉成本还是要更便宜⼀点…… 「3、只有激光雷达路线⾛得通」 如果到这个时候,我想各种传感器价格应该被打下来了。 如果真到这个时候,激光雷达和毫⽶波雷达⼀样便宜,我想特斯拉也⼀样会⽤。 虽然特斯拉⼀直专精在纯视觉,但是特斯拉也在研究各种可能性,⽐如4D 毫⽶波雷达等等。 所以,即便是调转研究⽅向,那么,特斯拉依然能够⾮常快的调整过来,并占据领先优势。 所以,最后,提⼀个建议,虽然激光雷达、4Dh 毫⽶波雷达的出现和应⽤,⼤幅度提升了⾃动驾驶感知能⼒,但是「我还是希望各家⻋企能够始终重视计算机视觉感知的研发,毕竟,任何传感器都无法替代摄像头的作⽤,同时也能在未来自动驾驶技术竞争中,取得领先地位。」
相关文章