2月28日,一年一度的计算机视觉顶会CVPR 2023放榜。由毫末智行人工智能中心技术团队提交的《BEV-LaneDet: a Simple and Effective 3D Lane Detection Baseline(一种简单有效的3D车道线检测方法)》论文成功入选。
计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称:CVPR)是计算机视觉与模式识别领域的三大顶级会议之一,由纽卡斯尔大学、悉尼科技大学、约翰霍普金斯大学等顶级名校和机构组织。CVPR有着较为严苛的录用标准,CVPR官方透露,CVPR2023一共收到了9155份论文,创下历史新高,而组委会最终录用了2360篇论文,接收率为25.78%。
3D车道检测作为自动驾驶领域的热门话题,在车辆路径选择中起着至关重要的作用。在以往,相关技术往往由于其复杂的空间转换和3D车道的不灵活表示而难以实用。面对这些问题,毫末完全自主研发了一种高效、鲁棒的单目3D车道检测,简称:BEV-LaneDet。
BEV-LaneDet模型
毫末团队在BEV-LaneDet中,首先通过虚拟相机将输入图像的所有内外参数转换为统一的内外参数,确保了不同车辆中前置摄像头空间关系的一致性,有效促进学习过程。并且,毫末团队使用特征提取器来提取前视图图像的特征,并提出了一种简单但有效的三维车道表示,被称为“Key-Points Representation”,该模块更适合于表示复杂多样的3D车道结构。在此基础上,受FPN启发,毫末团队还设计了一个轻量级和芯片友好的空间变换模块,称为“Spatial Transformation Pyramid”,这是一个基于VPN的快速多尺度空间变换模块,主要负责从前视图特征到BEV特征的转换。最后,毫末团队预测了与局部路面相切的平面上的车道,并将局部路面分成s1×s2个grid,预测了置信度confidence、用于聚类的embedding、横向误offset以及每个grid的高度height,在推理中使用快速聚类方法来融合每个分支的结果,以获得3D车道。
BEV-LaneDet在公开集合Openlane的表现
通过以上这些方法,在公开集合OpenLane数据集上,BEV-LaneDet的F1-Sßcore可以达到185FPS,比目前的SOTA提升了10.6%。在公开集合Apollo 3D Lane Synthetic上的表现,BEV-LaneDet同样可以做到大幅度领先目前的SOTA方法4.0%。
BEV-LaneDet在公开集合上的可视化表现
毫末团队BEV-LaneDet撰写的论文入选CVPR,再次彰显了毫末的深厚AI技术积累。如今,毫末已经快速成长成为中国量产自动驾驶第一名。HPilot已迭代三代产品,在魏牌、坦克、哈弗、欧拉、长城炮等多个品牌近20款车型上实现了规模化量产,未来搭载毫末辅助驾驶产品的乘用车将达到百万量级。截至2023年2月,毫末用户辅助驾驶行驶里程突破3500万公里。中国第一个可大规模落地的城市导航辅助驾驶毫末城市NOH目前也已软件封版达到交付状态。此外,毫末末端物流自动配送车已初步完成商业闭环,交付超1000台,末端物流自动配送车小魔驼系列配送订单量也已突破16万单,商业化进程正全面提速。
当下,随着各类新兴技术逐步渗透到自动驾驶行业,毫末智行也将继续加码在大模型训练、重感知、认知推理等AI技术领域,助推更多前沿技术在自动驾驶领域落地。