自动驾驶融合算法研究:BEV带动算法革命,AI大模型推动算法迭代

发布时间:2023-01-15  

自动驾驶算法技术框架核心分为环境感知、决策规划、控制执行三部分。


环境感知:将传感器数据转换成车辆所处场景的机器语言,具体可以包括:物体检测、识别跟踪、环境建模、运动估计等;


决策规划:基于感知算法输出结果,给出最终行为动作指令,包括行为决策(车辆跟随、停止和超车)、动作决策(汽车转向、速度等)、路径规划等;


控制执行:在决策层的输出结果下,调动底层模块,向油门、刹车等核心控制部件发出指令,推动车辆按照规划线路行驶。


BEV带动算法革命


近年来BEV感知受到了广泛的关注,BEV模型主要提供了一个统一的空间,方便各项任务、传感器的融合。其主要有以下优势:


BEV统一了多模态数据处理维度,使多模态融合更加容易


BEV感知系统可以将多个摄像头或雷达得到的信息转换至鸟瞰视角,再做目标检测、实例分割等任务,能更直观地显示出BEV空间中的物体大小和方向。


2022年北大&阿里提出激光雷达和视觉融合框架——BEVFusion,雷达点云的处理和图像的处理独立进行,利用神经网络进行编码,投射到统一的BEV空间,然后将二者在BEV空间上进行融合。


BEVFusion 框架

来源:arXiv


实现时序信息融合,构筑4D空间


在4D空间内,感知算法能够更好地完成如速度测量等感知任务,并能将运动预测的结果传递到决策和控制模块。


鉴智机器人2022年提出了BEVDet4D,是基于BEVDet增加时序融合的版本。BEVDet4D通过保留过去帧的中间BEV特征来扩展BEVDet,然后通过与当前帧对齐和拼接来融合特征,从而可以通过查询两个候选特征来获取时间线索。


BEVDet4D网络结构

来源:arXiv


“脑补”被遮挡物体,实现物体预测


在BEV空间内,算法可以基于先验知识,对被遮挡的区域进行预测,“脑补”出被遮挡的区域是否有物体。


2021年Wayve联合剑桥大学提出的FIERY是一种端到端,不依赖高精地图,仅基于单目相机的鸟瞰图实现的道路动态物体实例预测算法。


FIERY模型

来源:arXiv


促进端到端的自动驾驶框架发展


在BEV空间内,感知和预测可以在统一的空间中,通过神经网络直接做端到端优化,同时得到结果。不仅是感知模块,基于BEV进行的规划决策模块也是学术界研究的方向。


2022年,上海人工智能实验室自动驾驶团队与上海交通大学严骏驰副教授团队合作的论文ST-P3,提出一种时空特征学习方案,可以同时为感知、预测和规划任务提供一组更具代表性的特征。


ST-P3架构

来源:arXiv


AI大模型推动算法迭代


2012年之后,深度学习算法基本接管了自动驾驶的主要分支领域。为了支撑更大更复杂的AI计算需求,诞生了具有“巨量数据、巨量算力、巨量算法”特性的AI大模型,其加快了算法迭代速度。


大模型及智算中心方面


2021年,毫末智行启动了针对Transformer大模型的研究和落地尝试,随后逐步在包括多模态感知数据融合、认知模型训练等项目中得到了大规模运用。2021年12月,毫末智行发布了自动驾驶数据智能体系MANA(中文名“雪湖”),将感知、认知、标注、仿真、计算等多个环节融合于一体。2023年1月,毫末超算中心——雪湖·绿洲(MANA OASIS)亮相 ,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,毫末训练平台部署到 OASIS上后,可以运行包括云端大模型训练、车端模型训练、标注、仿真等各类应用。在MANA OASIS的加持下,毫末MANA五大模型迎来全新亮相升级。


毫末超算中心——雪湖·绿洲(MANA OASIS)

来源:毫末智行


毫末五大模型

来源:毫末智行


2022年8月,基于阿里云智能计算平台,小鹏汽车建成自动驾驶智算中心“扶摇”,专用于自动驾驶模型训练。2022年10月,小鹏也宣布引入Transformer大模型。


小鹏汽车智算中心——扶摇

来源:小鹏汽车


2022年11月,百度发布了文心大模型,其自动驾驶感知模型超过10亿的参数规模,具备数千个对象识别能力,大大扩展了自动驾驶语义识别数据。目前主要应用在远视距、多模态和数据挖掘三个方面。


百度文心大模型应用——多模态

来源:百度


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    。智算中心通过提供预置行业算法、构建预训练大模型、推进算法模型持续升级,提供专业化数据和算法服务。算力基建化和算法基建化相辅相成,共同推动算力的普惠化。 以服务智件化为依托。随着人工智能算法开发和模型......
    一款集成人工智能算法的肺部疾病临床诊断可穿戴器件;肺部疾病是最为广泛传播和危害我国人民生命健康的疾病之一,主要有肺炎、肺气肿、间质性肺疾病、慢性阻塞性肺疾病等。 不同......
    、视联网、物联网算力体系,核心包括由百度昆仑芯片搭建的人工智能算力中心、城市级视频中台、数据中台系统、核心物联网通信系统、大规模图谱分析体系,以及超过270类不同人工智能算法模型。此次......
    中小企业及科研单位服务,提供开源开放、安全高效的算力。 此外,北京国际大数据交易所数据资产服务中心揭牌。去年 9 月,以“京西智谷”人工中心算力储备为基础的北京市人工智能算法交易服务中心正式揭牌。此次......
    地平线推出平民化AI开发平台“天工开物”;数字经济时代,人工智能将成为像水电煤一样的基础设施。但如何让更多企业具备 AI 能力,以生态协同撬动 AI 普及,是产业参与者共同面临的一大挑战。 近日......
    度提高化学合成效率。智化科技以化学大数据为驱动,自主研发多种算法模型,配合人工智能技术和机器人,为生物医药、化工、新材料等领域客户提供领先的产品服务及解决方案。智化科技拥有近150名跨领域的技术专家,其中......
    力当量支持。2022年,大模型正在成为AIGC领域发展的算法引擎,文生图、虚拟数字人等AIGC类应用将快速进入到商业化阶段,并为元宇宙内容生产带来巨大的变革。 智能算力成为数字化创新的源动力 人工智能算力的增长为人工智能......
    算力分布和行业渗透度等维度进行全面评估,旨在科学描绘中国人工智能发展的阶段和整体情况,为推动数字经济与实体经济的融合提供极具价值的参考依据和行动建议。智能算力规模持续扩大,算力、算法基建化成为共识智能算......
    产业投资基金、上汽集团、国泰君安、香港科技园、希玛眼科、泰州文旅。 港股上市历经波折 公开资料显示,商汤科技成立于2014年,是人工智能算法服务商之一,研发并建立了深度学习平台和超算中心,主要......
    帮助技术供应商把握制胜因素,也可使终端用户了解应用机会、市场空间等。本文引用地址:开源技术是人工智能市场发展的重要驱动力,从最早的开源数据库、深度学习框架、算法模型,到今天端到端的人工智能......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>