自动驾驶技术是当今汽车行业的热门话题,也是未来出行的重要趋势。然而,自动驾驶技术的发展并非一帆风顺,其中最大的难题之一就是如何让汽车能够准确地感知周围的环境和物体,从而做出正确的决策和操作。目前,市场上主流的自动驾驶方案都依赖于激光雷达作为核心传感器,激光雷达可以通过发射和接收激光束,生成周围物体的三维点云数据,从而实现高精度的定位和感知。然而,激光雷达也存在着诸多缺陷,如成本高、可靠性低、维护难、易受天气和光照影响等,这些问题严重制约了自动驾驶技术的普及和商业化。
近年来,随着深度学习和计算机视觉的发展,纯视觉自动驾驶方案逐渐崭露头角,有望替代或减少对激光雷达的依赖。纯视觉自动驾驶方案是指只使用摄像头作为传感器,通过视觉算法来实现定位和感知的自动驾驶方案。纯视觉自动驾驶方案具有轻量化、低成本、高鲁棒性等优势,但也面临着识别率低、泛化能力差、无法获取精确距离等挑战。为了解决这些问题,需要借助于大数据、大模型、大计算等技术手段,提升纯视觉自动驾驶方案的性能和效率。
百度作为国内自动驾驶领域的领导者,近日发布了国内首个纯视觉高阶智驾方案——Apollo智驾产品ANP(Apollo Navigation Pilot),支持城市场景下的全场景智能驾驶功能。ANP是基于百度Apollo Lite视觉自动驾驶技术的产品化应用,Apollo Lite是中国唯一L4级纯视觉城市道路自动驾驶闭环解决方案,具有轻传感器、轻算力、轻地图、强感知的特点。
ANP采用了12颗摄像头、5个毫米波雷达、12个超声波雷达的传感器方案,通过视觉感知、定位、决策规划等算法模块,实现了“点到点(door-to-door)”的智能驾驶功能,包括自主泊车、城市领航辅助驾驶、自动召唤等场景。ANP不仅能够识别和处理复杂的交通情况,如红绿灯、行人、非机动车等,还能够根据路况和用户习惯调整行车策略,为用户带来安全、平稳、连贯的驾驶体验。
百度ANP的发布是国内纯视觉自动驾驶技术的重要里程碑,也是百度在AI大模型时代的又一次创新。AI大模型是指经过大规模数据训练后,能够适应一系列任务的模型,具有强大的泛化能力和自监督学习能力。百度在AI大模型领域拥有丰富的经验和成果,如在NLP领域的ERNIE系列模型,在CV领域的PaddleSeg系列模型,在语音领域的DeepSpeech系列模型等。
百度将AI大模型技术应用于自动驾驶领域,通过预训练和微调的方式,提升了视觉感知模型的性能和效率,降低了数据标注和计算资源的成本,实现了从L4级别的Robotaxi到L2+级别的智能乘用车的技术降维。
据悉,百度ANP已经与多家车企达成合作意向,并计划在2023年第四季度实现量产上市。这将为国内汽车消费者带来更加先进和便捷的智能出行选择,也将为国内自动驾驶产业带来新的发展机遇和挑战。百度ANP的发布也引起了国内外媒体和专家的广泛关注和评价,认为这是中国自动驾驶技术的重大突破,也是全球自动驾驶技术的重要进步。激光雷达是否会被纯视觉方案所取代,还有待时间和市场的检验,但可以肯定的是,百度已经在纯视觉自动驾驶领域取得了令人瞩目的成就,为未来智能出行开辟了新的可能性。