aiSim5基于生成式AI扩大仿真测试范围(终)

发布时间:2024-09-20  

在前面的几章节中探讨了aiSim仿真合成数据的置信度,此外在场景重建和测试流程闭环的过程中,难免会面临3D场景制作重建耗时长、成本高、扩展性低以及交通状况复杂程度难以满意等问题,当前的主要挑战在于如何自动化生成3D静态场景并添加动态实例编辑,从而有效缩短测试流程,扩大仿真测试范围。

wKgaomZNiUGACH0zAABL0_0fsNQ18.jpeg?source=d16d100b

图1:实际图像wKgaomZNiUGABH0wAAA-X-ccnfA280.jpg?source=d16d100b

图2:NeRF重建场景


对于3D重建,目前主要的两种解决方案为NeRF和3DGS。


一、NeRF

1、神经辐射场(Neural Radiance Fields)

NeRF是将三维空间中的每个点的颜色和密度信息编码为一个连续的函数并由MLP参数化。给定一个视角和三维空间中的点,NeRF可以预测该点的颜色和沿视线方向的密度分布。通过对这些信息进行体积渲染,NeRF能够合成出新视角下的图像。

wKgZomZNiUWAZUeYARW_QeIaDmI089.gif?source=d16d100b


2、优势

高保真输出。

  • 基于NerFStudio提供了较为友好地代码库。

  • 相对较快的训练时间。

  • 对于待重建区域具有可扩展性。

3、不足及主要挑战

渲染速度缓慢。NeRF需要沿着从相机到场景的每条光线进行大量的采样和计算,以准确估计场景的体积密度和颜色。这个过程计算密集,在NVIDIA A100上进行了测试,全HD分辨率下,渲染一张图像大约需要10s。


场景深度估计效果不理想。NeRF通过体积渲染隐式地学习了场景的深度信息,但这种深度信息通常是与场景的颜色和密度信息耦合在一起的。这意味着,如果场景中存在遮挡或非朗伯(non-Lambertian)反射等复杂情况,NeRF可能难以准确估计每个像素的深度。

wKgaomZNiUKAGoKzAAHdHVYkELY10.jpeg?source=d16d100b


近距离物体重建质量可能较低。这可能是由视角和分辨率不足、深度估计不够准确以及运动模糊遮挡等问题造成的。

wKgZomZNiUGAL9jqAAAyc4PLlrM00.jpeg?source=d16d100b


高FOV相机校准不完善导致的重影伪影。

wKgZomZNiUKAUsgGAAA9O87Ifug74.jpeg?source=d16d100b


当然为了解决这些问题研究人员通过引入深度正则化来提升NeRF深度估计的准确性和稳定性,通过优化NeRF的结构和算法提升渲染速度。


二、3DGS

1、3D高斯泼溅(3D Gaussian Splatting)

3DGS采用三维高斯分布来表示场景中的点云数据,每个点用一个具有均值和协方差的高斯函数来描述。通过光栅化渲染高斯函数,从而生成逼真的3D场景图像。

wKgaomZNiUaAfO9xARF-jfd6tiw046.gif?source=d16d100b

2、优势

训练时间短。

近似于实时的渲染。

提供高保真的输出。


3、不足及主要挑战

代码库友好度较低。相比于NeRFStudio,文档的完善程度和易用性较低。


初始点云获取需求高,需要精确的传感器和复杂的数据处理流程,否则将会对3DGS的性能产生明显的影响。

wKgaomZNiUKAWR4mAABabi0v3BU54.jpeg?source=d16d100b


深度估计同样不足,主要可能有几个原因:在优化过程中倾向于独立优化每个高斯点,导致在少量图像下出现过拟合;由于缺乏全局的几何信息,导致在大型场景下或复杂几何结构重建时深度估计不准确;初始点云的深度信息不够准确等。

wKgZomZNiUKAF8BbAAAtPgDvA8Y59.jpeg?source=d16d100b


相机模型支持受限。目前3DGS主要支持针孔相机模型,虽然理论上可以推导出其他相机模型的3DGS版本,但还需要后续的实验验证其有效性和准确性。

重建区域可扩展受限,主要是缺乏LiDAR覆盖区域之外的几何信息导致的不完整重建以及大型城市场景重建的大量计算。

wKgZomZNiUKAMjSwAABg5f2-Rmc20.jpeg?source=d16d100b


集成和资源密集的挑战,目前3DGS集成通常依赖Python接口;3DGS在运行时可能会占用大量的VRAM。


通过优化超参数和采用新方法,如Scaffold-GS,可能有助于减少内存需求,提高在大型场景下的处理能力。


三、操作方法

1、训练流程

第一步:输入——相机视频数据;自车运动数据;校准数据;用于深度正则化的LiDAR点云数据;

第二步:移除动态对象:创建分割图来识别和遮罩图像中的不同对象和区域;对动态对象进行自动注释*(康谋aiData工具链);

wKgaomZNiUKAPHj0AABR3iDpRRw00.jpeg?source=d16d100b


第三步: 进行NeRF或Gaussian splatting。

NeRF:

可以使用任何摄像头模型,示例中使用的是MEI相机模型;

采用Block-NeRF进行大规模重建;

嵌入不同的气候条件。

Gaussian splatting:

将输入的相机转化为针孔相机模型;

可以从COLMAP或LiDAR中获得初始点云;

采用Block-Splatting进行大规模重建。

2、添加动态对象

在NeRF和3DGS生成静态场景后,aiSim5将基于外部渲染API进一步增加动态元素,不仅可以重建原始场景,也可以根据测试需求构建不同的交通状态。

wKgZomZNiUKAfGjJAAGn0IU-HmY664.png?source=d16d100b



aiSim5中基于NeRF/3DGS场景细节。

wKgaomZNiUKAcihmAABPlQRBgdM82.jpeg?source=d16d100b

图13:网格投射阴影wKgaomZNiUOAVX_KAABfuuIWSE477.jpeg?source=d16d100b

图14:车下环境遮蔽


3、效果展示

在aiSim5中完成动态对象的添加后,可以自由的在地图场景中更改交通状态,用于感知/规控等系统的SiL/HiL测试。

wKgaomZNiUuAb-xcAdsV8tb-Pgg460.gif?source=d16d100b

图15:aiSim5运行NeRF城市场景1wKgZomZNiUiAR4gGAba78GiRSyk276.gif?source=d16d100b

图16:aiSim5运行NeRF城市场景2


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>