从快捷支付到智能门禁,智能手机到服务机器人,不知不觉中,3D视觉感知技术已经深入到我们的生活,成为智能设备感知环境、进行智能交互的共性技术。为了加速3D视觉感知技术与AI技术的融合,满足AIoT、3D扫描、服务机器人等典型应用场景的AI训练需求,奥比中光与浪潮信息合作构建面向3D视觉感知的AI训练平台,强化3D视觉算法训练能效,加速智慧3D视觉应用的创新迭代。
通过浪潮 AI 服务器和浪潮AIStation软硬件一体化的方案组合,奥比中光实现了计算节点、数据存储的敏捷扩容,满足3D视觉训练不断增长的AI算力以及数据存储业务需求,帮助奥比中光将样本数据获取效率平均提升30%,提升算法人员对比验证实验的工作效率,并缩短训练周期以及简化运维工作。
3D视觉算法训练面临多重挑战
奥比中光以"让所有终端都能看懂世界"为使命,构建起"全栈式技术研发能力+全领域技术路线布局"的 3D视觉感知技术体系,在技术上纵向对全链路技术进行全栈式自主研发,横向对结构光、iToF、双目、dToF、Lidar、工业三维测量进行全领域布局,是行业领先的3D视觉感知整体技术方案提供商。
人类约70%的信息是通过人眼获取,未来的机器人也将和人类一样,大量信息都将通过视觉感知技术获取。然而,现实物理世界是三维的,传统相机、摄像机的2D成像技术是无法完整重现各类三维场景的,因此需要通过3D视觉感知技术让终端获取更多精准的三维信息,从而"看懂"真实世界。
3D 视觉与 2D视觉技术的最大区别在于处理的数据类型不同。在 3D 视觉领域,被处理的对象通常是依靠 3D 传感器采集到的三维点云数据,而 2D 视觉技术主要被用于处理平面图像里的信息。这决定了 3D 视觉不仅能够感知场景中物体的有无,还赋予了机器捕捉真实世界空间、人体、物体的三维信息的能力,让终端设备具有类似人眼感知环境的能力。
3D视觉感知给各行业带来不同的创新应用,背后离不开AI技术的加持。AI 和3D视觉感知技术的结合可帮助计算机更好地进行空间、人体和物体的数字重建,缩小物理空间与虚拟世界的差距,是促使 AI 更广泛应用的关键共性技术。配合AI算法能够实现多种2D成像技术难以实现的功能,使得骨架跟踪、数字孪生、AR交互、三维重建、自主定位导航等应用有更好并精准的体验。
3D视觉感知技术与 AI 的融合应用也带来了算力方面的挑战。这一方面是由于,3D视觉数据比2D视觉数据提高了不止一个数据量级,AI算法训练也需要更高的算力支撑,对3D视觉训练平台的算力、存储及集群资源调度都是一个挑战。以奥比中光为例,算法人员在使用图片样本进行训练时,由于样本数据集规模高达1TB左右,网络传输到计算节点时间需要2-3小时,导致整体训练过程较长。
此外,高效的AI算法训练有赖于敏捷的算力资源管理。奥比中光需要根据不同的场景训练不同的算法,这些算法对AI算力的需求在规模、时间等方面存在着差异,固定的算力资源分配将会导致资源浪费、资源不足等问题。要想充分利用算力资源,就需要简单、易用、高效的AI训练平台,对资源进行敏捷分配,同时简化运维管理。
浪潮AI整体解决方案给3D视觉训练装上"助推器"
浪潮信息为奥比中光提供了AI服务器NF5488A5、NF5468M6和浪潮 AIStation智能业务生产创新平台的整体解决方案组合,不仅提供了AI算力,同时实现了AI计算集群的敏捷管理,支撑三维重建、人体骨架、人像抠图、 深度恢复、定位感知、模型量化、图像超分辨率、图像风格迁移、图像生成等应用创新。
浪潮AI服务器为奥比中光提供了业内领先的GPU服务,满足大模型、自监督模型的算法需求,支持多种网络,采用存算分离架构,保证GPU资源的高效利用。另外,采用了多级存储架构,优化性能和性价比,搭配浪潮AIStation实现多种算力资源的可视化管理。
浪潮AIStation智能业务生产创新平台是浪潮面向人工智能企业训练与推理场景开发的高效人工智能资源平台,支持私有化部署,实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付,有效的解决奥比中光原有计算平台的数据孤岛、计算资源分散、开发软件栈重复构建等问题。通过对计算资源、数据资源、深度学习软件栈资源进行统一管理,AIStation为环境构建、模型开发、模型训练、模型评估、模型推理、上线部署全链条全面提速,助力用户加快AI开发应用创新。
AIStation的GPU池化和GPU细粒度调度功能,帮助奥比中光将显著提升了集群资源利用率,不仅满足不同3D视觉算法训练的算力需求,减少了GPU资源的空置率,而且降低了算力成本。奥比中光通过AIStation的一站式人工智能开发和分布式自适应优化能力,在提升业务效率的同时简化了运维管理。
以奥比中光的在人体骨骼智能检测为例,浪潮AI解决方案在研发阶段实现数据共享和便捷镜像环境制作,为对比实验及参数调试提供支持;在训练阶段,通过资源优化分配和托管训练方式,为高效完成训练任务和结果复现提供保证;在部署阶段,AIStation的多种AI框架支持,使得项目在多平台、多芯片的实现更加便捷快速,高效部署三维人体骨骼检测应用,满足"虚拟人"生成等元宇宙创新应用的大规模AI算力需求。
3D视觉感知技术与AI技术的融合是智算时代的重要趋势,浪潮AI服务器和浪潮AIStation平台通过强大的算力性能、卓越的分布式自适应优化能力与算力资源管理能力,为智能3D视觉技术的深度应用提供有力支撑,让越来越多的机器看懂三维世界。
相关文章