制造商如何通过云技术优化深度学习机器视觉运作方式

作者: 斑马技术大中华区技术总监程宁

机器视觉作为驱动中国制造业发展的重要先进技术，在半导体、电子制造、汽车、医药和食品包装等领域得到广泛应用；在此背景下，高工产业研究所（GGII）预测2024年中国机器视觉市场规模有望突破200亿元，同比增速接近12%。

随着人工智能（AI）技术的迅猛发展，多数制造行业的机器视觉负责人认为AI机器视觉可以实现更好的性能和更多的功能。因此，为行业提供机器视觉解决方案的合作伙伴们需要进一步思考如何为客户优化前沿技术，让深度学习机器视觉等技术在企业内部变得更易于获取、更便于使用、并部署得更好。此外，云计算的部署也是推动机器视觉应用的重要一环，尽管仍有一些制造商对于云计算的采用踌躇不前，现在正是克服这些顾虑的最佳时机。

对于制造商而言，购入机器视觉解决方案的方式多种多样，主要方式之一是在生产地点进行现场方案评估和选择，后续进入公司的审批流程；或者方案的选择和审批等主要流程均在生产地点现场进行。这种以“现场”为中心的方式有其优点，但也可能带来一些不尽如人意的部署差异。具体而言，即便是相似的工作流程，不同生产地点也可能采用不同的机器视觉解决方案，而且这些地点之间可能无法实现专业知识和数据的共享。即便团队有相关需求，也很难通过传统的机器视觉系统实现集成、互通和安全的数据共享。

不同的生产地点带来的数据挑战

AI，尤其是深度学习，它们因数据而生，大量、多样的优质数据和快速的数据生成、处理速度是训练和测试深度学习模型的关键，这样我们才可以在实际部署时实现预期的效果。

不同团队和生产地点之间的经验和可用时间各不相同，信息孤岛由此显现，这加大了获得优质数据的难度。数据需要在存储、标注后用于训练模型，而模型测试还需要使用其他数据集。在这种情况下，处于“孤岛”状态的企业数据是没有意义的，不利于更好地训练机器视觉模型。

深度学习神经网络应尽可能多地接触到各种变量，包括不同的生产时间和生产天数。除非使用能够模拟训练数据的平台，数据集必须混合不同时间点的随机数据，尽管这需要采集一段时间内的数据，并且可能会带来不便，但这正是训练一个强大模型的关键所在。如何才能充分利用各个生产地点，甚至是跨国家和地区的所有可用数据，这是制造商及其机器视觉负责人面临的主要挑战之一。

不同的生产地点带来的另一难题在于如何确保深度学习模型基于多样化的对象集进行训练。在一组数量有限且几乎相同的对象集上训练而成的模型，难以应对现实世界的变化和差异。例如，训练一个模型用以识别制造组件的缺陷，不能仅依靠20张同一组件的不同角度图像。训练数据中需要有20至50个真正不同的对象才能确保模型的有效性，尽管整个生产场景可能受到地点变化的影响（例如不同的照明和/或不同的传送带等），但这些对象必须有明显的区别，除背景之外没有任何其他相同元素。

工业流程还受到各种环境因素的影响，例如不断变化的环境光、材料的细微差别、振动、噪声、温度、生产条件的改变等。如果训练数据未考虑到这些变化，就会降低模型的准确性。每个地点都可能在清晰度、工作距离、环境光等因素上有所不同，模型也会学习和处理这些变量，因此训练数据集应反映模型在现实场景中可能遇到的各种变化。如果工业流程涉及到多个生产地点，显然不能只采集其中一个地点的数据，或者将所有生产地点的数据孤立保存。因此，实现不同环境条件、不同生产地点的数据采集和共享也必不可少。

不同的生产地点所带来的另一个问题是深度学习模型训练数据的标注。数据标注不准确、不清晰和不一致必然会导致模型表现不佳，可见确保标注精确且无歧义至关重要，这需要制造业团队在标注项目上开展协作。在实际操作中，一个常见错误是在不同的图像上标注不同的缺陷类型，而有些缺陷却又完全没有标注，而且对于什么是缺陷的判断也可能是主观的，因此交叉验证非常关键。无论哪种类型的缺陷都应清晰地标注在所有相关图像上。同样，如果不采取统一的标注方法也不利用云技术的话，跨地点或跨国家的数据标注挑战也将继续存在。

深度学习云平台解决方案

制造行业的机器视觉团队需要新的方法来实施深度学习机器视觉，云技术便是其中一种新方法。基于云的机器视觉平台可让用户从多个地点（包括生产地点、国家和地区）安全地上传、标记和标注数据。在云平台上汇集来自不同地点和环境的大量多样化数据，更有利于深度学习的训练。此类平台可以让指定的用户开展实时协作，共同完成标注、训练和测试项目并共享他们的专业知识。

与许多行业一样，制造商也面临着招聘和留用资深机器视觉专家的挑战。试想一下，假如一家企业能够更加轻松地利用某个生产地点、国家或地区的个人和团队的技能与专业知识，使所有人受益，尤其是在机器视觉人才稀少的地方，这将带来多大的益处。协作型的云平台将实现这一愿景。

基于云的解决方案还实现了算力的可扩展性与可访问性。在使用传统系统的情况下，只有一部分特定员工的电脑配备了非常强大的GPU卡以执行大型训练任务。而通过云技术，每个用户都可以通过各自的设备获得同样高的算力。虽然这会产生一些成本，但通过按需付费的订阅模式可能会比企业投资更多服务器和雇用更多难得的IT人员更有利。

借助云平台，具有特定角色、权限和职责的用户便可以在云端训练和测试深度学习模型。借助更优质的训练和测试数据，在某些场景中，这些模型可能提供远超基于规则的传统机器视觉的视觉检测分析水平和精度。这也正是汽车、电池、半导体、电子和包装等行业的制造商所追求的。

通过软件即服务模式，机器视觉团队可以灵活、便捷地购买云平台的订阅服务，同时不断获得技术合作伙伴更新的功能和模型。借助基于云的深度学习平台，用户或团队无论位于何处，都能够在个人电脑和设备上将模型部署到边缘，从而为生产线上的灵活数字化工作流程提供助力。

想要机器视觉系统能够更好地工作并实现更多功能，我们需要以新的方式实施、使用和部署这项技术，而深度学习云平台正为AI机器视觉管理者指明了前进的方向。