随着人工智能等新兴技术越来越多的赋能社会和企业,技术使用的底层数据安全性也越来越受到国家的关注。随之而来的《数据安全法》、《个人隐私保护法》也提出了新的数据使用要求,让与可信AI的话题关注度逐步提升。目前,与可信AI已经从理论探索逐步走向初步的工程化落地实践。
本文引用地址:与可信AI的定义
目前在解决数据孤岛与数据隐私问题中较为常见的是联邦学习。联邦学习是一种新兴的人工智能基础技术, 定义下的联邦学习是一种分布式隐私保护建模方法,在保证所有训练数据不出域的前提下,多个参与方通过与聚合模型协作学习的方式共同训练新的数据模型的方法。这样的建模方式可以充分调动"去中心化数据"和"去中心化算力"等能力,促进数据隐私保护,实现数据利用最小化原则,并以更低的延迟和更低的功耗提高了建模性能。
可信AI的研究领域则涵盖了安全和隐私(包括系统、平台、产品以及数据安全)、算法可解释性,公平性和可问责性。
报告中也详细探讨了联邦学习与可信AI 的初步市场格局,初步展示了如百度、第四范式、星环科技等主流AI技术供应商的技术/产品进展,以及当前的行业实践情况。
行业应用
目前联邦学习已经初步实现商业化落地,可信AI还在技术理论突破与应用探索阶段。在不同行业的应用探索中,联邦学习实现了数据隐私保护和数据共享分析的平衡,即“数据可用不可见”的数据应用模式。联邦学习在行业中的应用进展如下:
● 金融行业:金融行业是当前联邦学习落地部署探索最多的行业。金融行业加速数字化转型的过程中,银行、保险、投资等行业都面临着有效数据欠缺与隐私保护安全的双重挑战。在应用上,目前主要集中在营销、信贷风控、反欺诈场景。
● 零售行业:零售行业在销量预测及商机洞察,仓库储存、配送等各个环节可以使用到联邦学习技术。例如,基于联邦学习技术,在保护数据隐私安全的基础上,根据历史销量、各区域客群画像洞察、气候变化、时事热点等元素进行分析,通过精确到小时级别的销量精准预测,优化整体品类规划,从而降低运营成本,帮助实现用户履约率进一步提升。
● 互联网/电商/数字媒体: 数字广告业务目前引入了联邦学习技术,如广告投放、流量反作弊、联合归因等场景。流量平台、广告主等可以在不披露底层数据的前提下共建模型。每个广告主或者数据持有方不出本地,通过加密机制下的参数交换方式,就能在符合各项隐私安全法律、法规的情况下,建立出虚拟的共有模型。
● 工业:在制造领域,联邦学习技术会帮助实现多条产线间的联合训练与模型共享,改善AI质检、预测性维护的效果。例如,各种供应商可以结合自身数据,以建立更好的整体预测模型。在能源领域,智能家居设备和能源供应商之间的联合,可以产生用于预测功耗和设备使用的互利模型。其结果将包括越来越灵敏和个性化的设备,并使得电网管理更加有效。
● 医疗:医疗保健领域将受益于纵向联邦学习,如果所有医疗机构和制药企业都成立数据联盟并共享其数据以创建大型医疗数据集,那么经过训练的AI模型的性能将显著提高,尤其是在AI药物研发领域,药物本身作为研发数据,有非常大的价值,联邦学习技术恰好能够安全地实现多方数据共享。另外,在医疗影像辅助诊断场景中,可以通过联合训练CV模型来更加精准地预测疾病、检测异常并基于其他医疗传感器和电子健康记录(EHR)数据进行诊断。
● 政务:政务领域存在横、纵向信息交换的“数据壁垒”,联邦学习可以帮助打通政务领域数据应用价值链,提高办事效率,解决社会疑难问题。
中国人工智能高级分析师程荫表示,AI技术的安全可信已是大势所趋,行业用户在享受技术所带来的红利的同时,应该积极选择与具有数据资源的技术供应商合作,优先考虑联邦学习与可信AI技术实现的路径和自身业务是否匹配,根据实际业务判断AI安全可信建设的优先级,也可参考目前同业探索实施相关AI项目的成熟度,使得联邦学习与可信AI更好地落地。