以前,让失明者重见光明往往被视为一种医学"奇迹"。而随着以"机器视觉+自然语言理解"为代表的多模态智能技术的爆发式突破,给AI助盲带来新的可能,更多的失明者将借助AI提供的感知、理解与交互能力,以另一种方式重新"看见世界"。
AI助盲,让更多人重新"看见世界"
一般来说,目不能视的视障患者认知外界世界的渠道是除了视觉之外的其它感官感觉,比如听觉、嗅觉和触觉,这些其他模态的信息一定程度上帮助视障人士缓解了视力缺陷带来的问题。但科学研究表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%。因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
在视觉感知领域,当下的单模态AI模型已经在图像识别任务上超越了人类水平,但这类技术目前只能实现视觉模态内的识别及理解,难以完成与其他感觉信息交叉的跨模态学习、理解与推理,简单来说,就是只能感知无法理解。为此,计算视觉奠基人之一的 David Marr 在《视觉》一书中提出了视觉理解研究的核心问题,认为视觉系统应以构建环境的二维或三维表达,并可以与之交互。这里的交互意味着学习、理解和推理。可见,优秀的AI助盲技术,其实是一个包含了智能传感、智能用户意图推理和智能信息呈现的系统化工程,只有如此才能构建信息无障碍的交互界面。
数据是实现可持续发展目标的关键要素, 许多企业领导者认识到,要朝着可持续发展目标迈进,他们需要拥有有意义的环境、社会和治理 (ESG) 数据, 以帮助他们评估进展。 好消息是,组织运营中有大量可用的环境数据,这些数据可以从设施运营、能源消耗、资产维护、IT 基础设施等中提取。
同时,收集和理解那些位于公司不同孤岛中的海量数据也是一项非常艰巨的任务。企业还必须能够根据复杂的 ESG 框架向各个利益相关方报告数据。
在接下来的一年里,各利益相关方将要求企业领导对公司的可持续发展工作承担更多责任。企业将求助于自动化技术来收集和整合数百种数据类型,以持续提供透明、可核查、财务级别的信息并报告进展。
可以帮助企业管理、分析和利用运营中大量可用的数据,利用设施运营、能源消耗、资产维护、IT 基础设施等位于公司不同孤岛中的数据,基于混合云底座实现数据流转,帮助企业根据复杂的 ESG 框架向各个利益相关方报告数据,并将其转化为预测性洞察,可用于评估可持续发展基准的进展,从而帮助企业减少日常业务运营对环境的影响。
据了解,截至目前,全国智慧城市场景相关AI专利申请量共计18万余件,其中发明专利占比约90%,百度、腾讯、国家电网成为技术创新活跃主体,专利数量均超过2000件。智慧城市建设涉及的AI技术主要包括知识图谱、计算机视觉、大数据、自然语言处理、智能语音和智能云等。同一时期内智慧交通相关AI专利申请量计14万余件,发明专利占比约71%,百度、东南大学、腾讯成为专利申请更为积极的创新主体,专利申请均突破千余件,智慧交通开发应用主要包含深度学习、自然语言处理、大数据、智能云、智能语音和智能推荐等技术。
据悉,截至2022年9月,我国场景申请AI专利近2万件,其中发明专利占比超过九成,好未来、小天才、松鼠课堂等智能教育领域企业专利申请活跃,好未来专利申请超过280余件,其余两位也均达百余件,主要依托的AI技术为计算机视觉、知识图谱、深度学习、自然语言处理和智能语音。智慧农业场景中,我国同期申请AI专利约6.7万件,其中发明专利占比超过90%,浙江大学以590余件专利排名首位,腾讯以550余件专利紧随其后。智慧农业主要涉及的AI技术主要为智能云、大数据、计算机视觉、深度学习等。