作为新一代人工智能的关键技术,深度学习近年来展现出极大的创造力,在语音识别、机器视觉、自然语言处理等一个个经典的人工智能问题上取得实质性进展,让很多此前无法实现的AI应用走进了现实生活,正在加快各行各业的发展速度。此前,ARK 2021年度投资报告发布了2021年15大趋势预测,将深度学习排在第一位。深度学习经历了起初的期待,走过了技术应用的无奈,再到如今重整旗鼓重新审视技术与应用的本身,深度学习技术为手机应用开发提供了前进的方向。在未来,深度学习将与安卓应用的开发将碰撞出更绚烂的火花。
纪然,杰出的人工智能技术开发领域人才,多年来在Google公司的工作中积累了丰富的研发经验,参与了Chrome OS的操作系统的研发,为Google搜索引擎网络爬虫提供优化策略,纪然运用机器学习技术、深度学习和分布式计算,优化Google的网络爬虫算法,让搜索结果更加智能化。纪然在自动机器学习、神经网络可解释性方法、异构融合类脑计算等领域,研发出一批具有重大影响力的创新性成果,他将创新性成果应用到Progressive Web Apps的研发和Chrome浏览器内核的优化,取得了骄人的成绩,扮演了关键角色的作用。自2020年1月起,纪然就职于Facebook(Meta),负责Facebook Stories模块的开发,熟练使用自然语言处理和机器视觉做照片视频的智能分类和推荐回复,他对深度学习技术的发展现状、具体应用及发展趋势等方面有独到的见解,并开发了多项重量级的应用,他在人工智能技术的创新实践与重大科技成果对于促进互联网行业的发展产生了积极的贡献。
纪然
纪然谈机器视觉四大任务
1 图像分类:把图像划归为若干个类别中的某一种
2 图像分类+定位:把图像划归为若干个类别中的某一种,并给出被分类物体的位置
3 物体检测:用框去标出图像中物体的位置,并给出物体的类别(人脸检测、安全帽检测、车辆检测都属于这个)
4 图像分割:以像素级单位把图像分成若干个特定的、具有独特性质的区域并给出物体的类别(车道线分割项目就是用的这个,属于自动驾驶的一部分)
纪然谈机器视觉基本流程
1 图像获取技术描述:提取二维图像、三维图组、图像序列或相关的物理数据,如声波、电磁波或核磁共振的深度、吸收度或反射度。
2 预处理技术描述:对图像做一种或一些预处理,使图像满足后继处理的要求,如:二次取样保证图像坐标的正确,平滑去噪等。
3 特征提取技术描述:从图像中提取各种复杂度的特征,如:线,边缘提取和脊侦测,边角检测、斑点检测等局部化的特征点检测。
4 检测/分割技术描述:对图像进行分割,提取有价值的内容,用于后继处理,如:筛选特征点,分割含有特定目标的部分。
5 高级处理技术描述:验证得到的数据是否匹配前提要求,估测特定系数,对目标进行分类。
这有点类似于:买菜(获得菜/图片)—洗菜(对菜/图片进行基础处理)—切菜(切出有用的部分菜/图片)—炒菜(食材到食物的关键处理菜/图片)—摆盘(把菜/图片以一个合适的形式呈现给用户)
纪然谈自然语言处理
自然语言处理(Natural Language Processing)是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科,也是一门横跨语言学、计算机科学、数学等领域的交叉学科。
自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。
自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。
可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成,自然语言理解是让计算机把输入的语言变成有意思的符号和关系,然后根据目的再处理;自然语言生成则是把计算机数据转化为自然语言。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。
纪然谈自然语言处理应用扩展
自然语言处理的研究可以分为基础性研究和应用性研究两部分,语音和文本是两类研究的重点。基础性研究主要涉及语言学、数学、计算机学科等领域,相对应的技术有消除歧义、语法形式化等。应用性研究则主要集中在一些应用自然语言处理的领域,例如信息检索、文本分类、机器翻译等。由于我国基础理论即机器翻译的研究起步较早,且基础理论研究是任何应用的理论基础,所以语法、句法、语义分析等基础性研究历来是研究的重点,而且随着互联网网络技术的发展,智能检索类研究近年来也逐渐升温。近年来,计算机视觉在产业界和学术界不断取得突破。自2020年1月开始,纪然一直在Facebook(现更名叫Meta)负责Facebook Stories模块的功能开发,包括照片和短视频内容智能分析和内容智能识别,通过使用计算机视觉和深度学习等人工智能技术,为用户提供推荐回复,目前已有超过十亿用户在使用。
人工智能在技术驱动和市场带动下,取得了历史性进步,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征,相关技术持续向实体经济渗透,正对经济发展、社会进步、全球治理等方面产生重大而深远的影响。
(作者:孙小明)
相关文章