2016是人工智能爆发的一年,各种层出不穷的新技术、新概念让人眼花缭乱。很多人都分不清人工智能(Artificial Intelligence,简称AI)、机器学习(Machine Learning,简称ML)以及深度学习(Deep Learning,简称DL)概念之间的不同。本文重点解释了机器学习和深度学习的差别。
由于AI的大热,媒体上关于AI的文章狂轰乱炸,人工智能似乎已经成为游戏的改变者,企业们也纷纷下注。
对于AI领域的从业者来说,人工智能、机器学习和深度学习之间的差别应该非常清楚。人工智能是一个大概念,从有效的老式人工智能(GOFAI)到联结主义结构,无所不包。
机器学习则是人工智能领域的一个小分支,如果说AI是一个合集,那么ML就是AI的子集。
任何通过数据训练的学习算法的相关研究都属于机器学习,包括很多已经发展多年的技术,比如线性回归(Linear Regression)、K均值(K-means,基于原型的目标函数聚类方法)、决策树(Decision Trees,运用概率分析的一种图解法)、随机森林(Random Forest,运用概率分析的一种图解法)、PCA(Principal Component Analysis,主成分分析)、SVM(Support Vector Machine,支持向量机)以及ANN(Artificial Neural Networks,人工神经网络)。
人工神经网络则是深度学习的起源。
一些之前接触过人工神经网络的机器学习从业者对深度学习的第一印象很可能是:这不过就是多层结构的人工神经网络而已。此外,深度学习成功的主要原因是大量可用的数据以及像GPU这样更强大的计算引擎的出现。
这当然是事实,深度学习的出现基本要归因于这两方面的进展。但是,如果就此下结论说深度学习不过是比支持向量机或者决策树更好的算法而已,那就真的是一叶障目,不见泰山了。
借用Andreesen的话“软件正在占领全世界”,那么深度学习就正在取代机器学习。两篇来自不同机器学习领域的从业者很好的解释了为什么深度学习正在占领全世界。神经语言程序学(NLP)的专家Chris Manning这样形容“深度学习海啸”:
深度学习的浪潮在几年前就已经抵达计算语言学的海岸,但是2015似乎是这场海啸全面冲击各大自然语言处理(NLP)会议的一年。一些专家预言,最终的冲击将会更大。
Nicholas Paragios则写了一篇名为“计算机视觉研究:大萧条”的文章,以下是文章节选:
在高度复杂以及很大程度由图片的自由度决定的问题上,深度学习一旦被赋予大量被标记的数据以及不可想象(直到最近)的计算能力,就能解决所有的计算机视觉问题。如果是这样的话,那么深度学习占领业界,计算机视觉研究成为边缘学科并走上计算机图形的老路(学术研究的活跃度和数量)将只是时间问题。
这两篇文章都强调了深度学习相对机器学习是有颠覆性的意义的。当然,深度学习在商用领域也具备同样的颠覆性。但是让人震惊和困惑的是,就连Gartner也没能分清机器学习和深度学习之间的差别。这里是Gartner于2016年8月份发布的发展规律周期图(Hyper Cycle),深度学习甚至没有被提及:
尽管被Gartner忽视了,深度学习依然持续火热。目前对深度学习的炒作主要是:我们已经拥有了可以商用的机器,只要给它们足够多的数据和足够长的时间,它们就能够自己学习。这要么是夸大了深度学习的现有技术水平,要么就是将深度学习的实践过于简化了。在
过去的几年里,深度学习产生了大量的想法和技术,这些在以前要么是未知的,要么是站不住脚的。起初,这些概念是碎片化而且毫无关联的,但是随着时间的推移,大量的模式和方法开始涌现,深度学习设计模式这一领域也变得热闹起来。
今天的深度学习不仅仅是具备多层架构的感知器,而是一系列能够用来构建可组合可微分的体系结构的技术和方法。
这些具有超强能力的机器学习系统只不过是我们目前所能看到的冰山一角。关键在于,虽然深度学习目前看起来像点金术,但是总有一天我们会学会如何像操控化学一样操控它。有了这个基础,我们将能够更好的预测机器学习未来所能具备的能力。