《大演算》书摘-机器学习的五大学派

发布时间:2016-10-22  

computer-data-624x390

半导体行业观察一套机器学习演算法就像一位大师级的工匠一样:每一项它的产出作品都不相同,而且可以为客户的需求量身定做。然而不是要将石头变成砖瓦,黄金变成珠宝,机器学习机是要将数据资料转化为演算法。而且拥有越多的数据资料,便能归纳出越复杂的演算法。以下由三采文化,摘自《大演算:机器学习的终极演算法将如何改变我们的未来,创造新纪元的文明?》的部分内容。

我们如何能知道,人类已经真正找到大演算?当相同的学习器只有参数的改变,而且除了数据资料以外,只需要输入最小量的学习范本,就可以和人类一样,理解影音与文件内容,并能在生物学、社会学及其他科学领域,做出重大的新发现。显然,在这种标准下,目前还没有任何学习器已经被证明就是大演算,即使在不太可能的情况下,已有能解决某领域的演算法存在,仍不足以承担机器学习统一理论的大局。

在探求大演算的过程中,我们不必辛苦从无到有。我们已经有几十年的机器学习研究,可以从中借鉴完整全貌。机器学习领域目前存有许多互相竞争的思想学派,包括符号理论学派(Symbolists)、类神经网络学派(Connectionists)、演化论学派(Evolutionaries)、贝氏定理学派(Bayesians)和类比推理学派(Analogizers)。每个学派都有一套核心理念,以及一个它最关心的特定问题,也针对这个特定问题,基于其相关领域的科学概念,找到一个适合的解决方案,并且拥有一个主要的演算法,可以适度体现它的机器学习行为。

对于符号理论学派来说,所有的智能可以被简化成操纵符号,就像数学家求解方程序的过程,是透过用其他表达式来替换表达式的方法。符号理论学派明白,你不能从头学起,你需要一些初步的知识,与数据资料相配合。符号理论学派们已经找到了如何将先前存在的知识纳入学习,以及如何快速地将不同的知识进行结合,以解决新的问题。他们的主要演算法是逆向的演绎法(Inverse Deduction),透过这种演算法可以找出哪些知识是欠缺的,以便能做出逻辑的演绎推论,然后使其尽可能地被通则应用。

对于类神经网络学派来说,学习就是人类大脑所做的事情,所以我们需要做的,就是对大脑进行反向工程。大脑的学习是透过调整神经元之间的链接强度,而关键的问题是找出哪些神经元的连接,必须对哪些错误负责,并依此对应地改变它们。类神经网络学派的主要演算法是倒传递理论演算法(Back propagation),它会比较系统的输出与期望的输出,然后依次改变一层又一层的神经元链接,以便使得输出结果可以更接近于它应该呈现的。

演化论学派则认为,所有学习之母就是物竞天择。如果物竞天择可以造就我们,那么它就可以造就任何事情,而我们所需要做的,就是在电脑上模拟它。演化论学派所解决的关键性问题就是学习的结构,不只是调整参数而已,就像倒传递理论演算法所做的,可以创建一种能够让这些调整进行微调的大脑。演化论学派的主要演算法是一种遗传程序规划(genetic programming),就像大自然会交配与演化生物一样;同样地,遗传程序规划也会以相同的方式,繁衍与演化电脑程序系统。

贝氏定理学派最关注的课题就是不确定性。这门学派主张所有学到的知识都是不确定的,而且学习本身就是一种不确定的推理形式。那么这个问题就变成如何处理杂讯、不完整,以及相互矛盾的资讯,而不会造成分崩离析。解决的办法就是机率推理,而主要的演算法是贝氏定理与其衍生物。贝氏定理告诉我们如何把新证据转化为信念,而机率推理演算法则尽可能有效地做到这一点。

对于类比推理学派而言,学习的关键是认识各种情况之间的相似之处,从而推断其他情境的相似地方。如果两位患者都有相似的症状,也许他们患有相同的疾病,问题的关键是要判断两件事情之间是如何相似。类比推理学派的主要演算法就是支持向量机(Support Vector Machine,简称SVM),它可以找出哪些经验是需要记住的,以及如何结合这些经验,做出新的预测。

针对各个学派的核心问题,每个学派都有提出相对应的解决方案,这些解决方案都是相当卓越,且得来不易的进展。然而真正的大演算,是必须同时解决这五类问题,而不只是一个。我们的探索追求,将带领我们跨越这五个学派的每一个领地。每个领地之间的边境通道,是它们可能会遇到交涉与小冲突的地方,这将是这趟大演算探索旅程中最棘手的部分。你准备好了吗?我们的学习旅程就从拜访符号理论学派开始,这个学派可说是机器学习最古老的智能根源。

the master algorithm

《大演算》简介

有一个终极演算法,可以解开宇宙所有的祕密,现在大家都在竞争,谁能最先解开它!华盛顿大学电脑工程系教授佩德罗.多明戈斯(Pedro Domingos)破解了一个在机器学习领域中长久以来的瓶颈,成功把机器学习、哲学与人工智能结合起来,这个突破性研究还登上了《新科学人》(New Scientist)杂志的封面故事。

如需获取更多资讯,请关注微信公众账号:半导体行业观察

责任编辑:mooreelite
文章来源于:半导体行业观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>