ChatGPT是“人工智能的里程碑” ？微软重金押注欲挑战谷歌搜索引擎王者地位

2022年11月30号，OpenAI发布，原本旨在用作聊天机器人，但用户也可以对其进行微调，以完成各种任务，如回答问题、提供信息或参与对话。

本文引用地址：

自11月底推出以来，它已经在互联网上引起了轰动，在不到一周的时间里就聚集了第一批100万用户。

捕获.PNG

在大量网友的疯狂测试中，表现出各种惊人的能力，如流畅对答、写邮件、写代码、写剧本、纠错等，甚至让记者、编辑、程序员等从业者都感受到了威胁，更不乏其将取代之说。继AlphaGo击败李世石、AI绘画大火之后，成为又一新晋网红。

ChatGPT如何以假乱真

ChatGPT是一个采用基于GPT-3.5架构的大型语言模型，与InstructGPT模型是姐妹模型（sibling model），使用了人类反馈强化学习（RLHF）技术来更好地让语言模型与人类指令保持一致。

而GPT（Generative Pre-Trained Transformer）是一系列基于Transformer的深度学习语言模型，利用机器学习算法来分析和理解文本输入的含义，然后根据该输入生成响应。该模型在大量文本数据上进行训练，使其能够学习自然语言的模式和结构。

· 2018年6月，OpenAl在“Improving Language Understanding by Generative Pre- Training”的论文中提出了第一个GPT模型GPT-1，GPT-1以无监督预训练＋有监督微调的方式，针对特定任务进行训练，实现了 “强大的自然语言理解”。

· 2019年2月，OpenAl发表了第二篇论文 “Language Models are Unsupervised Multitask Learners”，其中介绍了由GPT-1演变的GPT-2。GPT-2可以完成多任务处理，成功地证明了半监督语言模型可以在“无需特定任务训练”的情况下，在多项任务上也能够表现出色。

· 2020年5月，OpenAl发表“Language Models are Few-Shot Learners”，呈现GPT-3，GPT-3比GPT-2大100倍，它拥有1750 亿个参数。

· 2022年11月底，OpenAl进行了两次更新，ChatGPT由效果更强大的GPT-3.5系列模型提供支持，可以用更接近人类的思考方式参与用户的查询过程。

ChatGPT模型的训练过程：

i. 使用有监督的微调训练初始模型：人类训练师之间提供对话，其中一个扮演用户，另一个扮演ChatGPT中的Al助手。为了创建强化学习的奖励模型，需要收集比较数据，并使用收集到的数据调整GPT-3.5模型；

ii. 模型会根据提示生成多个输出，训练师将ChatGPT编写的回复与人类的回答进行比较，并对它们的质量进行排名，以帮助强化机器的类人对话风格。奖励模型将自动执行最后一个训练阶段，使用排名后的数据训练；

iii. 在最后一步使用近端策略优化进一步调整，这是OpenAl广泛使用的强化学习技术。

捕获.PNG

曾几何时，AI生成的文字内容还是“一眼假”，但自从ChatGPT横空出世以来，这种分辨工作是越来越难做了。语言生成模型来了，学校作业会不会从此变得形同虚设？

就在1月3日，拥有全美最大公立学校系统的纽约市，正式颁布了ChatGPT禁令。也就是说，不管是老师还是学生，都无法在纽约市公立学校的网络和设备上使用ChatGPT。最近，洛杉矶和巴尔的摩的学区也加入到了这个行列。

ChatGPT存在的问题

虽然ChatGPT是一个 "的大里程碑"，但它并不完美，而这正是其工程师需要警惕的地方。

GPT-3.5仅依赖于其训练数据中的统计规律，不会在网络上抓取时事信息，使得它的一些回答略显陈旧，在输出的准确性上也会有所降低；还会导致某些问题的回答上会出现致命性错误，看似有逻辑的表达实则为错误的信息输出，用户需要具有鉴别回答质量与准确性的能力。

其次在披露ChatGPT时，OpenAI说它已经进行了检查，努力使模型拒绝不适当的请求，以防止它产生恶意代码。但有人已经找到了欺骗该系统的方法，使其认为它只用于研究目的，对有害的指令作出反应或表现出有偏见的行为。

另外，GPT到GPT-2到GPT-3，虽然在算法模型并没有太大改变，但参数量从1.17亿增加到1750亿，预训练数据量从5GB增加到45TB，其中GPT-3训练一次的费用是460万美元，总训练成本达1200万美元。

根据OpenAl创始人Sam Altman描述，ChatGPT单轮对话平均费用在0.01-0.2美元。对于想要复刻的公司来讲，开发成本是主要的门槛。

重金押注ChatGPT

据路透社援引Semafor消息报道，正在考虑计划向OpenAI增投100亿美元，如果合作达成，将持有其49%的股份。早在2019年，微软就向这家初创公司投资了10亿美元，这笔交易将OpenAI与微软云计算平台捆绑在一起。

这一金额也将超过微软近年来的所有收购，只有三笔除外：2016年斥资260亿美元收购的职业社交网站领英；去年又花200亿美元对Nuance Communications Inc.进行收购；以及目前正在寻求反垄断批准想以690亿美元收购视频游戏制造商动视暴雪公司。

捕获.PNG

微软本身几十年来一直致力于项目，并在语音和图像识别等领域取得了重大进展，增持OpenAI股份与微软要在云计算市场上占据更大份额的目标一致 —— 将使微软在Azure上开发OpenAI技术方面占据有利位置，Azure不仅是微软的云基础设施，还是其增长最快的业务之一。

科技行业对ChatGPT感到如此兴奋的另一个重要原因是机器人可能会改变网络搜索，它可能会打破和其他科技巨头在搜索领域的长期主导地位。

对微软来说，加大对OpenAI的投资，还可以防止OpenAI的产品流向竞争对手，包括亚马逊网络服务和。确保一旦开始颠覆现状，微软不仅能够毫发无损，还可以从中受益。

根据业内人士爆料，微软目前正准备筹备推出新版本的Bing，预计会在2023年3月底前推出这项功能。产品亮点是会使用人工智能技术来回答搜索查询，而不是像之前的那些，仅显示搜索结果的列表。

值得注意的是，根据微软和OpenAI的协议，微软应该可以提前获得OpenAI语言模型的下一次迭代GPT-4的技术，并且会在今年年内推出。如果GPT-4能解决搜索的准确性问题，而且微软能做出一个吸引人的搜索界面，那么它就可能对谷歌搜索构成威胁。

如果解决了上文提到的问题，并且将ChatGPT技术整合到微软的全部生态，例如 LinkedIn、Nuance Communications、Two Hat Security甚至GitHub Inc… 那就毫无疑问微软将会拥有一个更光明的前景。

ChatGPT是“人工智能的里程碑” ？微软重金押注 欲挑战谷歌搜索引擎王者地位

ChatGPT是“人工智能的里程碑” ？微软重金押注欲挑战谷歌搜索引擎王者地位