华为“盘古Chat”即将问世：有望成为ChatGPT最强对手！

ChatGPT爆火全球的速度让人又惊又喜，而在AI大模型赛道上，不仅仅是国外大厂打得不可开交，就连国内企业也在疯狂追赶。比如，今年3月百度发布的大语言模型“文心一言”，可谓是打响了国内ChatGPT第一枪；紧接着，360、阿里、商汤等科技企业也相继推出了自己的AI大模型工具，彻底点燃了AIGC战火。

在ChatGPT引发的新一轮技术浪潮之下，华为作为中国科技公司的代表，自然也不会轻易掉队。近日有消息称，华为将在7月7日举行的HDC.Cloud 2023开发者大会上，推出一款全新的人工智能产品——盘古Chat。

据悉，这是一款与ChatGPT相媲美的多模态千亿级大模型，可以实现自然语言理解、对话生成、图像识别等功能。不过，该产品将主要面向To B/G政企端客户，普通用户在前期阶段可能难以直观体验到该产品。

▲相关报道截图

事实上，华为早在2020年就开始布局盘古大模型了，并于2021年4月正式发布，到2022年聚焦行业应用落地，其进化路径可分为L0-L1-L2三个阶段：

● L0阶段是指基础大模型，旨在利用海量数据进行预训练，从而得到通用基础模型，包括NLP（自然语言处理）大模型、CV（计算机视觉）大模型、多模态大模型、科学计算大模型，以及Graph（图网络）大模型。

● L1阶段是指行业大模型，是在L0基础上导入行业数据进行训练后衍生出的模型，目前已经发布了盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等。

● L2阶段是指大模型迭代，是在L1基础上结合行业细分场景得到的推理模型，比如金融OCR模型、电力巡检模型等。以电力行业为例，华为云基于盘古电力大模型，针对无人机电力巡检细分场景，通过一次“预训练+下游任务”的微调，推出盘古电力巡检大模型，解决了无人机智能巡检系统（缺陷检测）中的小样本学习、主动学习、增量学习等问题，同时解决了海量数据标注工作量大和缺陷种类繁多的问题。

华为“盘古Chat”即将问世：有望成为ChatGPT最强对手！

对于盘古大模型的定位，华为内部团队确立了三项最关键的核心设计原则：一是模型要大，可以吸收海量数据；二是网络结构要强，能够真正发挥出模型的性能；三是具有优秀的泛化能力，可以真正落地到各行各业的工作场景。

目前，盘古大模型已在100多个行业场景完成了验证，包括能源、零售、金融、工业、医疗、环境、物流等，从行业及场景两个维度能够管窥盘古大模型的应用情况：

● 在行业方面，CV大模型可应用于工业质检、物流仓库监控、时尚辅助设计等领域。NLP大模型可应用于智能文档搜索、智能ERP、小语种大模型等领域；科学计算大模型可应用于气象预报、海浪预测等领域。

● 在场景方面，盘古矿山大模型实现了综采场景的全景视频拼接等功能，保障安全生产；CV大模型实现了货车故障轨旁图像检测系统精度超过人类检测员；气象大模型实现了精度超过传统预报方式。

华为“盘古Chat”即将问世：有望成为ChatGPT最强对手！

▲图片来源：2021华为开发者大会

此前曾有券商披露，在训练千亿参数的盘古大模型时，华为团队调用了超过2000块的昇腾910芯片，进行了超过2个月的数据训练能力。

据官网介绍，昇腾（HUAWEI Ascend）910是业界算力最强的AI处理器，基于自研华为达芬奇架构3D Cube技术，实现了业界最佳AI性能与能效，不仅架构灵活伸缩，还支持云边端全栈全场景应用。在算力方面，昇腾910完全达到了设计规格，半精度（FP16）算力达到320 TFLOPS，整数精度（INT8）算力达到640 TOPS，功耗310W。

可以预见，华为入局AI大模型赛道，百度、阿里、腾讯等巨头企业无疑将迎来最强劲对手。正如华为常务董事、华为云CEO张平安在《致全球开发者》的信中表示，AI技术风起云涌，百家争鸣，激发新一轮百花齐放的应用创新，驱动千行百业的数字化转型升级，“Al for Industries”将成为人工智能新的爆发点。

华为“盘古Chat”即将问世：有望成为ChatGPT最强对手！

▲图片来源：华为官方公众号