ChatGPT爆火全球的速度让人又惊又喜,而在AI大模型赛道上,不仅仅是国外大厂打得不可开交,就连国内企业也在疯狂追赶。比如,今年3月百度发布的大语言模型“文心一言”,可谓是打响了国内ChatGPT第一枪;紧接着,360、阿里、商汤等科技企业也相继推出了自己的AI大模型工具,彻底点燃了AIGC战火。
在ChatGPT引发的新一轮技术浪潮之下,华为作为中国科技公司的代表,自然也不会轻易掉队。近日有消息称,华为将在7月7日举行的HDC.Cloud 2023开发者大会上,推出一款全新的人工智能产品——盘古Chat。
据悉,这是一款与ChatGPT相媲美的多模态千亿级大模型,可以实现自然语言理解、对话生成、图像识别等功能。不过,该产品将主要面向To B/G政企端客户,普通用户在前期阶段可能难以直观体验到该产品。
▲相关报道截图
事实上,华为早在2020年就开始布局盘古大模型了,并于2021年4月正式发布,到2022年聚焦行业应用落地,其进化路径可分为L0-L1-L2三个阶段:
● L0阶段是指基础大模型,旨在利用海量数据进行预训练,从而得到通用基础模型,包括NLP(自然语言处理)大模型、CV(计算机视觉)大模型、多模态大模型、科学计算大模型,以及Graph(图网络)大模型。
● L1阶段是指行业大模型,是在L0基础上导入行业数据进行训练后衍生出的模型,目前已经发布了盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等。
● L2阶段是指大模型迭代,是在L1基础上结合行业细分场景得到的推理模型,比如金融OCR模型、电力巡检模型等。以电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次“预训练+下游任务”的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,同时解决了海量数据标注工作量大和缺陷种类繁多的问题。
对于盘古大模型的定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
目前,盘古大模型已在100多个行业场景完成了验证,包括能源、零售、金融、工业、医疗、环境、物流等,从行业及场景两个维度能够管窥盘古大模型的应用情况:
● 在行业方面,CV大模型可应用于工业质检、物流仓库监控、时尚辅助设计等领域。NLP大模型可应用于智能文档搜索、智能ERP、小语种大模型等领域;科学计算大模型可应用于气象预报、海浪预测等领域。
● 在场景方面,盘古矿山大模型实现了综采场景的全景视频拼接等功能,保障安全生产;CV大模型实现了货车故障轨旁图像检测系统精度超过人类检测员;气象大模型实现了精度超过传统预报方式。
▲图片来源:2021华为开发者大会
此前曾有券商披露,在训练千亿参数的盘古大模型时,华为团队调用了超过2000块的昇腾910芯片,进行了超过2个月的数据训练能力。
据官网介绍,昇腾(HUAWEI Ascend)910是业界算力最强的AI处理器,基于自研华为达芬奇架构3D Cube技术,实现了业界最佳AI性能与能效,不仅架构灵活伸缩,还支持云边端全栈全场景应用。在算力方面,昇腾910完全达到了设计规格,半精度(FP16)算力达到320 TFLOPS,整数精度(INT8)算力达到640 TOPS,功耗310W。
可以预见,华为入局AI大模型赛道,百度、阿里、腾讯等巨头企业无疑将迎来最强劲对手。正如华为常务董事、华为云CEO张平安在《致全球开发者》的信中表示,AI技术风起云涌,百家争鸣,激发新一轮百花齐放的应用创新,驱动千行百业的数字化转型升级,“Al for Industries”将成为人工智能新的爆发点。
▲图片来源:华为官方公众号