国产AI持续突破带动互联网智能生态进入正循环

发布时间: 2024-04-03

来源: 电子产品世界

2022年底ChatGPT横空出世带动产业大规模崛起，人工智能领域技术如雨后春笋一般迅速发芽，随着各领域不断深入探索大模型，该技术开始发展成新质生产力，在这个以数据驱动的新时代，芯片已成为新的战略资源，国家之间的竞争愈发激烈。现代科技巨头的对决在微观尺度的芯片上演绎着现代版的权力游戏。但AI不是炫技，如果不能让AI技术落地产业，那么所谓的一切概念也只是空中楼阁。

本文引用地址：

全球对于AI算力的渴望犹如沙漠中的绿洲，各大企业和国家纷纷投入巨资，希望在这场没有硝烟的战争中占得一席之地。但大部分AI相关新闻的热点及技术的创新都被国外企业突破霸占了。尤其是美国的企业，其AI模型已然是家喻户晓。与百花齐放的AI模型相比，AI硬件基本上是英伟达一家独大，AI的编程模型也十分依赖英伟达的产品作为应用程序的开发接口（API）。今年，黄仁勋在迪拜举行的世界政府峰会中呼吁世界各国构建自己的主权AI基础设施。在与阿联酋人工智能大臣奥马尔·奥拉马的公开谈话中，黄仁勋认为：每个国家都需要拥有自己的AI基础设施，以便在保护自己文化的同时利用其经济潜力。，。

但美国对芯片出口的限制，更是在这场全球竞争中投下了一枚重量级的棋子，改变了游戏规则，引起了行业内部的地震。国内半导体厂商开始寻求新的出路，然而正是在这样的逆境中，一些创业公司开始寻找新的生机。

对于AI大模型来说，核心技术环节有三个，一是数据，二是算法，三是算力。中国有诸多互联网巨头，头部企业在数据方面有着天然的优势，尤其是涉及交易细节的电商数据，优势更加明显。

华为

提到芯片，国人第一个想到的一定是华为，在美国严苛的出口管制下，其展现了凤凰涅槃般的复兴。用麒麟9000 5G芯片的成功破茧而出，向世界证明了自力更生的强大决心。在海思的旗下，华为的昇腾系列AI芯片如同新星般耀眼，成为AI芯片的明珠，其技术水平和性能指标，让世界刮目相看。

替代

华为与英伟达的较量，不仅仅是技术的竞赛，更关乎全球科技霸权的转移。“大模型+大装置”的AI新基建，正成为AI产业化的重要支撑，而作为“基建狂魔”的中国，这次要在AI2.0时代发力了。

日前还有观点指出，看好国产AI大模型持续突破，国内模型、应用、算力等均迎来发展机会。2024年国内AI大模型新势力异军突起，产品力和应用体验快速追赶全球头部模型水平，部分领域已经接近，甚至达到了全球第一梯队。，，

商汤

中国人工智能领域的巨头商汤，大模型在多个专业领域已经拥有了不逊于ChatGPT的应用落地能力。商汤“日日新”大模型自去年推出以来，能力每隔三个月就会显著提升，到2024年2月升级至4.0版本后，在代码编写、数据分析和医疗问答等多个场景中，已经达到与GPT-4相匹配的能力水平。商汤推出的“模型即服务”创新商业模式，让客户能够轻松地在大装置微调和调用各类生成式AI能力，从而推动AI技术快速应用于市场。中国消费者享受到新技术的福利，又产生了大量用户数据促进技术进步，成为中国AI产业发展的独特优势。

小米、阅文、微博等行业领军企业，都成为商汤大装置上的开发者，HiDream.AI、澜舟科技、Tiamat等AI初创公司也借助商汤大装置的能力快速涌现。在大装置的算力保障下，商汤自身的日日新大模型也能够惠及更多普通用户，C端调用量呈现出近120倍的增长。

国际知名调研机构弗若斯特沙利文最新报告指出，商汤大装置已成为中国AI开发平台云计算基础设施供应商的领军者，综合竞争表现位列国内第一。

文心一言

目前最主流的AI大模型，其是在ERNIE及PLATO系列模型的基础上研发的，的头牌产品，近日，全球增长咨询公司弗若斯特沙利文发布了《2024年中国大模型能力评测》，评测显示，文心一言稳居国产大模型首位，拿下数理科学、语言能力、道德责任、行业能力及综合能力等五大评测维度的四项第一。

并将中国大模型分成了三个梯队，当下正值文心一言发布一周年，从去年3月文心一言发布到如今的文心大模型4.0版本，用户们见证了文心一言的迅猛成长，这不仅代表的是搜索平台、工具的迭代升级，更是人们对信息获取、理解和应用的一次全面革新。

百度基于独有的四层AI技术架构，分别从芯片、框架、模型和应用层面出发，迭代技术。尤其是框架和模型的协同优化，让文心大模型能不断提升效率。飞桨在过去一年里不断升级，向上支撑大模型生产，提高模型部署效率和灵活性；向下适配各类硬件，提高硬件适配效率和降低成本。据了解，如今文心大模型不断降低推理成本，目前已降至去年3月版本的1%。

同时为了让更多人用起大模型，百度推出了两款MaaS产品，用于应用开发的千帆AppBuilder和用于专有模型开发精调的千帆ModelBuilder，累计帮助用户精调1.3万个大模型，服务8万企业用户，帮助用户开发出16万个大模型应用。

腾讯

腾讯的混元大模型产品包括腾讯智影、混元助手等。Angel机器学习平台是支撑腾讯混元大模型的核心技术，主要目标是解决大模型海量数据训练难、架构设计难的问题，具备行业领先的硬件加速和在线推理服务能力，是打造通用人工智能不可或缺的基础平台。

1712127338800(1).jpg

腾讯混元大模型团队，正在持续研究和探索多模态技术，拥有行业领先的视频生成能力。目前，腾讯内部超过400个业务及场景已接入腾讯混元测试。企业微信、腾讯会议及腾讯文档部署了生成式AI功能，腾讯广告基于混元大模型推出AI广告创意平台妙思，有效提高广告主生产及投放效率。腾讯混元大模型目前技术架构已升级为混合专家模型 (MoE) 架构，参数规模达万亿，更擅长处理复杂场景和多任务场景，中文整体表现上处于业界领先水平，尤其在数学、代码、逻辑推理和多轮对话中性能表现卓越。

腾讯云联合生态伙伴，将大模型技术与20多个行业结合，提供超50个行业大模型解决方案。

阿里

通义千问是阿里巴巴达摩院自主研发的超大规模语言模型，，目前2.0版本刚出来不久，并有开源的720亿、140亿、70亿、40亿、18亿、5亿参数等尺寸，以及视觉理解模型Qwen-VL、音频大模型Qwen-Audio等多模态大模型。作为国内基础大模型的代表之一，通义千问正加快追赶GPT-4，并把基础大模型能力释放出来。智能手机芯片厂商联发科，已成功在天玑9300等旗舰芯片上部署通义千问18亿、40亿参数大模型，实现大模型在手机芯片端深度适配，让通义千问在离线情况下依然可以运行多轮AI对话。未来，双方还将基于天玑芯片适配70亿等更多尺寸的大模型。

通过横向对比不难发现，Qwen是目前业界最强的开源中文大模型，在10个权威基准测评中，都创下开源模型最优成绩。尤其在中文任务模式下，Qwen霸榜C-Eval、CMMLU、GaokaoBench等基准，得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

1712127347924(1).jpg

有业内人士认为，目前，通义千问的文档处理容量和能力，已超越ChatGPT等全世界市场上所有的AI应用。在竞争激烈的大模型领域，每一小步提升，都意味着更大的竞争优势，所以大厂们无时不刻都在向着更高的技术指标进级。在这种情况下，阿里通义千问只用了短短6个多月的时间，就从绝对落后做到了部分领先，这是极期难能可贵的。

Moonshot AI

月之暗面科技有限公司（Moonshot AI）凭借其最新力作——Kimi，一款能够处理200万字上下文输入的人工智能助手，不仅在技术上超越了ChatGPT，更在新质生产力的发展上树立了新的标杆，响应了两会对于科技创新和高质量发展的号召，展现了中国科技自主创新的力量。

Kimi支持20万汉字无损级别上下文输入，是AI消费级产品支持上下文文本长度记录保持者。它不仅能够理解复杂的语境，还能够进行深度学习和自我优化，使得信息处理更加高效和精准。

Kimi智能助手目前已经支持200万文字超长无损上下文，如果按照一个中文文字对应一个token计算，Kimi大概支持200万token输入，对比目前主流大模型：

1）谷歌近期发布的Gemini1.5pro支持100万token输入；

2）Claude3支持20万token输入；

3）GPT-4Turbo支持12.8万token输入。

这种能力在新质生产力的背景下，意味着Kimi能够为企业提供强大的数据分析支持，优化生产流程，提高决策质量，从而推动产业的智能化升级。基于Infra层的优化，Kimi智能助手生成速度较去年提升了三倍。

其应用场景极为广泛，从企业的市场分析、产品开发，到学术研究的数据整理、论文撰写，再到日常生活中的智能问答、语言学习，都能够提供强大的支持。随着技术的不断进步，Kimi在未来有望成为各行各业的得力助手，甚至在艺术创作、心理咨询等领域发挥其独特的价值。

从数据中心到智能手机，从自动驾驶到智慧城市，人工智能已经无处不在，对AI芯片的渴求也愈发强烈。企业不仅要在技术上追求极致，更要在市场营销上下足功夫。我们相信在头部企业及其它国产AI企业的共同努力下,中国AI技术必将“起航”、“造浪”。

文章来源于: 电子产品世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

国产AI持续突破带动互联网智能生态进入正循环

相关关键词

相关文章