2022年底ChatGPT横空出世带动产业大规模崛起,人工智能领域技术如雨后春笋一般迅速发芽,随着各领域不断深入探索大模型,该技术开始发展成新质生产力,在这个以数据驱动的新时代,芯片已成为新的战略资源,国家之间的竞争愈发激烈。现代科技巨头的对决在微观尺度的芯片上演绎着现代版的权力游戏。但AI不是炫技,如果不能让AI技术落地产业,那么所谓的一切概念也只是空中楼阁。
本文引用地址:全球对于AI算力的渴望犹如沙漠中的绿洲,各大企业和国家纷纷投入巨资,希望在这场没有硝烟的战争中占得一席之地。但大部分AI相关新闻的热点及技术的创新都被国外企业突破霸占了。尤其是美国的企业,其AI模型已然是家喻户晓。与百花齐放的AI模型相比,AI硬件基本上是英伟达一家独大,AI的编程模型也十分依赖英伟达的产品作为应用程序的开发接口(API)。今年,黄仁勋在迪拜举行的世界政府峰会中呼吁世界各国构建自己的主权AI基础设施。在与阿联酋人工智能大臣奥马尔·奥拉马的公开谈话中,黄仁勋认为:每个国家都需要拥有自己的AI基础设施,以便在保护自己文化的同时利用其经济潜力。,。
但美国对芯片出口的限制,更是在这场全球竞争中投下了一枚重量级的棋子,改变了游戏规则,引起了行业内部的地震。国内半导体厂商开始寻求新的出路,然而正是在这样的逆境中,一些创业公司开始寻找新的生机。
对于AI大模型来说,核心技术环节有三个,一是数据,二是算法,三是算力。中国有诸多互联网巨头,头部企业在数据方面有着天然的优势,尤其是涉及交易细节的电商数据,优势更加明显。
华为
提到芯片,国人第一个想到的一定是华为,在美国严苛的出口管制下,其展现了凤凰涅槃般的复兴。用麒麟9000 5G芯片的成功破茧而出,向世界证明了自力更生的强大决心。在海思的旗下,华为的昇腾系列AI芯片如同新星般耀眼,成为AI芯片的明珠,其技术水平和性能指标,让世界刮目相看。
替代
华为与英伟达的较量,不仅仅是技术的竞赛,更关乎全球科技霸权的转移。“大模型+大装置”的AI新基建,正成为AI产业化的重要支撑,而作为“基建狂魔”的中国,这次要在AI2.0时代发力了。
日前还有观点指出,看好国产AI大模型持续突破,国内模型、应用、算力等均迎来发展机会。2024年国内AI大模型新势力异军突起,产品力和应用体验快速追赶全球头部模型水平,部分领域已经接近,甚至达到了全球第一梯队。,,
商汤
中国人工智能领域的巨头商汤,大模型在多个专业领域已经拥有了不逊于ChatGPT的应用落地能力。商汤“日日新”大模型自去年推出以来,能力每隔三个月就会显著提升,到2024年2月升级至4.0版本后,在代码编写、数据分析和医疗问答等多个场景中,已经达到与GPT-4相匹配的能力水平。商汤推出的“模型即服务”创新商业模式,让客户能够轻松地在大装置微调和调用各类生成式AI能力,从而推动AI技术快速应用于市场。中国消费者享受到新技术的福利,又产生了大量用户数据促进技术进步,成为中国AI产业发展的独特优势。
小米、阅文、微博等行业领军企业,都成为商汤大装置上的开发者,HiDream.AI、澜舟科技、Tiamat等AI初创公司也借助商汤大装置的能力快速涌现。在大装置的算力保障下,商汤自身的日日新大模型也能够惠及更多普通用户,C端调用量呈现出近120倍的增长。
国际知名调研机构弗若斯特沙利文最新报告指出,商汤大装置已成为中国AI开发平台云计算基础设施供应商的领军者,综合竞争表现位列国内第一。
文心一言
目前最主流的AI大模型,其是在ERNIE及PLATO系列模型的基础上研发的,的头牌产品,近日,全球增长咨询公司弗若斯特沙利文发布了《2024年中国大模型能力评测》,评测显示,文心一言稳居国产大模型首位,拿下数理科学、语言能力、道德责任、行业能力及综合能力等五大评测维度的四项第一。
并将中国大模型分成了三个梯队,当下正值文心一言发布一周年,从去年3月文心一言发布到如今的文心大模型4.0版本,用户们见证了文心一言的迅猛成长,这不仅代表的是搜索平台、工具的迭代升级,更是人们对信息获取、理解和应用的一次全面革新。
百度基于独有的四层AI技术架构,分别从芯片、框架、模型和应用层面出发,迭代技术。尤其是框架和模型的协同优化,让文心大模型能不断提升效率。飞桨在过去一年里不断升级,向上支撑大模型生产,提高模型部署效率和灵活性;向下适配各类硬件,提高硬件适配效率和降低成本。据了解,如今文心大模型不断降低推理成本,目前已降至去年3月版本的1%。
同时为了让更多人用起大模型,百度推出了两款MaaS产品,用于应用开发的千帆AppBuilder和用于专有模型开发精调的千帆ModelBuilder,累计帮助用户精调1.3万个大模型,服务8万企业用户,帮助用户开发出16万个大模型应用。
腾讯
腾讯的混元大模型产品包括腾讯智影、混元助手等。Angel机器学习平台是支撑腾讯混元大模型的核心技术,主要目标是解决大模型海量数据训练难、架构设计难的问题,具备行业领先的硬件加速和在线推理服务能力,是打造通用人工智能不可或缺的基础平台。
腾讯混元大模型团队,正在持续研究和探索多模态技术,拥有行业领先的视频生成能力。目前,腾讯内部超过400个业务及场景已接入腾讯混元测试。企业微信、腾讯会议及腾讯文档部署了生成式AI功能,腾讯广告基于混元大模型推出AI广告创意平台妙思,有效提高广告主生产及投放效率。腾讯混元大模型目前技术架构已升级为混合专家模型 (MoE) 架构,参数规模达万亿,更擅长处理复杂场景和多任务场景,中文整体表现上处于业界领先水平,尤其在数学、代码、逻辑推理和多轮对话中性能表现卓越。
腾讯云联合生态伙伴,将大模型技术与20多个行业结合,提供超50个行业大模型解决方案。
阿里
通义千问是阿里巴巴达摩院自主研发的超大规模语言模型,,目前2.0版本刚出来不久,并有开源的720亿、140亿、70亿、40亿、18亿、5亿参数等尺寸,以及视觉理解模型Qwen-VL、音频大模型Qwen-Audio等多模态大模型。作为国内基础大模型的代表之一,通义千问正加快追赶GPT-4,并把基础大模型能力释放出来。智能手机芯片厂商联发科,已成功在天玑9300等旗舰芯片上部署通义千问18亿、40亿参数大模型,实现大模型在手机芯片端深度适配,让通义千问在离线情况下依然可以运行多轮AI对话。未来,双方还将基于天玑芯片适配70亿等更多尺寸的大模型。
通过横向对比不难发现,Qwen是目前业界最强的开源中文大模型,在10个权威基准测评中,都创下开源模型最优成绩。尤其在中文任务模式下,Qwen霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。
有业内人士认为,目前,通义千问的文档处理容量和能力,已超越ChatGPT等全世界市场上所有的AI应用。在竞争激烈的大模型领域,每一小步提升,都意味着更大的竞争优势,所以大厂们无时不刻都在向着更高的技术指标进级。在这种情况下,阿里通义千问只用了短短6个多月的时间,就从绝对落后做到了部分领先,这是极期难能可贵的。
Moonshot AI
月之暗面科技有限公司(Moonshot AI)凭借其最新力作——Kimi,一款能够处理200万字上下文输入的人工智能助手,不仅在技术上超越了ChatGPT,更在新质生产力的发展上树立了新的标杆,响应了两会对于科技创新和高质量发展的号召,展现了中国科技自主创新的力量。
Kimi支持20万汉字无损级别上下文输入,是AI消费级产品支持上下文文本长度记录保持者。它不仅能够理解复杂的语境,还能够进行深度学习和自我优化,使得信息处理更加高效和精准。
Kimi智能助手目前已经支持200万文字超长无损上下文,如果按照一个中文文字对应一个token计算,Kimi大概支持200万token输入,对比目前主流大模型:
1)谷歌近期发布的Gemini1.5pro支持100万token输入;
2)Claude3支持20万token输入;
3)GPT-4Turbo支持12.8万token输入。
这种能力在新质生产力的背景下,意味着Kimi能够为企业提供强大的数据分析支持,优化生产流程,提高决策质量,从而推动产业的智能化升级。基于Infra层的优化,Kimi智能助手生成速度较去年提升了三倍。
其应用场景极为广泛,从企业的市场分析、产品开发,到学术研究的数据整理、论文撰写,再到日常生活中的智能问答、语言学习,都能够提供强大的支持。随着技术的不断进步,Kimi在未来有望成为各行各业的得力助手,甚至在艺术创作、心理咨询等领域发挥其独特的价值。
从数据中心到智能手机,从自动驾驶到智慧城市,人工智能已经无处不在,对AI芯片的渴求也愈发强烈。企业不仅要在技术上追求极致,更要在市场营销上下足功夫。我们相信在头部企业及其它国产AI企业的共同努力下,中国AI技术必将“起航”、“造浪”。