摘要
龙年春节,在基于大模型(LM)技术的文本生成工具ChatGPT热潮尚未褪去之际,美国OpenAI公司推出的文本转生视频工具Sora再次惊艳了世界,这种依据文字输入精确分析语义(需求)和自动收集素材来模拟物理世界的能力,将会在很多领域全面改变生产制造模式。可以预见,在大模型技术的支持下,除了文本、图片和视频内容生成,生成式人工智能(AIGC)技术结合专业/行业大模型将会在产品设计、工业设计、软件开发、生物医药和其他许多领域改变创新模式,并直接与先进制造系统联动形成新的生产力,这就意味着第四次工业革命的大幕正在加速升起。
在全球人工智能(AI)技术快速发展的同时,随之而来的是美西方政府对我国AI等领域越来越紧逼的遏制,进一步验证了快速提升国家总算力和建设自主算力科技体系迫在眉睫,是我国昂首实现中国式现代化的关键。而不久前美国商务部再次加码对我国人工智能和高性能数据处理芯片的限制,为我国利用最新人工智能技术和高性能计算来实现各个行业的数字化转型和进一步发展蒙上了阴影。海外供应商为了遵从美国政府的限制,不断降低对华出口的AI芯片的单芯片性能,但是许多国内企业仍然趋之若鹜,其中虽然有国外厂商在技术能力和产业生态方面的优势,但在外来技术难以为继的局面下仍然对它们保持跟随和依赖,将在新的工业革命中严重损害我国未来的国家竞争力。
本文以人工智能技术的核心动力——高性能算力芯片为目标,结合每一次工业革命的红利分配模式,就目前在人工智能领域可能发生的对海外GPU芯片的三大依赖进行了分析,并提出了利用不断涌现的多元化硬件数据处理加速器技术,促进我国人工智能芯片企业通过架构性创新和生态融合,结合应用打造新质生产力的一些政策建议。
正文
越来越多的人认识到人工智能技术已经成为第四次工业革命的核心支撑技术。在今年的两会上热议新质生产力的同时,“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”也被写入了2024年政府工作报告。这是“人工智能+”首次出现在我国的政府工作报告中,意味着国家非常认可人工智能作为科技创新领域战略性技术的重要地位并加以广泛的推广应用,正在以“人工智能+”为引擎,加快形成发展新质生产力的新动能。
所以,正在发生的第四次工业革命对实现中国式现代化和新型工业化至关重要。这次工业革命是以人工智能(AI)等技术为核心的新技术革命,一个国家和一家企业的进步速度,最终将取决于开发、引入和应用人工智能技术的速度。因此,中国作为世界第二大经济体和人口大国,要实现中华民族的伟大复兴,不仅要成为人工智能技术最大的应用市场,而且还要成为第四次工业革命的重要推动者、贡献者和引领者,这就需要建立自主可控的人工智能技术和解决方案体系,以及以中国企业为核心并造福世界的产业生态。
技术推动者的巨大红利
要高度重视人工智能等推动第四次工业革命落地的关键技术,因为从过去三次工业革命对人类社会的影响来看,每一次工业革命都不仅会产生很多新的设备代替人力去更高效地完成工作,而且还会产生越来越多依靠人类体力和智力无法实现的创新功能。因此,对每次工业革命中推动性技术的掌控,反映到国家间和企业间的竞争上就是工业革命策源地红利和技术推动者优势;这种策源地红利可以使英国这样中等规模国家领享日不落帝国红利,也可以支撑美国反超欧洲大陆成为雄霸全球的超级大国。
马克思在看到了第二次工业革命时期,资本主义国家在生产力得到巨大提升而带动了经济迅猛发展之后,评论道:“第二次工业革命是对资本主义生产方式的一场伟大冲击。”美国、德国等国家进行了改革,抓住新技术革命的机会窗口,分到了第二次工业革命的策源地红利而成为了世界资本主义经济强国。作为每一次工业革命最重要的结果,策源地红利有如下三个属性:
首先是全球性红利重塑了世界格局。工业革命中技术创新带来的更高生产力需要在全球市场上换取回报,所以为实现此目标而进行的贸易从未停止,同时为了打开市场或者保护市场还进行了大量战争,包括后期殖民战争、两次世界大战,也包括今天美国政府针对我国在先进半导体技术和人工智能等领域内的技术限制等。
其次是关键技术领域内的创新使推动者占尽优势。每一次工业革命都是科学发现和技术创新大量涌现的结果,全球越来越严格的知识产权保护体系给创新推动者带来了先发优势,同时越来越便捷的交通和通信方式推动了新的、规模更大的企业组织和生产方式,创新推动者的研究开发活动取得的成果可实现加速转化和全球覆盖,还可以利用巨额利润采用收购兼并等手段巩固自己的技术优势和消灭竞争对手,以保证创新者在全球市场上保持领先和竞争力。
第三是高技术产业带来的马太效应进一步凸显。每一次工业革命都带来了大量的科技创新和新增财富,但结果是创新资源和新增财富主要都流向能够把控核心技术的国家,更多的国家只能是走上跟随和依赖的道路,成为工业革命策源地红利的贡献者。特别是在今天全球化受阻,美西方对中国等国家在半导体和人工智能等领域的技术出口限制,将有可能加大他们和我国之间的代差,促使我们未来的每一步发展都落后于人。
第一次工业革命使英国获得了策源地红利,第二次工业革命使美国和德国得到了策源地红利,第三次工业革命的策源地红利使美国成为了在经济、技术和军事远超于任何国家(包括前苏联)的全球霸主。而今天,在第四次工业革命渐行渐近的时候,我国也正在走向中国式现代化,就需要前瞻性地扶持和推动能够给社会和经济发展带来新质生产力的决定性技术,让中国也分享策源地红利,在我国培养更多的创新推动者,不再像前三次工业革命中那样成为追随者。
中国式现代化不能依赖海外决定性技术,而人工智能技术就是第四次工业革命的决定性技术之一。根据清华大学与国际知名技术市场研究公司IDC等机构联合编制的《2021-2022全球计算力指数评估报告》,一个国家拥有的总计算能力对国家的宏观经济发展有重大影响,它与GDP/数字经济的走势呈现正相关。计算能力优势越高,对经济拉动作用越显著;根据上述机构的研究:计算能力指数增加一个点,将拉动数字经济增长3.5‰并拉动GDP增长1.8‰。
在今年两会李强总理发布的2024年政府工作报告中,在“加快发展新质生产力”部分提出了"人工智能+"行动,表明了国家已从顶层设计的角度将围绕人工智能的科技创新置于非常重要的位置,加快实现人工智能技术的自立自强,成为当前和未来我国实现经济高质量发展,以及在第四次工业革命中分享策源地红利的关键引擎。
人工智能是什么?
人工智能是一个老话题,但是今天又有了全新的答案。从计算机诞生开始,世界各地的科技工作者都一直在探索如何用计算设备来模仿人脑的思维过程,从而利用机器来产生智能或者人工形成具有学习、分析和判断能力的智能。人工智能的形态和应用是非常广泛多样的,例如科学家们曾经花费了巨大的努力去帮助计算机识别各种物体,车辆自动驾驶系统开发人员采用多种手段去识别道路、标识和障碍并制定相应的行驶模式,最新发布的Sora系统可以根据文本输入生成一分钟的高质量视频。
基于第三次工业革命带来的半导体技术、计算机技术和通信技术,以及在这些技术支持下人类所积累的大量数据,今天的人工智能不再是对人类思维的简单模仿,而是利用海量的数据(知识)、强大的计算能力、先进的模型和超高速的高带宽网络连接,在经过训练之后形成可在许多方面超越人类思维能力的智能系统。例如,人工智能系统在各种对弈中屡屡战胜棋界世界冠军。
1982年4月,由日本通产省发起的“第五代电脑系统”计划开始实施,希望通过开发具备人工智能的电脑系统,使其知识处理产业在上世纪九十年代像小汽车和DRAM一样胜过美国。该计划因为算力和存储等诸多限制未能开发出真正的人工智能技术。中国友谊出版社1985年翻译出版的《第五代》一书详尽描述了这场冲击人工智能领域内的战役,作者:费根鲍姆与迈科达克。
在接到一个任务之后,现代人工智能系统可以自己读懂即使是普通人输入的要求,并据此去查询相关数据甚至主动寻找尽可能多的人类知识,用最优化的、可以收敛的计算方法(模型),自主去判断、推导和生成最优的答案。它与第三次工业革命中的计算不同,计算是按照已制定的程序对已有或者输入的数据进行处理,而人工智能则利用大模型技术广泛选择数据来源、处理方式并得出结论。当然,现代人工智能系统能够在一些方面超越人类的思维能力,必须依靠强大的计算能力,它是构成现代人工智能系统的物质基础。
这样的技术进步已经体现在前一段时间火爆全球的ChatGPT,以及近期惊艳全球的Sora等人工智能工具之上,揭示了生成式人工智能、大模型和多模态等人工智能重要细分领域实现了快速突破,已经可以依据文本/语音输入来高质量地回答问题、生成文章、绘制图片和创造视频,可以开始为消费者和一些商业部门提供服务了。但是这些服务只是人工智能很小的一部分服务,可以预见未来行业大模型技术将极大地改变多个产业的生产方式,将第四次工业革命带入现实社会。
算力竞争的本质是高性能芯片
很多人惊叹于Sora对物理世界的模拟和展现,开始为影视、广告和传媒等行业的从业人员担忧和兴奋,但是人工智能技术的应用面和影响力远远大过这些行业。例如,用生成式人工智能和大模型技术来进行新型药物研发可以大大缩短研发周期和降低研发费用,基于人工智能的软件开发可以大幅度降低代码编写工作量,依据文字和语音输入完成各类产品的系统设计和工业设计。如果这些研发成果和设计与智能制造相连接,那么将是人类生产能力的一次巨大飞跃,所以人工智能技术是第四次工业革命的核心技术。
随着处于GPT-3等级的ChatGPT以及其开发者OpenAI在全球广受关注,也推动了国内信息技术(ICT)领域内大模型研究和开发热潮浮出水面,全球共计170多个大模型,国内也呈现“百模千态”竞争局面。国内互联网和信息通信技术(ICT)领域的头部企业和相关院所积极投入,极大地缩小了我国在大模型/多模态等现代人工智能技术和平台开发和应用领域与海外领先机构的差距。
人工智能技术需要强大而且极为高效的算力,在通用计算和移动计算中取得巨大成功的英特尔x86架构和Arm公司推出的通用计算架构不能提供相应的计算效率,因此带有数据处理加速器的异构计算是未来的发展之道。数据处理加速器不仅可以满足运算速度需求,而且单位运算量的能耗更低并带来了数据中心运维成本的降低。因此,美国英伟达公司(Nvidia)踩准了风口推出的基于GPU架构的高性能加速计算芯片成为了人工智能训练领域追捧的对象,使这家公司近年来营收大增且净利润率超过50%,市值超过了2万亿美元。
高性能人工智能芯片成为了焦点,所以推出Sora的OpenAI公司一边继续抢购英伟达的GPU,一边还提出了募资七万亿美元来打造AI芯片的构想。这是一个非常重要的信号,想必是OpenAI在深入开展生成式人工智能和大模型(AIGC/LM)等新兴技术开发的同时,已经发现了近年来基于高性能GPU的人工智能计算架构还有巨大的优化空间和发展天地,开始思考用比这些GPU更高效的架构来打造专用加速器,从而形成更为高效易用的AI专用芯片(ASIC)这一路径,这与我国华为等公司在AI芯片领域内走ASIC路径的策略不谋而合。
OpenAI推出的Sora工具利用文字生成了令人惊艳的视频,展示了AIGC的广阔前景,尤其是在生成产品设计、软件程序、工业设计和新药配方等方面的极高效率,意味着全新的产业运行模式正在人工智能技术推动下形成
但是英伟达的GPU目前仍然是使用最为广泛的人工智能芯片,而且由于国内许多大模型研究和开发机构也采用在国际流行的GPU架构和英伟达公司产品,加上受到美国政府步步紧逼的出口管制,建立在海外算力引擎上的国内人工智能生态正在面临巨大的危机。
依赖西方技术的危机初现
在市场上已有的硬件加速器中,图形处理器(GPU)因为具有多层并行计算功能,因此成为了为人工智能技术提供强大的、高效的计算能力的重要途径之一。而ChatGPT等大模型/多模态平台的成功,带来对英伟达公司的高性能GPU技术和产品的热炒和追捧,国内主要大模型开发者也趋之若鹜,参与了全球争抢英伟达的GPU产品的队伍,而且这种现象曾经愈演愈烈,直到美国政府在去年10月17日再次加码对人工智能芯片的出口限制。
根据新的限制措施,英伟达等公司为了规避美国政府在2022年出台的限售政策而进行减配后的GPU芯片将再次列入限售范围,并对我国用户有可能通过转口贸易获得高算力芯片的20多个国家进行了限制,同时还进一步加紧了对我国半导体设备的出口限制。这些措施表明:美国政府正在将先进的高算力芯片政治化和武器化,以遏制中国利用第四次工业革命的机会加快发展。
不断出台和不断加码的限制性政策,使采用英伟达公司GPU芯片来开发和搭建人工智能系统的企业和机构将面临新的危机。由于现代人工智能计算都采用了大模型模式,因此都需要大量搭载了GPU芯片的数据处理加速卡,目前GPT-3等级的千亿参数模型需要上千张这种加速卡,而向万亿参数级的更大模型发展已是趋势,这就需要上万张搭载GPU的加速卡。
美国政府的这些限制措施将使我国在快速提升算力方面出现越来越多的困难,但即使这样许多用户仍然对配置一减再减的海外GPU趋之若鹜,所以更让人担心的是国内企业和研究机构对海外GPU等技术的依赖,可能给我国自主人工智能技术的发展带来长期的、巨大的不利影响。在第四次工业革命的初期,在整体应用市场全貌和最佳技术路径均未全面显现的前提下,这种执迷于英伟达一家厂商的技术和产品的情况,已经产生了影响我国人工智能技术发展的三大依赖:
1.架构依赖:从表面上看,GPU是一种公开的架构,很多中国芯片企业也在开发用于大规模数据处理加速的通用计算GPU,但是GPU需要用一大批外部控制和连接等应用技术来做出加速卡和AI服务等产品方可便于用户使用。英伟达除了提供先进的GPU芯片,还提供包括Grace CPU、NVLink/Infinband连接和NVSwitch交换等全套解决方案的高性能加速卡和AI服务器,封死了内外连接等其他配套技术的发展空间,中国用户或被锁死而不得不长期付出高昂的代价和承担随时被禁售的风险。
2.路径依赖:英伟达等美西方公司擅长于采用建立联盟来制定标准、建立认证体系来强化和扩展下游团队、以及利用媒体放大自己的创新优势,如在某些性能指标上(比如单位算力的能耗)等方面限制竞争对手,拉拢核心客户和伙伴来瓜分市场。例如,该公司是应用编程接口(API)领域最大的标准组织科纳斯集团(Khronos Group)的联合发起人和最重要赞助者,从最初以图像显示和游戏相关的API出发,演进到今天涵盖GPU和高性能计算的数据连接和交换接口。目前,这类标准组织看似是开放的行业组织,但是他们越来越政治化的趋势实际上让国内企业充满风险。
3.生态依赖:利用底层技术优势和资金实力来建立强大的产业生态,是领先企业攻城掠地和稳固行业地位的重要手段。随着人工智能在越来越多的行业中被采用,以英伟达为代表的西方企业的生态扩展,全面渗入了我国人工智能数据处理和网络建设,将给我们的社会发展和经济建设带来新的风险。例如英伟达除了提供高性能GPU芯片,还提供了CUDA并行计算架构并受到了全球应用开发人员的广泛欢迎,以至于我国的GPU芯片设计企业为了获得用户,多数都还不得不依赖兼容CUDA架构。又如,英伟达提供了加速创业公司发展的全球生态项目,旨在培养采用该公司技术的、可颠覆行业格局的优秀创业公司,壮大自己的团队参与竞争。
在一次新技术革命的发端之初,我国的新技术应用产业就产生这三大依赖的后果将会十分严重,可能会在国家安全、经济安全和高新技术产业安全等方面带来整体性和产业性威胁。这种威胁不只国内有识之士已经看到,而且各国政府和先进企业都对此保持了高度的警惕,这就是为什么多个国家政府都反对英伟达收购全球领先的处理器IP厂商Arm这项交易的原因,尽管英伟达为收购Arm公司出价高达740亿美元。同时,OpenAI公司和Arm公司的掌门人在近期纷纷发声要募巨资去开发自己的AI芯片,其原因也是面对人工智能广阔的前景不愿意被GPU和英伟达锁定。
支持自主底层技术,服务第四次工业革命
信息通信技术(ICT)行业的历史经验告诉我们:在第四工业革命发生的过程中,不要在三大依赖已经产生之后,再花费巨大的人力物力去尝试追赶、打破和纠偏,而是在一开始就要推动自主创新,用自有的底层技术来建立自主可控的人工智能技术架构、路径和生态。同时,全球领先的大模型技术企业OpenAI公司和处理器企业Arm公司都在考虑研发新的AI芯片,说明了他们已经看到了比以通用计算为目标的GPU技术更为高效、高性能的架构,采用新的加速器架构来更好地实现人工智能是可行的。
每一次工业革命,机器都实现了更多人类“做不到”的能力,而在第四次工业革命中,机器将开始实现很多人“看不到”和“想不到”的能
当然,打破他人利用底层技术来构筑的垄断的难度非常之高,可以借鉴个人电脑和服务器行业的发展史。第三次工业革命中英特尔和微软组成了Wintel联盟,几十年过去了,x86 CPU芯片和Windows操作系统至今还锁定着全球主要电脑用户和服务器用户,同一浪潮中成长起来的苹果公司一直想努力突破这种局面,结果全球市场份额减少到10%左右。虽然我国的信创工作目前已满足了党政军所需的办公电脑和服务器,但是要打破英特尔和微软的架构性霸权还需要进一步的努力。
所以在人工智能领域要支持自主可控的底层技术和架构,应该注意以下几个方面的策略:
1.进口替代是起点,而不是目标终点。我国半导体行业近几年的发展实践表明:由于很多芯片企业没有建立强大的产业生态、市场能力和技术能力,进口替代往往最后都变成了国内厂商之间相互比拼价格争取替代对方的“内卷”,疫情期间中国芯片企业在MCU、模拟芯片和其他多个领域曾经全面替代进口,但是非常遗憾的是当疫情结束,全球半导体供应链恢复正常之后,国内芯片厂商又把主要市场归还给了国际领先芯片企业。在人工智能和高性能计算等领域只盯着GPU芯片的进口替代,也很难摆脱同样的模式和结果。
2.人工智能和高性能计算的重点是数据处理加速器,而不只是GPU。虽然英伟达用A100和H100等芯片成功证明了其GPU在高性能计算和人工智能计算中的性能和价值,但是这些GPU芯片本身从微架构上来看,也是面向通用计算而集成了多种加速、存储和连接单元,因此并不一定是效率最高的人工智能加速处理架构,这才是更多厂商要去做人工智能专用集成电路(AI ASIC)的原因。
因此,应该鼓励国内企业和科研机构针对未来智能化计算需求,积极在最底层探索多样化的加速器架构和ASIC等实现方式。例如华为昇腾人工智能处理器就采用了更趋向带有创新加速能力的ASIC架构,因而能够在多个方面优于英伟达A800 GPU芯片,并成功运行了千亿参数级的大模型,证明了我国企业也能够从最底层技术开始与国际领先企业竞争。
3.加快基于自主技术的人工智能生态建设,通过打造全生态竞争力去争取分享策源地红利。过去我们在很多领域走进口替代道路,但却无法从深层次撼动国际领先厂商的领先地位,这是因为替代型企业没有自己独立、完整的生态。所以要摆脱对英伟达GPU体系架构的依赖,不能单靠国内新兴芯片公司利用英伟达的CUDA架构去替代该公司的GPU芯片。而是需要全生态上下游厂商、创新联合体和产业联盟,将本地化的应用(数据源)、核心技术、开发者等主体结合在一起形成自主生态优势,在从数据收集/感知、融合/边缘智能、传输/智能网联,到人工智能数据中心计算/处理等全流程上,全面梳理通用及特定需求并找到全链创新点,从而形成人工智能整体解决方案和发展路线图,最终摆脱对英伟达等公司的依赖。
人工智能技术体系并不只是一种计算技术,也不是单靠算力指标决胜负,因此目前是我们从底层开始建立自主技术体系和产业生态的战略机遇期。尽管GPU等数据处理加速器件在高效能并行计算方面目前占据优势,但是成功的信息技术都是紧扣应用场景的技术,因此自主人工智能技术的发展需要有关部门推动全链路化和场景化的协同。虽然美国政府的限制措施带来了客户对华为昇腾等人工智能芯片的巨大需求,但是目前更需要政府部门和大客户联合支持这些企业及其伙伴加快新的生态建设。
目前,我国现有30余家企业参与AI芯片的设计与生产,部分AI软硬件产品已经具备在数字政府、制造、交通、金融、运营商行业落地商用的能力。其中,华为昇腾、寒武纪、天数智芯等具有自主可控芯片,开源深度学习框架有昇思MindSpore、飞桨PaddlePaddle、OneFlow等。在与之配合的通用计算CPU芯片和操作系统领域,前期信创等举措也已经培育了一批具备替代国外同类产品并在部分领域具备竞争优势的企业;同时华为和中兴等企业也走过了成为ICT领域世界级领导企业的道路,能够带动产业链不同环节上的优势企业协同创新。这些都为我国人工智能产业集群在未来的竞争中脱颖而出奠定了基础。