2022年,由IDC、浪潮信息、清华大学全球产业研究院联合编制了一份《2021-2022全球计算力指数评估报告》,量化揭示了算力的重要性:全球各国算力规模与经济发展水平显著正相关,计算力指数平均每提高1点,数字经济和GDP将分别增长3.5‰和1.8‰;美国和中国的计算力指数分别为77分和70分,同属国别计算力的领跑者。
六部委联合发文
为了更好推动算力基础设施高质量发展,10月8日,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发《算力基础设施高质量发展行动计划》(以下简称《行动计划》),从计算力、运载力、存储力、应用赋能四个方面,提出了到2025年发展量化指标:
计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展。
运载力方面,国家枢纽节点数据中心集群间基本实现不高于理论时延1.5倍的直连网络传输,重点应用场所光传送网(OTN)覆盖率达到80%,骨干网、城域网全面支持IPv6,SRv6等新技术使用占比达到40%。
存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以上,重点行业核心数据、重要数据灾备覆盖率达到100%。
应用赋能方面,打造一批算力新业务、新模式、新业态,工业、金融等领域算力渗透率显著提升,医疗、交通等领域应用实现规模化复制推广,能源、教育等领域应用范围进一步扩大。每个重点领域打造30个以上应用标杆。
与此同时,《行动计划》还部署25项重点任务,包括:完善算力综合供给体系(建设布局、算力结构、异构协同、标准体系);提升算力高效运载能力(运载质量、接入网络、传输效率、算力调度);强化存力高效灵活保障(存力技术、存储产业、存算网协同);深化算力赋能行业应用(服务体系、工业、教育、金融、交通、医疗、能源);促进绿色低碳算力发展(提升算力碳效水平、引导市场应用、赋能行业发展);加强安全保障能力建设(提升网络安全、强化数据安全、强化产业链供应链安全,保障算力设施平稳运行)。
此外,考虑到《行动计划》的落地实施,需要各级政府、基础电信运营商、第三方数据中心服务商、互联网企业等各类市场主体在算力基础设施建设运营中发挥各自优势,互促互补、形成合力,《行动计划》还提出了4方面的保障措施,包括:加强统筹联动、加大金融支持、深化交流协作、以及强化平台支撑。
中国算力规模有多庞大?
众所周知,数字经济时代的关键资源是数据、算力和算法,其中数据是新生产资料,算力是新生产力,算法是新生产关系,统一构成数字经济时代最基本的生产基石。
中国信息通信研究院9月发布的《中国算力发展指数白皮书(2023年)》显示,我国近6年累计出货超过2091万台通用服务器,82万台AI服务器,计算设备算力总规模达到302EFlops,其中智能算力规模达到了178.5EFlops,增速为72%,在我国算力占比超过59%。同时,算力的高速发展也为拉动我国GDP增长做出了突出贡献,在2016-2022年期间,我国算力规模平均每年增长46%,数字经济增长14.2%,GDP增长8.4%。
从算力发展指数来看,京津冀、长三角、粤港澳大湾区、成渝双城经济圈等区域算力发展保持领先水平,其中广东、北京、江苏、浙江、山东、上海仍然位于第一梯队。中西部核心省份算力发展日益崛起,贵州、内蒙古、甘肃、宁夏等核心省份算力发展优势突出,随着“东数西存”、“东数西训”、“东数西算”等链条并行发展,中西部地区技术创新、算力应用、产业基础等制约算力发展的条件不断得到改善。
依据中国算力发展指数2.0的评估方法,结合我国各城市的算力基础设施规模、技术发展水平、产业应用发展水平等指标计算各城市算力发展指数,以此来衡量各地算力发展水平,并以此给出我国算力二十强市榜单。其中,北京、上海算力发展水平领先优势明显;广东、江苏入围城市数量最多。
从行业应用来看,互联网行业仍是算力需求最大的行业,占通用算力39%的份额,占智能算力53%的份额;电信行业通用算力份额首次超过政府行业,位列第二;服务行业快速从传统模式向新型智慧模式发展,智能算力份额占比位居第二。
这与全球算力产业的发展规模和趋势保持一致。2022年全球计算设备算力总规模达到906EFlops,增速达47%,其中基础算力规模为440EFlops,智能算力规模为451EFlops,超算算力规模为16EFlops。预计到2025年,全球算力规模将超过3ZFlops,至2030年超过20ZFlops。
突围算力软肋
如前文所述,算力通常分为通用算力、智能算力、超级计算三类,该报告指出,算力产业繁荣发展的背后,是以AIGC为代表的人工智能应用、大模型训练等新应用、新需求快速崛起对算力提出的更高要求。
一方面,计算技术加速演进,异构计算成为智能计算周期高算力主流架构;另一方面,先进计算体系化创新活跃,芯粒(Chiplet)、高带宽内存(HBM)、存算一体、量子计算、光计算等前沿计算技术创新步伐不断加快,2035年后先进计算将开启非经典计算规模化落地应用的发展阶段。
上述趋势的出现,让CPU、GPU、ASIC和FPGA芯片的需求结构出现了变化。简单而言,就是传统CPU主导的通用算力占比下降,GPU主导的智能算力占比逐渐增长,以NPU(神经网络处理器)、DPU(深度学习处理器)为代表的大量AI芯片应运而生。
但这也是中国本土产业链的薄弱环节,甚至是中国企业与国际一流企业差距最大的环节。
目前,服务器CPU仍被X86架构所主导,英特尔、AMD两家的市场份额分别为71%和20%,Arm为8%;AI服务器方面,2022年全球AI芯片市场规模为168.6亿美元,其中英伟达占比超过80%,全球AI服务器加速芯片市场主要被英伟达占据,市场份额超过95%;超算CPU同样以英特尔和AMD为主,占比高达96.2%。相比之下,国产服务器CPU包括阿里倚天、华为鲲鹏、“中科系”的海光和龙芯,在全球市场份额不足2%,在中国市场份额不足8%。
芯片制造方面,台积电目前超过40%的收入由数据中心芯片代工贡献,当前全球最先进的服务器CPU和GPU芯片,均由台积电代工。
即便是租赁云算力,也遭到了围堵。有消息称,中国厂商未来若想使用海外云服务商的云端算力服务,也要获得美国政府许可才行。
为实现自主可控,减少卡脖子风险,中国本土产业链采用了“关键环节自研+培育本土产业链”的模式。相对来说,自主设计芯片、自研设计软件等环节难度相对较低,例如阿里、腾讯、百度等都有自主设计的服务器CPU/GPU/NPU芯片,壁仞、天数智芯、沐曦、燧原科技、瀚博等科技公司在AI推理芯片、新兴计算平台等领域也获得了持续突破。
国产服务器采购招标中,中国移动2021年-2022年服务器集采项目中,华为鲲鹏、海光服务器共4.4万台,整体招标量占比27.0%;中国电信2022年-2023年服务器集采项目中,国产芯片服务器采购规模共5.3万台,占比26.7%。
而在北京市经信局4月下旬公布的“北京市通用人工智能产业创新伙伴计划”中,算力供应伙伴已经从最初的北京超级云计算中心和阿里云,扩展到了百度、京东、神州数码和金山等10家企业;在7月举行的WAIC上,华为方面则宣布昇腾AI集群规模从最初的4000卡扩展升级至16000卡,成为业内首个万卡AI集群,其算力已经在支撑像科大讯飞等企业进行大模型训练以及智能化转型。
尽管从经济指标来看,本土算力供应还存在不少问题,但要想从“能用”变为“好用”,通过规模采购国产芯片的方式培育本土产业链,无疑是最为正确的路线。