苹果在近日召开的2024年WWDC全球开发者大会上开启了AI新篇章:推出全新AI系统Apple Intelligence,宣布与OpenAI的合作,ChatGPT集成将于今年晚些时候登陆iOS、iPadOS和macOS。
苹果大举发力AI之后,股价应声上涨。美东时间6月11日,苹果股价收盘涨幅超过7%,是苹果自2022年11月以来最大的单日涨幅,市值接近3.2万亿美元。截至美东时间6月13日收盘,苹果最新市值达到3.29万亿美元,暂时反超微软成为全球最大市值公司。此前,媒体已经报道受益于AI浪潮,英伟达、AMD等相关公司股价一路狂飙。AI“泼天的富贵”正到处挥洒,各行各业皆有望从中受益,AI服务器也将是其中之一。
AI服务器成长力道强劲
服务器作为一种高性能计算机,通常用于处理网络上的数据、存储和传输数据,并提供各种网络服务,以满足客户端请求与需要,在网络环境中扮演十分重要的角色。
图片来源:拍信
AI服务器即专门为人工智能应用设计的高性能计算平台,与传统服务器相比,在用途上AI服务器专门设计用于处理大规模数据和提供高效计算能力以支持人工智能应用;在硬件配置上,二者皆采用高速网络技术与硬件加速技术,与传统服务器以CPU为主要算力的形式不同,AI服务器需要满足AI算法下高性能计算、高存储需求,因而配置更加复杂,除了CPU之外,通常还需配备GPU、FPGA、ASIC等加速芯片,以满足AI算法训练和推理过程中对高吞吐量计算的需求,此外也需要配备大内存、高速SSD等存储产品。
当前AI服务器多属于“机架服务器”,一个机柜放多个服务器机箱,规格以U为代称,比如1U、2U、4U、7U等,AI需求越高,数字则越大。
AI大模型有训练(Training)、推理(Inference)两大应用场景需求,以此划分,AI服务器主要有训练型与推理型两类,其中训练型AI服务器算力要求极高,多数部署于云端,推理型AI服务器则对算力无太高需求,主要部署于云端与边缘侧。
在AI需求推动下,AI服务器成长力道强劲。全球市场研究机构TrendForce集邦咨询预估,2024年全球AI服务器(包含AI Training及AI Inference)将超过160万台,年成长率达40%。
此外今年3月,科技大厂戴尔大幅上调了AI服务器全球TAM(潜在市场规模),该公司预计2025年与2027年全球AI服务器TAM分别达到1050亿美元与1520亿美元,高于此前预期的910亿美元与1240亿美元。
产业链环节中,AI服务器上游为服务器零部件,包括芯片、PCB、电源、散热模组等;中游为整合组装,将芯片组装进服务器硬件中,并增加必要的网络、存储设备,形成完整的AI服务器解决方案;下游应用领域则包括互联网厂商、运营商、通信、政府、制造业、教育、金融与医疗等。
图片来源:全球半导体观察制图
上游:AI芯片是核心
AI芯片是构建AI服务器的核心硬件产品,用于处理大量数据并运行复杂计算任务。
图片来源:全球半导体观察
按照技术分类,AI服务器芯片主要包含GPU、FPGA、ASIC三类,GPU是目前AI服务器中常用的算力芯片,占比超过70%,常用于训练以及推理阶段,代表厂商包括英伟达、AMD、英特尔等国外企业,以及海光信息、寒武纪、燧原科技、摩尔线程、壁仞科技等国内公司。
值得一提的是,AI服务器中,GPU往往搭配HBM(高带宽内存)使用,HBM是专为GPU设计的内存技术,通过多个DRAM芯片层叠在一起,并使用高密度的硅通孔(TSV)和微凸点(microbumps)技术,实现与GPU的垂直互连。HBM目前呈现三星、SK海力士与美光“三分天下”的格局,已经发展至第五代(HBM3E),第六代HBM4预计有望最早于2025年亮相。
GPU之后是ASIC,为全定制芯片,在AI服务器市场中占比约两成,同样用于训练与推理阶段,代表厂商包括谷歌、亚马逊AWS等。
最后是FPGA,为半定制芯片,产品主要用于推理阶段,目前占比较低(个位数占比),代表厂商包括AMD、赛灵思、英特尔等。
除了上述厂商外,前文提及的苹果也对AI服务器芯片有所布局。今年5月媒体报道苹果已经开始构建基于M2 Ultra芯片的AI服务器,富士康正在组装相关产品,同时苹果还计划在2025年年底推出采用M4芯片的AI服务器。另有报道指出苹果正为数据中心自研AI服务器芯片,该芯片项目代号为ACDC(Apple Chips in Data Center),专注于推理模型。或许在不远的将来,苹果AI服务器芯片产品将会正式公开。
中游:AI服务器的两类“玩家”
服务器领域中游环节“玩家”众多,大致可以分为ODM厂商与品牌服务器厂商。服务器相关组件准备完成后,将由ODM厂商进行组装代工,再送至品牌服务器厂商处销售,或者是ODM厂商直接与下游(通常是云端业者)客户合作,根据客户的需求进行定制化生产,不通过品牌服务器厂商。AI服务器同样以此分为两类:
图片来源:全球半导体观察
其中,ODM代表厂商包括广达、工业富联、英业达、纬创、Supermicro等,它们与云端业者、上游芯片厂商深度绑定,有着稳定的供应链、快速交付能力、较低售价等优势,基于低成本和快速部署服务器以建设大规模数据中心的考量,近年云端业者与ODM厂商合作日益频繁。
受惠于云端数据中心领域订单带动,今年各大ODM厂商AI服务器出货强劲。工业富联今年已斩获Oracle订单,同时也承接部分AWS ASIC订单。5月15日工业富联一季度业绩说明会上,该公司表示2024年预计AI贡献占公司云计算总收入40%,公司AI服务器将达全球市场份额的40%;英业达除了北美客户之外,今年字节跳动需求强劲,有望共同推动AI服务器出货成长;广达订单主要来自北美云端客户如Microsoft及AWS,5月广达透露预期本季起AI服务器出货将温和成长,下半年AI服务器可望迎来出货爆发期,除了云端客户外,也已拿到其他新客户订单;Supermicro每季出货HGX等高端AI服务器的主要客户群,以欧美二线数据中心为主,如CoreWeave与Tesla等,另外也开始积极拓展苹果、Meta等客户AI订单。
品牌厂商方面,AI服务器代表厂商包括戴尔、HPE、甲骨文、惠普、联想、浪潮信息、新华三、宁畅、超聚变等,它们拥有服务器方案自主设计能力与核心技术专利,此前委托ODM代工厂商生产标准化服务器产品,再对外进行销售,不过随着云计算、AI需求不断增加,部分品牌服务器厂商也逐渐开始生产定制化产品,与ODM厂商形成了既合作又竞争的关系。如浪潮信息近年提出了JDM(Joint Design Manufacture,联合开发模式),不再单纯把产品卖给客户,而是与客户合作,让客户参与到服务器产品的设计、研发和交付的流程中,从而提升供应链效率,满足客户需求。
在AI浪潮推动下,品牌AI服务器同样呈现供不应求状况。戴尔截至2024年5月3日的2025财年第一季度财报显示,AI服务器助力,戴尔实现了自2022年以来的首次营收同比增长,超出市场预期。其中,服务器与网络营收同比增长42%至55亿美元,创下历史新高。戴尔表示,公司AI优化服务器的出货量较上季度环比增超100%至17亿美元,此类服务器的订单积压量环比跃升30%至38亿美元。
HPE财报显示,受益于AI服务器需求旺盛,截至今年4月30日的第二财季HPE净营收72.0亿美元,同比增长3.3%,超过业界预期,服务器业务创造了38.7亿美元的收入,AI服务器系统销售额超过了9亿美元,比第一财季翻了一番。HPE透露,AI服务器系统目前的积压订单达到31亿美元。
紫光股份总裁王竑弢今年4月对外表示,AI服务器订单在今年一季度有很大提升,产能满足市场需求不存在问题;公司有各类型GPU服务器满足AI场景应用,特别针对GPT场景而优化的GPU服务器已经完成开发,将在今年二季度全面上市。资料显示,紫光股份旗下新华三拥有多款AI服务器产品,可满足不同场景对智能算力的需求。
5月,联想集团公布的最新财报显示,服务器业务迎来拐点,ISG基础设施业务集团重拾增长动能,营收同比增速达15.1%,创下同期历史新高。同时,联想表示ISG仍然会坚定开发全面的人工智能产品组合。此前3月,联想首台搭载最新国产AI算力芯片的联想问天WA5480 G3成功投产下线并交付。
业界认为,受益于台积电CoWoS产能持续扩张以及NVIDIA AI GPU出货量的稳定,AI服务器芯片供应有望于2024年第二季度缓解,届时AI服务器整机出货量将陆续提升。
下游:CSP为高阶AI服务器主要需求动能
AI服务器的下游客户广泛,包括互联网企业、云计算企业、数据中心服务商、以及政府、金融、医疗等行业,当前AI服务器市场需求(尤其是高阶AI服务器)动能主要来自大型CSP(云端服务业者),包括微软、谷歌、亚马逊AWS、Meta、CoreWeave等美系厂商,以及BBAT(字节跳动、百度、阿里巴巴、腾讯)等国内厂商。
集邦咨询调查显示,以2024年全球主要CSP对高阶AI 服务器(包含搭载NVIDIA、AMD或其他高端ASIC芯片等)需求量观察,预估美系四大CSP业者包括Microsoft、Google、AWS、Meta各家占全球需求比重分别达20.2%、16.6%、16%及10.8%,合计将超过6成,居于全球领先位置。
国内高阶AI服务器需求占比目前较低,不过在政策支持、国产化趋势以及国内科技厂商持续布局大规模数据中心环境下,国内高阶AI服务器需求将持续上升,AI服务器产业有望持续受益。
随着消费电子市场逐渐复苏,加上ChatGPT、Sora等大模型“火爆出圈”,此前步入下行周期的半导体行业逐渐释放利好信号。不过与此同时,半导体行业还面临高性能AI芯片供应短缺、晶圆代工成熟制程产能过剩等隐忧,行业发展仍有一定不确定性。
展望未来,半导体与存储器产业将何去何从?产业发展又将迎来哪些技术变革?又将有哪些机遇与挑战?2024年6月19日(周三),TrendForce集邦咨询将在深圳举办“2024集邦咨询半导体产业高层论坛(TrendForce Semiconductor Seminar 2024)”。
届时,集邦咨询多位重量级资深分析师将针对AI浪潮推动下,聚焦晶圆代工、DRAM、NAND Flash等关键领域发表主题演讲。敬请期待!
封面图片来源:拍信网