据报道,在美国限制措施的压力下,计划效仿,为中国市场打造“特别版”的加速芯片—Gaudi 3。这两款相关产品据传将于6月底和9月底发布。
本文引用地址:最近发布了新一代加速芯片Gaudi 3。表示正在准备为中国市场推出特制版的Gaudi 3。这包括两种硬件版本:HL-328 OAM兼容的夹层卡和HL-388 PCIe加速器卡。HL-328定于6月24日发布,而HL-388则定于9月24日发布。
在规格方面,中国特制版与原版共享相同的特性,包括96MB片上SRAM内存、128GB HBM2e高带宽内存(带宽为每秒3.7TB)、PCIe 5.0X16接口和解码标准。
不过,由于美国对芯片的出口限制,高性能AI的综合计算性能(TPP)必须低于4800才能出口到中国。这意味着中国特制版的16位性能不能超过150 TFLOPS。
相比之下,原版Gaudi 3在FP16/BF16下可实现1835 TFLOPS。这与的H100相比,在大模型训练方面大约慢40%,在推理任务方面效率低50%。
因此,为中国市场打造的特制版将需要大幅减少内核数量(原版拥有8个矩阵乘法引擎(MME)和64个张量处理器核心(TPC)引擎)和工作频率。最终,这可能导致其AI性能降低约92%,以符合美国的出口管制要求。英特尔为中国市场推出的特制版AI性能将与为中国市场定制的H20 AI加速器卡相当。
英特尔Gaudi 3的中国特制版在FP16/BF16下性能达到148 TFLOPS,略低于150 TFLOPS的限制。然而,在高带宽内存(HBM)容量和带宽方面,中国特制版Gaudi 3将低于英伟达的H20,这可能使其在竞争中处于劣势。当然,价格也将是决定其是否具有竞争优势的关键因素。
据报道,该芯片的价格被认为与其竞争对手华为的产品相当。英伟达H20的订购价格在每片12000至15000美元之间。
短期内中国企业仍将继续购买现有的AI芯片。除了现有的A800或H800库存,英伟达设计的专门针对中国市场的GPU AI加速器芯片—包括H20、L20和L2仍然是首要选择。长期来看,预计中国CSP将加速发展,其中阿里巴巴的T-Head和百度在这一领域尤其活跃,依赖台积电和三星等代工厂进行生产。同时,华为、百瑞恩等中国主要AI企业将继续开发通用AI芯片,为本地企业提供AI解决方案。除了开发AI芯片外,这些公司还在中国建立国内AI服务器生态系统。TrendForce认为成功的关键因素之一将是中国政府通过本地化项目(如涉及中国电信运营商的项目)对国产AI芯片的采用给予支持。
最后,在高端AI芯片开发受限背景下,TrendForce认为中国可在中低端边缘AI服务器市场找到机遇。这些服务器对AI计算能力的需求较低,适用于商业聊天机器人、视频流、互联网平台和汽车辅助系统等应用。它们可能不完全受美国限制的影响,因此成为中国企业在AI市场的一个潜在增长方向。