在2023年10月美国政府颁布新禁令,进一步限制的高性能AI的出口,对此选择迅速开发针对中国区的“最新改良版”AI —— 三款均基于H100改良而来,以符合美国最新的技术出口管制政策。然而,英伟达现在面临一个更麻烦的问题:中国厂商并没有积极购买性能降级版芯片。
本文引用地址:由于降级版性能与原版相差较大,有消息称降幅已经达到25%甚至更高,而这就导致包括、、、等中国云计算大客户对此积极性有所下降
知情人士称,自去年11月以来,巴巴、等中国大型云计算公司一直在测试英伟达的“特供”芯片样本。这两家企业已向英伟达表示,今年订购的芯片数量将远远少于此前原计划购买的、已经被禁的英伟达高性能芯片。
除了H20,英伟达还计划推出另外两款符合新限制的芯片:L20和L2。根据SemiAnalysis对芯片规格的分析,H20、L20和L2包含了英伟达用于人工智能工作的大部分最新功能,但为了遵守新规则,它们的计算能力被削减了。
根据此前曝光的参数信息,英伟达H20与H100、H200同系列,均采用英伟达Hopper架构,但显存容量增大至96GB HBM3,GPU显存带宽4.0TB/s。算力方面,该产品的FP8算力为296 TFLOPS,FP16算力为148 TFLOPS,仅为当今“最强”AI芯片H200的1/13。
阉割版芯片卖不动了
此前,英伟达最昂贵的A100、H100芯片就无法对中国市场出售,随后为中国市场定制的A800、H800芯片也被限制对中国出售,未来仅可以对中国出售的“最新改良版”的H20等芯片。
而这种多次轮番的制裁,为中国市场“特供”还再三改版,让中国厂商感到了危机。从政策方面而言,英伟达芯片未来是否能够提供稳定供应存在很大风险,如果相关限制继续变得严格,可能将会面临新的芯片限制风险。在过去的几个月里,中国厂商包括、、、逐渐调整其供应链,把一些先进半导体订单转移到本土企业,并更多地依赖于内部开发的芯片,减少对外部芯片供应商的依赖。
另一方面,降量不降价的操作,让英伟达领先中国本土产品的性能优势正在缩小,这也使得国产芯片对买家的吸引力越来越大。相较于美国芯片,中国最先进的芯片已经能够满足通过训练后的AI模型进行预测的要求,并承担一些不太复杂的训练任务。
英伟达在中国市场的营收占据其整体全球市场营收的高达47%的份额;在中国价值70亿美元的人工智能芯片市场上,英伟达占据了90%以上的份额。对于英伟达来说,它既要满足美国监管机构的要求,又要提供中国客户需要的芯片,在这两者之间取得平衡正变得越来越困难。此前,中国公司向英伟达订购了50亿美元芯片,但是这些订单没能完全交付。
这就是目前英伟达需要面临的问题:阉割版的芯卖不动,短期看是利润的受损,长期看是庞大的市场让出,一旦市场其他玩家成长起来,英伟达将难以收复失地。更致命的是,市场的丧失将使得利润与研发投入正循环被打断,对于一家科技公司来说,这才是致命的,或许这才是英伟达最焦虑的问题所在。
总的来说,现在是中国芯片发展的绝佳时期:国内技术型芯片公司的情况与英伟达刚刚反过来,国内大量的AI企业有芯片需求。当有足够的市场需求要填补,自然有足够的动力去投入研发,一旦性能提升到一定的高度,大量的订单需求会涌入,以市场来拉动技术研发,形成正向的良性循环。类似华为发布的AI芯片「昇腾910」系列,在部分性能上,已经接近英伟达最先进的A100系列了。
未来,在美半导体管控政策之下,中国厂商已不确定英伟达是否能够继续向他们供应芯片,因为美国监管机构已承诺定期审查芯片出口管制,并可能进一步收紧对于芯片性能的限制。因此,越来越多中国科技企业正在调整商业策略,为未来更少地使用英伟达芯片做准备,避免为了适应新芯片而付出不断调整技术的昂贵代价。
AI芯片替代进程加快
AI时代,围绕算力展开的竞争无疑将会更加激烈,在中国市场对算力的巨大需求催化下,英伟达被限制或许将在未来引发更多的贸易摩擦和技术竞争。正因如此,英伟达CEO黄仁勋曾警告称,美国挑起的芯片之争令其国内半导体企业备受掣肘,或反为本国科技行业带来“巨大损害”。从长远来看,美国的限制措施很可能会推动中国开发自己的技术,目前阿里巴巴打造的平头哥ASIC和华为投资的昇腾计算平台就是典型案例。
英伟达芯片在华遇冷的状况其实背后反映了中美之间在AI领域的复杂竞争,AI时代的算力之争,还将持续下去。中国的芯片产业不能过度依赖外部的供应,必须加快自主创新的步伐,培育自己的芯片品牌,提升自己的AI算力水平,才能在新时代保持竞争力和主动权。
国产AI芯片厂商持续发力,产品覆盖了AI推理和AI训练需求,其中有基于通用GPU架构的芯片、基于ASIC架构的芯片、类脑架构芯片,已经呈现出多元化的发展趋势。目前,中国已经出现了一批具有自主研发能力的人工智能芯片企业,如华为、平头哥半导体、阿里云、等。这些企业通过自主研发和合作开发等方式,不断推出各种类型的AI芯片,以满足不同应用场景的需求;或者可能调整AI开发思路,直接转而租用服务商提供的资源。
不久前,英伟达CEO黄仁勋将华为列为“非常难对付”(very formidable)的AI芯片竞争对手;美媒称,英伟达所受的限制给了华为在中国市场攻城略地的机会。根据消息,华为2023年获得中国网路巨擘预购至少5000颗升腾910B(Ascend 910B)芯片,这款芯片被视为最接近英伟达A100的中国版替代品。Ascend 910B预定2024年交货,不知道是否能突破美国制裁造成产能受限的窘境。
TrendForce分析认为,中国云计算企业目前从英伟达采购约80%的高端芯片,预计这一比例在未来五年将降至50%-60%。这可能使得国内的寒武纪、景嘉微、海光信息、华为等厂商吸收大量订单,从而获取大量利润,推动研发正循环。
英伟达在2006年推出的通用并行计算架构CUDA,借助CUDA提供的编程接口和工具集等,开发者可以基于GPU芯片编程、运行复杂的AI算法等等。虽然H100的垄断地位导致服务器间兼容性问题,但英伟达在AI领域树立的最大优势还是从语言设计到开发者工具这些构成的生态壁垒,周边工具一旦被用户所接受,客户技术迁移的成本将会是难以想象的。
但是需要明白,“用的人多了,生态也就有了”,这是无论对于英伟达还是国内厂商而言都适用的准则。客观的讲,本土替代品实际上仍有一定距离,未来一年内英伟达的芯片大概率仍将是优先采购的产品。事实上,国产AI芯片想要真正取代英伟达,不仅在算力、功耗、稳定性等方面还有一定差距,在软硬件生态方面也还需努力,不过从此次英伟达在华受冷来看,差距或许正在拉进。