传英伟达新AI芯片H20综合算力比H100降80%

2023-11-13  

【导读】为应对美国最新的芯片出口管制,英伟达再开发出三款针对中国大陆市场的最新改良版芯片,分别是HGX H20、L20 PCle和L2 PCle。知情人士称,最新三款芯片是由H100改良而来,英伟达最快或将于11月16号之后公布这一消息,国内厂商最快将在这几天拿到产品。


传英伟达新AI芯片H20综合算力比H100降80%


为应对美国最新的芯片出口管制,英伟达再开发出三款针对中国大陆市场的最新改良版芯片,分别是HGX H20、L20 PCle和L2 PCle。


知情人士称,最新三款芯片是由H100改良而来,英伟达最快或将于11月16号之后公布这一消息,国内厂商最快将在这几天拿到产品。


然而,有爆料指出,这三款新AI芯片并非“改良版”,而是“缩水版”。其中,用于 AI 模型训练的HGX H20在带宽、计算速度等方面均有所限制,理论上,整体算力要比英伟达 H100 GPU芯片降80%左右,即H20等于H100的20%综合算力性能,而且增加HBM显存和NVLink互联模块以提高算力成本。所以,尽管相比H100,HGX H20价格会有所下降,但预计该产品价格仍将比国内 AI 芯片910B高一些。


一位行业人士解释,这相当于将高速公路车道扩宽,但收费站入口未加宽,限制了流量。同样在技术上,通过硬件和软件的锁,可以对芯片的性能进行精确控制,不必大规模更换生产线,即便是硬件升级了,性能仍然可以按需调节。目前,新的H20已经从源头上‘卡’住了性能。”一位行业人士这样解释新的H20芯片,“比如,原先用H100跑一个任务需要20天,如今H20再跑可能要100天。


不久前,有报道指出,从2023年11月17日起,英伟达GeForce RTX 4090显卡将不再向中国大陆出口。


该报道称,RTX 4090似乎是美国试图阻止中国大陆和某些其他国家/地区获得先进技术的意外牺牲品,这种制裁对于H100、H800、A100、A800、L40和L40S等数据中心部件更有意义。然而,鉴于最后两者使用RTX 4090(和RTX 6000 Ada一代)中相同的AD102芯片,因此有必要对消费部件采用相同的限制。


中国大陆机构和企业目前有许多此前进口的零件可以使用,但美国的目的是限制进一步使用此类硬件。


当然,限制RTX 4090向中国大陆出口也意味着RTX 4090显卡在中国大陆的生产也受到阻碍。此外第三方AIB(附加板)合作伙伴,包括华硕、技嘉、MSI、PNY等,可能必须将RTX 4090产品的所有组装转移到中国台湾等其他地区。而转移的成本或将影响定价。


免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理。


推荐阅读:

文章来源于:电子元件技术    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。