【导读】市场消息传出,英伟达下一代Blackwell架构芯片GB200的量产计划再度遭遇技术瓶颈,微软将削减订单。
市场消息传出,英伟达下一代Blackwell架构芯片GB200的量产计划再度遭遇技术瓶颈,微软将削减订单。
供应链透露,这次问题来自美商大厂,为了将72颗Blackwell GPU通过5000根NVLink铜缆进行高速互连,所开发出的全新cartridge连接器模组,每个cartridge中有几千根线,在GH200规格下达到每根112G,而GB200规格预计升级至224G,难度大幅提升,现在面临良率不佳测试不过关的瓶颈,量产时间恐再推迟至2025年3月。
据悉,英伟达今年3月发布了全新的Blackwell计算平台及GB200超级芯片。与前一代H100 GPU相比,GB200超级芯片在大语言模型推理工作负载方面的性能提升了30倍。
近期有知情人士透露,英伟达的GB200芯片在装有72个芯片的服务器中使用时会过热。这些设备预计每个机架功耗高达120kW。这些问题迫使英伟达多次重新评估其服务器机架的设计,因为过热会限制GPU性能并存在组件损坏的风险。客户们担心这些挫折可能会阻碍他们在数据中心部署新芯片的时间表。
作为对延误和过热问题的回应,英伟达发言人表示,“我们正在与领先的云服务提供商合作,将其作为我们工程团队和流程中不可或缺的一部分。工程迭代是正常且符合预期的。将GB200这一迄今为止最先进的系统集成到各种数据中心环境中,需要与我们的客户共同设计。”英伟达还表示,“目前客户正在抢占GB200系统的市场先机”。
推荐阅读:
相关文章