【导读】据TrendForce援引报道称,英伟达正在考虑至少为其即将推出的用于人工智能(AI)和HPC(高性能计算)应用的部分Blackwell B300 GPU采用新的插槽设计。
据TrendForce援引报道称,英伟达正在考虑至少为其即将推出的用于人工智能(AI)和HPC(高性能计算)应用的部分Blackwell B300 GPU采用新的插槽设计。
考虑到AI GPU在高负载下的故障率、主板更换成本和散热问题,英伟达和其他AI GPU设计师可能会考虑在下一代GPU中使用插槽设计,而不是将GPU焊接到主板上。不过需要注意的是,插槽式设计通常会增加功耗和散热问题,最耗电的GPU通常使用BGA封装。
供应链方面消息,里昂证券(CLSA)分析师Chen Shuowen表示,英伟达一直在为其产品设计GPU插槽,可能从GB200 Ultra开始。据报道,Chen Shuowen提到了英伟达带有一个CPU主板的4路GPU设计。考虑到DGX服务器,拥有一个8路GPU主板和一个2路CPU主板,但这样的设计看起来不可思议。
英伟达的数据中心命名法将公司GPU(A100、H100、B100/B200)和Grace CPU + GPU平台(GH100、GB200)进行了划分。目前,GB200平台的CPU和GPU均采用BGA封装;不确定B200 Ultra更新后是否会有所改变,尤其是下半年可能出现的GB200 Ultra更新。
标准的CPU插槽拥有易于维修和升级的优势。但在服务器中,与BGA封装或SXM/OAM模块相比,它们占用的空间更大,功耗和散热限制也更多。虽然模块可修复,但具体过程可能因主板设计而异,而且拆卸SXM/OAM模块需要小心操作,因此它们不如插槽好用。
还有一点需要说明。附加卡、SXM/OAM模块的制造难度大、成本高,目前,大多数英伟达SXM模块都是由富士康制造。从板卡或模块迁移到插槽可以降低成本,但性能会受到限制。
目前,英伟达已正式推出B200 GPU(功率超过1000W),将用于GB200板卡(代号为Bianca,配备一个Grace CPU和两个Blackwell GPU,以及Ariel,配备一个Ariel CPU和一个Blackwell GPU),采用BGA封装。此外,英伟达还有支持8个B200(1000W)和B100(700W)SXM模块尺寸的Umbriel GPU板。此外,据报道,还有代号为Miranda的平台(增加了性能-更高TDP、PCIe 6.0和800G网络)和代号为Oberon GB200 的平台。
虽然有英伟达H100甚至H200附加卡(基于Hopper架构)降低了性能,以适应经典服务器提供的典型功耗和散热预算,但英伟达从未宣布过任何采用基于Blackwell GPU的附加卡。
爆料显示,英伟达正在准备代号为B200A的产品,该产品基于单片B102处理器,使用台积电CoWoS-S封装技术连接四个HBM3E内存堆栈。这与双芯片B100/B200设计形成鲜明对比,后者使用台积电CoWoS-L封装在一起,然后连接到八个HBM3E内存堆栈。
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理。
推荐阅读: