据《纽约客》报道,荷兰国家银行数据专家Alex de Vries估计,OpenAI旗下聊天机器人ChatGPT每天消耗超过50万千瓦时的电力,用于处理约2亿个用户请求,相当于美国家庭每天用电量的1.7万多倍。
而马斯克在接受媒体采访时预言,AI行业经历将在明年迎来电力短缺,届时将“没有足够的电力来运行所有的芯片”。
根据美国Uptime Institute的预测,到2025年,人工智能业务在全球数据中心用电量中的占比将从2%猛增到10%。
更新处理器设计可以极大降低能耗
在典型的服务器机架中,仅计算芯片就可以消耗超过 50% 的电力预算。
Arm首席执行官Rene Haas日前发表署名文章,表示当今的数据中心已经消耗了大量的电力——全球每年需要 460 太瓦时 (TWh) 电力进行支持,这个数字等同于整个德国的用电量。而 AI 的兴起预计将在 2030 年把该数字提高三倍,意味着将超过印度这一世界上人口最多国家的总耗电量。
未来的 AI 模型将持续变得更大、更智能,在带动对更多计算能力的需求的同时,对电力的需求也会增加,从而成为良性循环的一部分。而找到降低这些大型数据中心电力需求的方法对于实现社会性突破和兑现 AI 的承诺至关重要。
Rene表示,选择基于Arm架构的计算,可以节省更多的能耗。
比如:
基于 Arm 架构的 AWS Graviton:与其他同行业产品相比,Amazon Sagemaker 的 AI 推理性能提高了 25%,Web 应用程序提高了 30%,数据库提高了 40%,效率则提升了 60%。
基于 Arm 架构的 Google Cloud Axion:与传统架构相比,其性能和能效分别提高了 50% 和 60%,可为基于 CPU 的 AI 推理和训练、YouTube、Google 地球等服务提供支持。
基于 Arm 架构的 Microsoft Azure Cobalt:性能高出同类产品 40%,并为 Microsoft Teams 等服务提供支持,与 Maia 加速器的耦合驱动 Azure 的端到端 AI 架构。
Oracle Cloud 采用基于 Arm 架构的 Ampere Altra Max:与传统同类产品相比,每机架服务器的性能提高 2.5 倍,能耗降低 2.8 倍,并用于生成式 AI 推理模型,诸如摘要、大语言模型训练的数据的标记化,以及批量推理用例。
垂直供电成为香饽饽
随着技术的飞速发展,高性能处理器、人工智能、数据中心等领域对电源技术的需求日益增加。目前热设计功率已接近 >1000 W。由于人工智能服务器所需的能源是传统服务器的 3倍,并且由于数据中心已经消耗了全球能源供应的 2% 以上,因此必须要重视电源的效率。而48V与垂直供电则是电源发展的新机遇。
垂直供电(Vertical Power Delivery,VPD)是一种供电技术,特别针对高性能处理器而设计。它通过将PoL模块直接部署在处理器下方,从而降低PDN(Power Distribution Network)电阻,以满足处理器对低压大电流的需求。另外,采用垂直供电还可以为为高速I/O和存储器开放上层PCB的电路板。
水平与垂直供电示意图
而母线电压48V同样是为了减少损耗,由于P=VI,意味着传输相同功率,电压越高,电流越小,从而减少在线路中的损耗。
由于垂直供电对于尺寸要求更为严苛,因此采用模块化是更好的选择,几家IT基础设施芯片供应商也是这么做的。
如图所示,相比于分立方案,模块化方案在中高负载时不止尺寸紧凑,效率也更高。
Vicor是垂直供电领域的先锋,其垂直供电方案结合了FPA(PRM+VTM)架构、ZVS和ZCS控制系统、高频SAC电流倍增器拓扑与SM-Chip封装技术。Vicor的PRM稳压器采用零电压开关(ZVS)升降压拓扑实施,在输入输出压差较小的情况下可以实现高效率。VTM采用了专有的数兆赫兹ZCS/ZVS正弦幅度转换器(SAC™)拓扑,可将输入电压高效地转换为分比式电压。Vicor的封装技术将所有无源器件、磁性器件、MOSFET和控制器集成到一个模块中,同时保持良好的冷却功能和频率技术。Vicor的方案能够带来超过10%的效率提升,特别适用于大电流情况下的高性能处理器供电。
MPS是最近较新的数据中心电源供应商,也针对数据中心应用提供了垂直供电解决方案,其采用的是两级解决方案。第一级解决方案:MPS LLC 电源模块输入输出比 10:1,第二级解决方案采用数字多相控制器+低压 Intelli-Phase 或Intelli-Module ,其中Intelli-Phase 系列提供额定值高达 90A 的连续电流,Intelli-Module 解决方案提供额定值高达 170A 的连续电流。虽然MPS的方案属于传统电源方案,但凭借在控制方式、开关管和封装等方面的优势,其效率和尺寸控制得较好,能够满足垂直供电的需求。
作为传统电源公司,英飞凌日前推出了OptiMOS双相电源模块TDM2254xD系列,进入垂直供电市场。双相电源模块在单个基板上集成了两个 OptiMOS 6 功率级以及电感器和电容器。与同等分立解决方案相比,这种集成度使得多相降压稳压器的两相部署面积减少了 40%。 英飞凌的双相模块采用专有的顶部电感设计,可提高热性能和电气性能。
该产品具有如下优势:
行业领先的功率密度:10x9x8 mm 或 10x9x5 mm,峰值电流为 160 A
实现垂直电力传输,减少 PDN 损耗并提高功率密度
满负载时效率比竞争对手高 2%
与竞争对手相比,满载时散热温度低 5°C
一流的总拥有成本
TDM22544D是一款功能强大的电源模块,其核心在于其包含了一个改进的高速MOSFET驱动器。这款驱动器经过精心设计,能够在高达2 MHz的频率下,有效驱动共同封装的高侧和低侧OptiMOS MOSFET。这样的设计极大地提高了电源模块的效率和响应速度,使其在处理高频率和高强度的电源需求时表现出色。
在电流检测方面,TDM22544D摒弃了传统的DCR传感和Rdson传感方法,转而采用先进的电流镜感应功能。这一创新解决了传统方法中电流检测对电感器温度变化的敏感性,以及高侧MOSFET实施RDSon电流感应的困难。通过高侧和低侧电流MOSFET镜像在感应MOSFET上,TDM22544D实现了真实且准确的电流感应,无需额外的温度补偿电路。这种设计确保了系统能够实时监控实际输出电流,对负载阶跃或过流故障等关键事件做出迅速反应。
此外,TDM22544D还具备出色的温度监控功能。它能够以8 mV/°C的增益报告准确的温度,有助于系统实现主动的实时温度监控。通过连接多个功率级的温度输出,它可以向英飞凌的数字PWM控制器报告最高温度,从而确保系统在各种工作条件下都能保持稳定的性能。
在控制方面,TDM22544D的PWM输入与行业标准3.3V三态PWM输入兼容,使其能够方便地集成到各种系统中。通过响应控制器发送的PWM三态信号,它可以启用车身制动模式,快速禁用功率级中的两个MOSFET,以增强瞬态性能或提供高阻抗输出。此外,它还支持二极管仿真模式,通过防止负电感电流引起的传导损耗来提高轻负载效率。
在节能方面,TDM22544D引入了深度睡眠省电模式。当模块处于深度睡眠模式时,驱动程序会禁用大部分功能电路,从而显著降低功耗。这一功能使得TDM22544D在不需要满功率运行时能够节省大量能源。
最后,TDM22544D还具备全方位的保护功能。这包括VCC/VDRV欠压锁定(UVLO)、针对内部过热情况的热保护关断、短路高侧MOSFET的相故障检测以及由于过载情况或饱和输出电感器而产生的逐周期过流保护。这些保护措施确保了TDM22544D在各种极端工作条件下都能保持稳定可靠的运行。
英飞凌已经与众多IT相关企业在绿色计算领域开展合作,并实现了良好的节能效果。比如Supermicro MicroBlade 服务器包含 28 个数字多相控制器、112 个功率级和 28 个负载点控制器。 在一个用例中,Supermicto MicroBlade 服务器的最终客户节省了 56% 的数据中心空间利用率、45% 的资本支出和 1300 万美元/年的电力费用。 帮助客户数据中心的电力使用效率 (PUE) 增加至 1.061,理想的 PUE 值为 1.0,这意味着数据中心所需的所有电力都在实际计算设备中,而不是冷却或电力转换等间接成本。
实际上,除了传统硅之外,包括氮化镓和SiC同样都是提高数据中心效率的手段,不过这并不是本文所重点关注的。