随着ChatGPT和Sora等生成式人工智能(gen )应用席卷全球,对计算能力的需求正在飙升。半导体行业发现自己正接近一个新的S曲线——对于高管来说,一个迫切的问题是该行业是否能跟得上。
领导者们正在通过承诺大量的资本支出来扩大数据中心和半导体制造工厂(晶圆厂),同时探索芯片设计、材料和架构的创新,以满足不断发展的gen 驱动的商业格局的需求。
为了指导半导体行业领导者度过这一转型阶段,我们制定了几种gen 对B2B和B2C市场影响的情景。每个情景都涉及对计算和因此晶圆的巨大需求增长。这些情景聚焦于数据中心,同时承认智能手机等边缘设备的影响,但规模要小得多。
需求情景,来自麦肯锡的AI分析,是根据半导体行业可能提供的晶圆产量进行的,考虑到资本和设备等约束因素。即使更加雄心勃勃的情景也是有可能的,但是对数据中心所需的晶圆数量以及数据中心所需的能源供应的影响将使它们不太可能出现。
本文将讨论高性能组件的预计晶圆需求,包括逻辑、内存、数据存储芯片,以及为它们提供支持所需的晶圆厂的数量。拥有这些信息,行业利益相关者可以战略性地规划和分配资源,以满足不断增长的计算能力需求,确保未来几年其运营的可伸缩性和可持续性。
生成式人工智能计算需求的组成部分对于人工智能和生成式人工智能应用需求的激增伴随着与之成比例的计算需求增长至关重要。然而,对于半导体行业领导者来说,理解这种需求的起源以及生成式人工智能将如何应用是至关重要的。我们预计将会看到两种不同类型的生成式人工智能应用:B2C和B2B用例。在B2C和B2B市场上,对于生成式人工智能的需求可以分为两个主要阶段:训练和推断。训练通常需要大量的数据和计算资源。相比之下,推断通常对于每个用例的运行需要更低的计算资源。
为了使半导体行业领导者能够更好地应对这些市场的复杂性和需求,我们概述了B2B计算需求的六种用例原型及其相应的计算成本和同时生成的gen AI价值创造。
麦肯锡的分析估计,B2C应用将占大约70%的生成式人工智能计算需求,因为它们包括基本消费者互动(例如起草电子邮件)和高级用户互动(例如从文本创建可视化内容)的工作量。预计B2B用例将占大约30%的需求。这些包括业务的高级内容创建(例如,生成市场材料)、解决客户查询或生成标准财务报告等用例。
跨行业垂直领域和功能的B2B应用可分为六种用例原型:
编码和软件开发应用程序,解释和生成代码 创意内容生成应用程序,编写文档和通信(例如生成营销材料) 客户互动应用程序,涵盖自动化客户服务的外展、查询和数据收集(例如通过聊天机器人处理客户查询) 创新应用程序,为研发过程生成产品和材料(例如设计候选药物分子) 简化的摘要应用程序,使用结构化数据集总结和提取见解(例如生成标准财务报告) 复杂的摘要应用程序,使用非结构化或大型数据集总结和提取见解(例如在临床图像中合成MRI或CT扫描结果)
麦肯锡根据其价值创造和服务成本来定义这六个不同和复杂的B2B用例原型。通过定义服务成本和价值创造,决策者可以更熟练地了解B2B用例的具体情况,并在采用它们时做出明智的选择。在核心,服务成本的分析包括训练、微调和推断成本。该分析还包括超大规模的基础设施即服务(IaaS)边际成本,其中包括计算硬件、服务器组件、IT基础设施、能源消耗和估计的人才成本。通过诸如生产率改进和劳动力成本节约等指标,对生成式人工智能价值创造的评估。
生成式人工智能需求情景随着组织应对采用生成式人工智能的复杂性,这些原型的战略利用变得至关重要。gen AI采用的经济模型、算法效率以及组件和系统级别的持续硬件进步等因素进一步影响了gen AI的采用和技术进步。三种需求情景——基础、保守和加速——代表了对B2B和B2C应用的生成式人工智能需求可能的结果。基础情景是根据一系列必要假设进行的,例如持续的技术进步和快速采用,由能够覆盖gen AI训练和推断的资本和运营成本的商业模式支持。保守和加速采用情景代表了采用的上升和下降余地,分别。
麦肯锡的分析估计,到2030年,在基础情景下,生成式人工智能的总计算需求可能达到25x1030 FLOPs(浮点运算),其中大约70%来自B2C应用,30%来自B2B应用。
B2C计算需求情景B2C计算需求受到与gen AI互动的消费者数量、他们的互动水平以及其计算含义的影响。具体来说,B2C推断工作负载取决于每个用户的gen AI互动次数、gen AI用户的数量以及每个基本和高级用户互动的FLOP。训练工作负载取决于每年的训练次数、gen AI模型提供者的数量以及不同gen AI模型的每次训练运行的FLOP(例如2023年的最新模型,例如GPT-4,以及较小或较早的模型)。对于所有情景,公司能够开发可持续的商业模型至关重要。
对于所有情景,公司能够开发可持续的商业模型至关重要。
基础采用。到2030年,预期的每日智能手机用户的平均每天互动次数(每次互动是一系列提示)为基本消费者应用,例如起草电子邮件。另一个预期的平均数是高级消费者应用,例如创建更长的文本或综合复杂的输入文档。通过使用当前的在线和基于应用程序的搜索查询的数字,麦肯锡的分析估计互动次数约为预计的每日在线搜索查询次数的两倍(约280亿)2030年。支持基本B2C情景的基本假设是稳定的技术进步、有利的监管发展以及不断增长的用户接受程度。
保守采用。此情景可能涉及消费者对数据隐私、监管发展的持续关注以及技术仅有渐进性改进,导致基本情况的互动次数减少一半。
加速采用。此情景表明对技术的高度信任和广泛的用户接受度。此情景的驱动因素可能是具有吸引力的新商业模式、快速的技术进步或有利的监管。例如,颠覆性的硬件架构将大大降低服务成本。此外,对软件验证过程的改进可能会显着提高生成式人工智能解决方案的效率。诸如此类的因素可能会加速采用曲线,并导致2030年之前半导体行业中生成式人工智能实施的显着增长。
生成式人工智能B2B需求情景生成式人工智能用例在B2B部门的采用受到半导体芯片供应的充分性和成本的显著影响。企业必须能够合理化其对计算基础设施的投资,确保服务成本低于公司的支付意愿。对于这些B2B需求情景,麦肯锡的分析假设支付意愿对应于总价值创造的约20%。
在B2B用例的背景下,麦肯锡的分析表明,六种用例原型中只有五种对广泛采用是经济可行的。第六个原型,复杂摘要,预计由于与其成本相比的有限价值创造以及在分析复杂和非结构化数据输入方面消耗大量计算资源,不会被广泛采用。