首页
生成式AI大规模商用前提：提效率、降成本、降功耗……

生成式AI大规模商用前提：提效率、降成本、降功耗……

发布时间:2023-08-03

生成式人工智能(AI)的大规模落地取决于提高处理效率和降低总拥有成本。与互联网及其万维网应用程序的发明类似，生成式人工智能已经抓住了公众的想象力。ChatGPT技术一经发布就受到了各界的广泛关注，它是迄今为止用户增长最快的应用程序，仅在问世的前两个月内，注册用户数就突破了1亿人。

生成式AI正取得所有行业的关注，并有望释放出无与伦比的生产力浪潮。具体来看，生成式AI的市场潜力巨大，它可助力多个领域的发展，比如，辅助药物研发，提高医生诊断准确率，提高订单预测准确率，以及帮助程序员编写高质量软件代码。预计每年将能为全球经济增加4万亿美元以上的价值。

生成式AI大语言模型面临的硬件挑战

与大多数应用程序不同，虽然ChatGPT软件正在步入正轨，但是支持运行该应用程序的硬件却并非如此。

生成式AI大语言模型所面临的硬件挑战来源于——算法使用了大量的参数来生成结果。例如，ChatGPT的前一代模型GPT-3.5需要1,750亿个参数，虽然官方暂未公布GPT-4版的参数量，但是机构预估其参数量约有1.7万亿个。对此，支持生成式AI大语言模型的AI硬件加速器必须扩展到能够处理1,750亿到近2万亿个参数的标准，才能满足每个用户的查询操作。

在当前的计算架构上，处理器核心和存储器之间的大量数据流，通常在计算核心外部来进行处理。这种设置会导致内存瓶颈的出现，通常它也被称为“内存墙”，会带来严重的带宽限制。

以上因素不仅排除了CPU计算架构，而且还排除了GPU等其他AI计算架构。以GPT-4为例，其中高端的GPU约有97%的时间处于空闲状态，这相当于大约只有3%的效率。在这样的低效率下，一个标称计算能力为1 PetaOPS(每秒一千兆/一千万亿次运算)的处理器，只能产生大约30 teraOPS(每秒一兆/一万亿次运算)的处理速度。

如今，这些算法在高性能计算集群上执行，每个集群需要消耗大量的能源。随之而来的问题是，执行ChatGPT-4用户查询所需的功耗已经超出极限，这导致发电厂超载和能源分配网络压力过大。

ChatGPT的运行成本极其高昂

ChatGPT的功耗并非阻碍其商用落地的全部因素。ChatGPT技术的快速推出，进一步拉高了其配套硬件的投资成本。ChatGPT需要大量的计算资源和能源，它需要高端的硬件设备来支持运行，而高端设备的采购成本非常高昂，给企业和组织带来了巨大的财务压力。根据目前市场上先进处理器的采购选择，支持每秒运行10万次查询的GPT-4处理系统的采购成本高达数千亿美元，而运行该系统的能源年成本将在数亿美元左右。

显然，高昂的成本是大规模部署ChatGPT创新技术的障碍。

生成式AI大规模落地需满足三大要求

不过，这也为半导体行业的发展提供了机遇，通过提供支持性的硬件，可推动生成式AI大语言模型的发展。这需要一个可行的解决方案来解决可用基础设施架构不足的问题：

将处理效率从2%至4%提高到至少50%。标称计算能力为1 PetaOPS的AI处理器，必须在现实工作负载下提供至少500 TeraOPS的处理速度。
降低硬件成本。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的成本不得超过1万美元。
更低的功耗。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的功耗必须不超过100W。

总体而言，为了实现经济可持续性和节能，ChatGPT处理系统的成本效益必须提高两个数量级以上。只有把GPT-4系统上每秒运行10万次查询的年总成本从数千亿美元降低到100亿美元以下，才能实现生成式AI的承诺。

本文翻译自国际电子商情姊妹平台EETimes Europa，原文标题：

文章来源于:国际电子商情原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

顺丰科技、科捷智能等企业专注智慧物流行业(2022-12-12)

步来说，由于成套的物流系统对生产效率的优化、成本的节约效果更好，我们认为未来智能物流装备系统将会日渐成为主流。智能制造是以智能物流作为前提和基础的，将生产或产线嵌入到智能中，从而实现“制造......

赛美特完成5.4亿元融资，打造国产全自动制造软件解决方案(2022-06-29)

客户实现高效高质的生产；重点研发的RTD、YMS、APC、FDC系统也已运用在生产现场，进行验证。打造一套完整的智能制造系统解决方案是产品设计、系统开发、行业经验等综合集成的结果，而创造优秀产品的基础是......

SugarTalk004期：2019国际智能制造生态链峰会(2022-12-29)

％。在今天由SugarTalk主办的2019国际智能制造生态链峰会上，我们站在底层产业链的角度，详细分析了智能制造的底层技术与业内知名企业如何拥抱智能制造。TechSugar创始......

智能制造定义演变史：工业4.0、IIoT、元宇宙、AI……(2024-06-24)

更具体的构成。德国软件制造商SAP公司列举了智能制造的基础技术，包括IoT/IIoT、AI/机器学习、大数据、自主机器人、增材制造/混合制造、云计算、5G连接、边缘计算、模拟仿真/数字孪生、design......

碳化硅智造升级浪潮信息存储筑基广东天域MES核心数据底座(2024-05-06)

智造"转型的故事正在各个领域上演。天域作为拥有国际顶尖碳化硅外延设备的厂商，在碳化硅半导体器件生产工序中通过MES（制造执行系统）覆盖整个智能制造的生产过程，实现各环节合理调配，提高生产效率。浪潮......

碳化硅智造升级浪潮信息存储筑基广东天域MES核心数据底座(2024-05-07 08:40)

的故事正在各个领域上演。天域作为拥有国际顶尖碳化硅外延设备的厂商，在碳化硅半导体器件生产工序中通过MES（制造执行系统）覆盖整个智能制造的生产过程，实现各环节合理调配，提高生产效率。浪潮信息存储：为智能制造筑基数据存储底座说起智能制造......

英飞凌助力合肥通富微电智造升级，谋求“中国共赢”(2017-06-08)

，将物联网技术用于智能卡后道智能制造的纵向集成，通过有线以太网、无线网络、传感器或设备自身标准接口等物联网技术收集生产过程数据、设备状态数据和报警信息，实现可视化管理并与MES的系......

大联大品佳集团推出基于MediaTek产品的图像识别方案(2023-04-06)

物流服务(LaaS, Logistics as a Service)模式，协助客户共同面对智能制造的挑战。大联大从善念出发、以科技建立信任，期望与产业「拉邦结派」共建大竞合之生态系，并以「专注......

数字孪生新用法，做AI的加速器—访跨维（深圳）智能数字科技有限公司创始人贾奎(2023-11-28 10:06)

中的应用当中。这项研究放眼当时的整个国际学术圈，都是较为领先的存在。在AI技术助力3D视觉的众多分支应用中，经过综合考量，赋能机械臂完成相关柔性操作感知是可落地性与商业变现周期较短的。而且工业智能制造的......

AI的下一波浪潮是“物理AI”，英伟达宣告全新机器人时代正在到来(2024-06-03)

，JLR车队也将投入生产。未来英伟达将向全世界提供整个汽车智能制造的先进堆栈。在仿人机器人方面，英伟达正在积极开发基础模型，帮助其具备更好的世界理解能力。通过大量的数据训练，未来......

平台入驻

我们与500+贴片厂合作，完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页，多渠道推广，SEM/SEO精准营销以及与公众号的联合推广...详细>>

原厂代理商合作

利用葫芦芯平台的卓越技术服务和新产品推广能力，原厂代理能轻松打入消费物联网（IOT）、信息与通信（ICT）、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

闲置物料合作

充分利用其强大的电子元器件采购流量，创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术，不仅可以助你轻松识别与连接到需求方，更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

生态合作

我们的目标很明确：构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前，我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

加工与定制类服务商合作

我们深知加工与定制类服务商的价值和重要性，因此，我们倾力为您提供最顶尖的营销资源。在我们的平台上，您可以直接接触到100万的研发工程师和采购工程师，以及10万的活跃客户群体...详细>>

线上代理合作

凭借我们强大的专业流量和尖端的互联网数字营销技术，我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品，都可以通过我们的平台迅速传达给目标客户...详细>>

邮件营销及广告服务

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环，从引流、宣传到最终销售，全程跟进，确保每一个potential lead都得到妥善处理，从而大幅提高转化率。不仅如此...详细>>