首页
未来无所不在的AI架构导向边缘和云端逐步走向统一与可扩展

未来无所不在的AI架构导向边缘和云端逐步走向统一与可扩展

发布时间:2022-12-19

AI/ML训练开发出供推论使用的模型，用于识别任何需要辨识的对象。这些对象可以是智能城市街道上顺畅或拥挤的交通、用于实现安全访问控制的身份证件和人脸比对的许可级别、向客服中心拨打电话的对话内容，抑或是邮政分发中心中信封上的手写地址。

训练通常在企业数据中心或进行，这些环境中有众多高效能服务器、充裕的内存、硬件加速器和高速网络可以投入工作负载。在这种环境下，需快速完成工作的训练使用大量供给运算、网络链接和冷却的电力。尽管推论工作负载也能在数据中心或执行，但由于多种原因，越来越多推论任务正迁移至。

首先是延迟问题。将原始数据发送到或数据中心耗用时间，因此需要更长的时间来执行推论，而且将想要的答案或决策发送至的时间也会增加。以工厂自动化、雷达、电子作战等实时任务来说，费时过长的决策会导致高昂成本。

将推论工作负载迁移到还有另外两个原因：运算力和电力。随着AI/ML推论工作负载迁移到大量的边缘装置，这些边缘装置中的数百万个推论引擎总运算力将超越数据中心服务器的运算力。另外，边缘推论引擎并不会消耗大量电力。

为解决边缘推论的独特需求，采用全新运算架构的芯片将于近期问世。制造商强调，他们的组件能以更低的功耗达到颇高的TFLOPS和TOPS运算次数。尽管推论工作负载需要充裕的TFLOPS和TOPS是不争的事实，但这些专用边缘推论芯片基于单向架构理念，一旦考虑互相结合训练与推论工作负载，即有可能证明这种架构不堪使用。

当前，AI/ML模型训练工作负载主要在数据中心内的高功耗CPU和GPU上执行，它们在此消耗大量电力，同时利用先进的冷却技术来执行训练AI/ML模型所需的数万亿次运算。这种训练几乎普遍采用具备高动态范围的浮点信息格式，透过允许对模型权重进行微小的增量调整来实现最高模型精度。浮点运算耗电更多，因而需要额外的冷却。此外，CPU和GPU在内存和其内部运算单元之间迁移大型训练数据集时也会消耗大量电力。

如果要使用全精度浮点信息格式完成全部运算，大多数边缘推论芯片难以负担如此的硅或功耗。很多公司为了获得高峰值TFLOPS和TOPS指标而做出妥协，通常的做法是以精度略低的数据类型代表AI/ML权重、启动和资料。边缘AI/ML芯片的厂商会提供相关软件工具，以降低受训模型权重的精度，从而将模型转换为较小数值格式，例如FP8、缩放整数，或者甚至是二进制数据格式。这些较小的数据格式可为推论工作负载带来优势，但也会损失一定程度的模型精度。用降低的精度重新训练AI/ML模型通常可以恢复些许精度。

现在试想一下，有一种可扩展的装置架构，既可以部署在小型嵌入式边缘装置中，也可以部署在能够聚集数据中心内执行的工作负载的大型装置中。这些优化措施除帮助改善边缘功耗和成本效率，也能令数据中心的运算更密集、更具成本效益，以便降低用于推论和训练的设备资本与营运支出。

而支持全精度浮点格式和降精度浮点格式的AI/ML加速器可扩展架构，打破训练与推论之间的人工界线，为统一架构部署相同标准和熟悉的软件工具。这类高效率的边缘AI加速器采用数据流和芯片广播网络等架构创新，允许从外部内存获取的数据传输到芯片后多次重复使用。

在一些实际的应用案例中，导向机器学习的统一可扩展数据流架构，打破训练与推论不同阶段之间的壁垒。以联邦学习（Federated Learning）为例，它解锁全新类型的AI/ML工作负载。对于众多连结应用而言，联邦学习可以取代透过一次性脱机训练推导出的降精度AI/ML推论模型单向方法，并获得由于欠缺代表的集中式脱机训练集而难以实现的效能。

联邦学习利用边缘推论的重要特色，即装置带来远超于原始模型训练集，在众多范围暴露的不同输入（inputs）。如设计得当，边缘装置能从额外输入中学习，并在装置部署过程中进一步提升其模型精度。可能会有数百、数千乃至数百万个边缘装置共同改善相同的AI/ML模型，以提供更优质的本地回复或决策。

以同一家厂商制造并遍布在世界各地医院中的CT或MRI扫描仪为例。这些影像装置的任务通常是发现癌症肿瘤或其他疾病，并且能愈加采用AI/ML模型帮助放射科医生辨别可疑组织。随着每台现场装置不断改进其模型，如果利用联邦学习更新及改进原始模型，可让用于打造新影像装置的原始训练模型受益于相同的改良。

进行更新时，应确保只共享来自新增边缘训练的洞察，而非个人隐私数据，以利所有现场装置都能在不侵犯隐私的情况下从这种额外训练中获益。联邦学习在隐私保护装置个人化方面具有广泛适用性，因其可以针对特定用户客制化视觉算法和语音算法效能。此外，也有网络安全应用，透过网络入口节点的协作学习即可发现主动安全规则，而无需共享敏感的专用网络流量。

统一的云端和边缘运算架构优势在于利用相同的软件二进制，就能将模型依逻辑划分为执行于云端和边缘。统一架构可确保使用兼容的数据格式，以及确保优化数据格式如稀疏性表示（sparsity representations）不会在云端和边缘之间中断。可扩展的统一架构与贯穿于所部署应用生命周期的持续学习，与现时的常规训练与推论做法不同，因为后者依赖数据中心的CPU和GPU与边缘专用装置。然而，随着AI/ML逐步普及，如果业界希望大幅提升效能、精度和能源效率，这种统一方式应为最合乎逻辑的途径。

（本文作者为AMD资深副总裁Ivo Bolsens）

本文引用地址：

文章来源于:电子产品世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

华为云CTO张宇昕：系统性创新及服务重塑，打造AI Native的云(2024-06-21)

张宇昕一方面是“Cloud for AI”。即通过全栈系统性创新，能够让大模型的数据准备、训练、推理、应用实现全流程的高效率和高性能。华为云全栈系统性创新覆盖了数据中心、云平台架构和基础设施服务，为......

华为云CTO张宇昕：系统性创新及服务重塑，打造AI Native的云(2024-06-22)

实现全流程的高效率和高性能。华为云全栈系统性创新覆盖了数据中心、云平台架构和基础设施服务，为AI开发提供AI Native的基础设施。当前云平台在大模型的训练和使用中通常存在“算力墙”“内存墙”“能效墙”等问......

BEV重构全系产品，智驾科技MAXIEYE开城进行时(2023-11-30)

+Transformer底层技术重构刷新产品体验，感知和数据核心能力成为高阶自动驾驶入场券。智驾科技MAXIEYE发布BEV平台架构青云Hyperspace，诠释BEV新范式三大内涵智驾......

BEV重构全系产品，智驾科技MAXIEYE开城进行时(2023-12-01 10:34)

技术重构刷新产品体验，感知和数据核心能力成为高阶自动驾驶入场券。智驾科技MAXIEYE发布BEV平台架构青云Hyperspace，诠释BEV新范式三大内涵智驾科技MAXIEYE深耕......

元脑服务器第八代新品重磅发布！创新开放架构引领算力生态多元共进(2024-10-28 09:06)

型AI推理场景中，整机性能较上代最大提升3倍。元脑服务器第八代算力平台拥有23款新品，基于先进的计算、存储架构创新，在CPU总线互联带宽、内存带宽及容量上全面优化，单机核心数最多到576C，主频......

浪潮信息刘军：智算力系统创新加速生成式AI产业发展(2023-12-06)

要针对多元算力，以统一的系统架构和统一的接口规范来兼容各类AI加速卡，保障芯片算力的高效释放。浪潮信息早在2018年就着力开放多元的AI算力平台设计，最新发布的G7多元算力平台是业界唯一可以同时兼容SXM......

浪潮信息刘军：智算力系统创新加速生成式AI产业发展(2023-12-07 09:54)

互联、16卡全互联和混合立方互联系统拓扑的AI算力平台。为了保障更大规模的节点扩展性能，浪潮信息研制的开放加速计算架构支持PCIe、RocE和多种私有互联协议，节点内和跨节点卡间互联最大达到896 GB......

多元融合浪潮G7系列超融合一体机全新发布(2023-02-07 09:58)

双擎驱动一体化底座整合了更多的生态解决方案。同时，丰富的硬件平台架构类型，软硬协同优化带来的性能提升，以及丰富的生态产品方案等特性，使得浪潮信息G7系列超融合一体机让云真正成为高效的数字化生产力，赋能数字化转型及业务创新。异构......

浪潮信息公布设计指南，以开放规范促进生成式AI多元算力发展(2023-09-22)

Architectures，DSAs）的概念，即随着通用算力技术的演进逐渐减缓，针对特定问题或领域定制计算架构变得愈发重要。基于DSAs思想设计的AI计算芯片，在特定人工智能工作负载下展现出超越通用芯片的处理能力......

浪潮信息公布设计指南，以开放规范促进生成式AI多元算力发展(2023-09-22 15:04)

平台入驻

我们与500+贴片厂合作，完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页，多渠道推广，SEM/SEO精准营销以及与公众号的联合推广...详细>>

原厂代理商合作

利用葫芦芯平台的卓越技术服务和新产品推广能力，原厂代理能轻松打入消费物联网（IOT）、信息与通信（ICT）、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

闲置物料合作

充分利用其强大的电子元器件采购流量，创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术，不仅可以助你轻松识别与连接到需求方，更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

生态合作

我们的目标很明确：构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前，我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

加工与定制类服务商合作

我们深知加工与定制类服务商的价值和重要性，因此，我们倾力为您提供最顶尖的营销资源。在我们的平台上，您可以直接接触到100万的研发工程师和采购工程师，以及10万的活跃客户群体...详细>>

线上代理合作

凭借我们强大的专业流量和尖端的互联网数字营销技术，我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品，都可以通过我们的平台迅速传达给目标客户...详细>>

邮件营销及广告服务

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环，从引流、宣传到最终销售，全程跟进，确保每一个potential lead都得到妥善处理，从而大幅提高转化率。不仅如此...详细>>

未来无所不在的AI架构导向边缘和云端 逐步走向统一与可扩展

未来无所不在的AI架构导向边缘和云端逐步走向统一与可扩展