边缘AI服务器引发新浪潮:从云端到边缘的转型

发布时间:2024-09-26  

近年来,在AIoT数据量快速成长、硬件效能提升、绿色低碳意识抬头等趋势影响下,边缘AI应用的系统架构也出现改变。随着越来越多企业将AI模型训练由云端转移至边缘端,边缘AI服务器(Edge AI Server)的市场需求快速扩大。


image.png


过往,企业大多会先在云端进行AI模型训练,再将训练好的模型部署到边缘端,由边缘装置进行模型推论,并定期将终端数据及预测结果传回云端。如今,随着硬件技术更新迭代,边缘装置的运算量能愈来愈强,可以满足AI模型训练的运算需求,再加上AIoT数据量快速成长,大幅增加数据由边缘端传输到云端的成本,致使企业开始思索「在边缘端进行AI模型训练的可行性」。对此,研华整合软硬体及服务打造完整的边缘AI服务器解决方案,协助企业资金更有效率地导入AI技术。


AI模型训练在云端还是边缘?


研华嵌入式物联网事业群产品经理郭祐伸建议,企业可以根据AI应用类型与AI模型参数大小、数据量、数据的机密等级等因素,决定是要在云端或边缘端进行AI模型训练。如果AI模型参数较大,边缘端的运算能力不足,导致进行AI模型微调训练所耗费的时间过长,就比较适合放在云端高速运算。另外,若企业用来训练AI模型的数据属于重要机密,便不适合上传到云端,又或者AI模型微调训练的数据太大致使传输至云端的成本过高,就可以通过边缘端设备进行AI数据预处理(Data Mining)或AI微调模型训练(Finetune)。


以生成式AI应用为例,企业除了发展客服机器人来服务客户,也开始结合知识管理系统、机台维修手册等数据用来优化员工作业效率,如:加快资料检索速度、协助新进工程师快速进入工作等。由于内部资料有机密性,通常不适合上传到云端,企业便可在边缘端部署边缘AI服务器来进行大型语言模型(LLM)微调训练。


另一方面,当企业微调训练生成式AI(GenAI)的大型语言模型(LLM)时,会消耗相当大量的內存(VRAM),若VRAM內存容量不足,将产生无法进行LLM模型微调训练的问题,最终需要再额外添购更多专用显示卡来扩充VRAM容量,对企业而言是高成本的负担。因此,如何降低不断成长的生成式AI模型参数所需的VRAM扩充成本并兼顾数据安全保密性便是生成式AI应用能否快速普及的关键。


硬件、软件、服务,三大面向打造整体解决方案


为满足企业在边缘端进行AI模型训练与推论的需求,研华除了研发AIR-500系列边缘AI服务器,提供高频高效能的硬件设备,更结合软件与服务,从三大面向打造一站式边缘AI应用解决方案,一次满足企业的各种需求,加速企业导入AI应用。


多种硬件规格,满足多产业的AI应用需求


AIR-500系列是针对边缘端高性能AI推理与特定大小参数AI模型微调训练的应用需求而设计,除了满足工控市场基本要求的系统EMC测试与安规认证,亦提供10年长供货保证。此外,针对AI高速运算时产生的热能,研华特别加强散热设计,确保在环境温度40℃以内稳定运作,避免超过AI加速卡的最高工作温度,同时提供适合应用在被动式散热AI加速卡专用的散热风扇模块,让企业无论采用哪一种AI加速卡,都不必担心会有过热而降频的问题,确保设备运作性能最大化。


郭佑伸产品经理指出,AIR-500系列产品提供510、520及530三种规格。其中AIR-520是研华首度将服务器等级芯片平台导入至边缘系统,它能额外扩充最多4张单槽显卡或2张双槽显卡,具备相当强大的AI运算能力,整合群联“aiDAPTIV+”技术,最高可以支持大型语言模型LLaMA2 70B的地端微调训练,满足企业在边缘端进行AI模型训练的需求。


群联独家专利的AI人工智慧运算方案“aiDAPTIV+”,是通过群联独创整合SSD的AI运算构架,将大型AI模型做结构性拆分,并将模型参数随应用时间序列与SSD协同运行,以达到在有限的GPU与VRAM资源下,最大化可执行的AI模型,能发挥既有硬件构架下的最大效益。


AIR-530可进行大量高速的数据传输,通过NVIDIA SmartNIC芯片可将网络频宽拉高至200 GbE,适合高速数据串流的AI应用,例如:医疗内视镜系统、布建多台监控摄像机的场域等。AIR-510提供丰富的I/O接口,适合需要整合多元装置的AI应用,例如半导体设备的光学检测机、物流业的包裹分检机等。


结合软件与服务,加速企业导入


AI应用软件方面,研华也针对AI应用需求代理相关软件,如:Intel针对模型训练的辅助工具Intel Geti、NVIDIA针对AI算法开发的最佳化服务NVIDIA AI Enterprise,可协助企业打造完整的Edge AI应用环境。


服务方面更是涵盖全方面。首先,研华在全球各地设立的服务中心,可以根据在地客户需求提供服务,如弹性调整设备规格。其次,研华提供完整技术支持,如企业可向研华购买CPU、DRAM、SSD、显卡等周边元件,也可以由研华协助安装Window、Ubuntu等操作系统,让企业收到设备后插电就能使用。再者,研华一直与芯片商紧密合作,可以在第一线提供客户技术顾问服务,如今更成为台湾IPC产业第一家获得NVIDIA AI Enterprise软件平台认证的全球经销商,研华计划培育近200名边缘AI应用专家,期能建立更强大的技术支持,从更多方面协助客户导入AI应用。


展望未来,AIR-500系列产品的发展将依循研华“产业驱动”(Sector-Driven)策略,依照各产业的特殊需求开发相关功能并直接内嵌于产品之中,甚至推出产业专用机,让各行各业都能快速部署AI应用,大步迈向AIoT的新时代。


相关产品现已上市,如需了解更多产品和服务相关信息,欢迎拨打研华嵌入式服务专线400-001-9088。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>