端侧AI应用“芯”机遇:NPU加速终端算力升级

发布时间:2024-11-08 17:33  

随着人工智能技术的飞速发展,端侧AI正逐渐崭露头角,成为智能硬件领域的重要驱动力。AI大模型不再仅仅束之于云端,而是开始渗透至各类终端设备,甚至包括智能手机、PC和汽车等常见产品。在E维智库第12届中国硬科技产业链创新趋势峰会上,安谋科技的产品总监鲍敏祺在其演讲的《端侧AI应用“芯”机遇,NPU加速终端算力升级》中,分享了AI端侧应用的创新机遇及其背后的技术挑战,特别是NPU(神经网络处理单元)如何助力终端算力的升级,推动AI大模型走向边缘计算。


安谋科技产品总监鲍敏祺

AI端侧应用的崛起

传统上,强大的AI计算能力主要集中在云端服务器中,通过庞大的计算资源和数据中心支撑各种AI应用。然而,随着计算需求的日益增长,AI技术正逐步向端侧迁移。鲍敏祺指出,端侧AI的主要优势在于时效性和数据安全性。与云端计算相比,端侧计算能够实时处理用户数据,避免了因数据传输而带来的延迟和隐私风险。例如,未来的智能手机不仅能够通过AI实时分析照片,还能够帮助用户快速整理长文本信息,甚至在图片库中根据内容进行智能搜索。

AI端侧的这一转变对算力提出了更高要求。尽管云端计算拥有强大的处理能力,但端侧设备由于硬件和带宽的限制,算力的提升必须在能效和成本之间找到平衡。鲍敏祺分享了高通的骁龙X Elite芯片的成功案例,说明了在提升AI算力的同时,如何保证功耗控制和计算效率。

NPU:端侧AI的核心加速器

在NPU的支持下,AI大模型可以在端侧设备中得到更好的应用和落地。鲍敏祺在演讲中详细介绍了安谋科技的“周易”NPU,其通过针对不同AI模型的硬件加速优化,显著提高了计算性能与能效比。NPU是专门为神经网络计算设计的处理单元,与传统的通用CPU和GPU相比,具有更高的计算效率和更低的功耗。

在端侧,AI模型的大小和计算量往往受限于设备的内存带宽和处理能力。以语言模型为例,鲍敏祺表示,在目前的端侧环境下,10至30亿参数的模型是较为普遍的,而7B模型则处于较为苛刻的边缘计算环境中。通过对NPU架构的优化,尤其是在图像、视频和音频输入等多模态数据的处理上,“周易”NPU能够有效提升计算效率,帮助设备实现实时处理和智能决策。

多模态AI:拓展端侧AI应用场景

鲍敏祺还提到,AI端侧不仅限于语言模型的应用。未来,AI将进一步拓展到多模态场景中,图像、音频、视频等不同类型的数据将被融合并进行智能分析。通过NPU的加速,端侧设备能够实现更加灵活和智能的交互方式。例如,智能汽车中的AI系统能够通过视频流分析驾驶员的行为和车内环境,实时优化车载系统的运行;可穿戴设备也能够在多模态数据的支持下,提供更加精准的健康监测和智能反馈。

这种多模态的应用将推动AI技术在各类终端产品中的深入应用,从传统的手机、PC到智能家居、智能汽车等设备,都将成为AI技术的“新大陆”。NPU作为硬件加速的核心组件,其在多模态数据处理上的优势,将使得AI体验更加丰富和个性化。

面临的挑战与未来展望

尽管端侧AI应用充满潜力,但在实现普及之前,仍然面临一些挑战。鲍敏祺指出,成本、功耗和生态系统的建设是目前AI端侧发展面临的主要难题。存储介质的带宽和功耗限制,使得AI计算在终端设备中难以像云端一样扩展和处理庞大的数据集。此外,AI模型的不断进化和迭代也需要更加成熟的软件和工具支持。

为应对这些挑战,安谋科技通过“周易”NPU的架构创新,不仅提升了计算能力,还优化了数据本地化和低精度计算,减少了数据搬运带来的功耗。特别是对于智能汽车、智能家居等领域,NPU的高能效和低延迟表现,使得端侧AI能够在有限的硬件资源下,提供出色的性能。

未来,随着硬件技术的不断进步和AI应用场景的不断拓展,NPU将成为端侧AI计算的核心加速器。鲍敏祺展望,端侧AI将不再仅仅局限于计算能力的提升,还将通过智能算法的不断优化,推动AI体验的个性化和智能化,为各类终端设备赋能,真正实现“AI为终端赋能”的愿景。

文章来源于:ECCN    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    AI引擎再次进化,凭借50TOPS(每秒50万亿次运算)的最强算力高居当今世界第一。 作为AI PC的先行者,AMD是如何做到这一点的?NPU和AI PC未来怎么玩?如何面对Intel......
    ),NPU AI算力一举提升了60%,达到约16TOPS,整体算力也提升至39TOPS。 现在,Strix Point终于登场了,官方命名为“锐龙AI 300系列”,架构焕然一新,性能......
    “周易”X2 NPU:属于中国的科技与浪漫;日前,召开新品发布会,正式宣布推出自研新一代人工智能处理器“周易”X2 。作为自研IP的又一力作,“周易”X2 不仅在算力、精度、灵活......
    AI引擎再次进化,凭借50TOPS(每秒50万亿次运算)的最强算力高居当今世界第一。作为AI PC的先行者,AMD是如何做到这一点的?NPU和AI PC未来怎么玩?如何面对Intel以及......
    科技执行董事长兼首席执行官吴雄昂发表了题为《核芯动力XPU: 定义全新的融合计算架构》的主题演讲。在演讲中,吴雄昂深入介绍了安谋科技双轮驱动战略和核芯动力新业务,以及在研发人员投入、核心技术研发、开源NPU ISA生态建设和面向自动驾驶等应用的超大算力......
    端侧AI应用“芯”机遇:NPU加速终端算力升级;随着人工智能技术的飞速发展,端侧AI正逐渐崭露头角,成为智能硬件领域的重要驱动力。AI大模型不再仅仅束之于云端,而是开始渗透至各类终端设备,甚至......
    芯片搭载安谋科技(中国)有限公司(以下简称“安谋科技”)自研“周易”NPU及Arm IP,在高性能算力、AI性能方面具有诸多创新,可支持丰富的智能驾驶功能开发,满足了车规级硬件对高性能、高可......
    题的第二届玄铁RISC-V生态大会于03月14日在深圳举行,爱芯元智联合创始人、副总裁刘建伟受邀发表主题演讲,向与会嘉宾分享了爱芯通元混合精度NPU这一面向边端侧算力布局的AI处理器,以及基于RISC-V生态所进行的AI......
    化和优化的需求日益增长,AI PC 变得越发重要。 重要意义:Lunar Lake 预计将成为突破性的 AI PC 移动处理器, AI 性能比前一代产品高出 3 倍。凭借 NPU 超过 40 TOPS 的算力......
    的Xclipes 920,是基于RDNA2的架构,但性能也不是特别强。NPU方面则是23TOPS的算力。现代的电动车和高端品牌Genesis确定在下一代车型上使用,奥迪和保时捷也有可能使用。 第四......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>