AIGC手机处理器与传统AP挥手告别

发布时间:2023-12-14  

近年来,随着大模型技术的迅猛发展,手机厂商纷纷亮相大模型应用,成为手机发布会上的焦点。从OPPO的语音助手升级到vivo的官方宣布自研手机大模型,再到小米将大模型直接整合到手机系统中,各厂商的竞争可谓激烈异常。这一切的背后,是智能终端已然成为各类GC( Generated Content)应用的新战场。

本文引用地址:

首先,大模型的应用范围不断扩展,从图像生成到文本生成,各类应用层出不穷。国内厂商推出的文心一言、智谱清言P,以及国外的OpenAI移动版ChatGPT、Llama 2手机版等,都是大模型在手机上的典型应用。这使得智能终端逐渐成为大模型应用的新滩头。

智能终端芯片拼什么

算力

image.png

在将大模型引入手机时,算力是首当其冲的问题。高通在其《混合AI是AI的未来》白皮书中谈到:“面对每日超过 100 亿次的搜索量且移动端搜索占比超过 60%的情况,生成式 AI 的应用将推动所需算力的实质性增长,尤其是来自智能手机端的搜索请求。由于基于生成式 AI 的查询能够提供更令人满意的答案,用户的搜索方式已经开始发生转变。”高通的第三代骁龙8移动平台通过强调硬件加速器,如Hexagon NPU,实现在手机上运行100亿参数大模型。此外,它还改进了传感器中枢,通过Sensing Hub有助于大模型在手机端的“定制化”,提升了AI处理效率。

内存和能耗

image.png

限制大模型进入手机的第二道关卡是有限的内存和电池压力。联发科表示:“虽然大模型可以带来更好的生产力,但本地运行13B的体量就意味着需要占用约 13GB 的内存,再加上安卓本身的 4GB和其他P内存,已经超过了大多数手机16G的内存容量。天玑 9300 使用的内存硬件压缩技术,通过量化和压缩把大模型的内存占用降低,只有这样才能让大多数用户在日常跑得起大模型应用。”

高通在第三代骁龙8中采用LPDDR5X内存,提高了数据传输速度和带宽,支持更大更复杂的AI模型。同时,AI引擎的升级,如Hexagon NPU性能提高了98%,功耗降低了40%,在内存和能耗平衡上实现了更好的性能。联发科也不甘示弱,天玑 9300 集成了 MediaTek 第七代 AI 处理器 U 790,专为生成式 AI 而设计,其性能和能效相较上一代得到显著提升,整数运算和浮点运算的性能是前一代的两倍,功耗降低了45%。

互联

image.png

目前,AI 已广泛应用于各种物联网垂直领域,包括零售、安全、能源和公共设施、供应链和资产管理。AI 依靠近乎实时的数据采集和分析改进决策质量,优化运营效率,并赋能创新以打造差异化竞争优势。通过生成式 AI,物联网细分领域将进一步从 AI 的应用中受益。在高通的Snapdragon Seamless技术展示了智能终端的互联。这一技术能够在不同设备之间无缝传输数据,为用户提供更加便捷的跨终端操作体验。这种互联不仅使得大模型应用在不同设备之间实现共享,也为AI解决方案的跨平台适用性提供了可能。

AIGC手机AP亮眼之处

专注AI任务处理

移动AIGC手机AP相比传统手机AP更专注于处理AI相关任务。例如vivo的自研芯片、高通的骁龙平台以及苹果M3都是为了提供更出色的AI推理处理而专门设计的,突显了其在AI任务处理方面的专业性。

多核心异构处理

为了更好地处理不同类型和规模的AI模型,移动AIGC手机AP可能会支持多核心异构处理。让我们简单回顾到目前为止的提升历史,初期性能的提升主要是依靠CPU内核架构(比如从Arm Cortex-A5~A15)、提升CPU主频、同类CPU内核数量。但问题也随之浮现, CPU内核性能及数量的提升带来的功耗也越来越大,比如单纯的依靠四核A15/A17内核的处理器,如果用到移动平台,都已经出现了严重的功耗问题。而为了解决这一问题,Arm在2011年就研发了全新的big-Little架构,即通过大核CPU+小核CPU的组合来平衡性能和功耗问题。

在此之后,三星和联发科都一次推出了“大小核”架构的,新的变革出现在2017年,Arm正式发布了全新的有针对人工智能及机器学习进行优化的DynamIQ技术。而新的DynamIQ big-little将允许在单一计算集群上进行大小核配置,将可配置性提升到了一个新的台阶。同时,DynamIQ big.LITTLE还可以对每一个处理器进行独立的频率控制以及开、关、休眠三种状态的控制,可以实现在不同任务间丝滑切换的处理器。2019年,Google博客公布的Pixel Visual Core结构图中就显示了AIGC手机AP中需要多核异构,这颗芯片内部集成了8个图像处理核心(lmage Processing Unit,简称:IPU),一颗来自ARM的A53核心,同时还拥有MIPI/LPDDR4/PCle控制器。

此后,包括联发科在内的众多手机芯片厂商开始全面采用八核“三丛集”架构设计,很多厂商也纷纷效仿。比如,高通最新推出的骁龙8 Gen3采用的就是采1+5+2的八核“三丛集”架构。联发科的天玑9300则首次采用了“全大核”CPU设计,即1个3.25GHz Cortex-X4超大核+3个2.85GHz Cortex-X4超大核+4个主频2.0GHz Cortex-A720 大核。

image.png

更低功耗和高效能

AI 创业公司 Hugging Face 和卡内基梅隆大学的研究人员分析了 13 种生成式 AI 任务的耗能,除了生成图像和文本,还有摘要、对象检测、文本分类等。每项任务研究人员都会运行 1000 个提示词,收集期间消耗的电力。结果显示图像生成最高,文本分类最低。生成图像的平均耗电量为 0.007 度电(KWh),是文本分类的三倍以上(0.002 度电)。

因此,移动AIGC手机AP需要在AI任务执行时提供高效的性能,但同时要求较低的功耗。这是为了确保在移动设备上能够实现可持续的性能,同时维持较长的电池寿命。

灵活的软硬件结合

移动AIGC手机AP可能会支持灵活的软硬件结合,以便在不同的AI任务场景下进行适应性优化。这可以通过软件更新来改进AI处理的效能,使手机能够不断适应新的AI算法和模型。例如,高通的AI 硬件加速和简化开发的软件解决方案(比如高通 AI 软件栈),已经在引领终端侧 AI 推理。联发科则提供了生成式AI开发套件NeuroPilot,支持快速部署生成式AI模型并在APU上高效运行,同时提供全面的工具链以供开发丰富的AI应用程序。

1702538190624442.png

AIGC手机AP的挑战与机遇

在AI模型需求高算力和高功耗的大背景下,智能终端芯片的评判标准已经发生了变化,小模型对处理器提出了更具体的技术需求,尤其在移动端应用场景下。与传统手机AP相比,移动AIGC手机AP更专注于提供高效的AI推理处理,注重多核心异构处理、低功耗和高效能的设计。这种技术差异使得移动设备能够更好地满足未来AI应用对于移动终端处理器的不断提升的需求,为用户提供更出色的人工智能体验。

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>