Imagination GPU为边缘智能提供高效率的加速

发布时间:2024-09-11  

作者:Imagination

作为奕斯伟计算的重要合作伙伴,Imagination 公司受邀出席了9月10日在北京亦庄举办的“2024奕斯伟计算开发者伙伴大会”,来自Imagination英国总部的专家在大会上发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。

1.jpg

在人工智能(AI)浪潮中成立的奕斯伟计算一直致力于研究和开发创新的计算架构,并通过与Imagination这样的全球领先处理器技术和IP产品提供商合作,针对多模态AI大模型技术带动多元化人工智能应用加速涌现的新需求,开发了面向边缘智能和AI PC等多种应用场景的EIC77系列芯片。这些AI SoC芯片利用了RISC-V计算架构开放、灵活、精简、可拓展的优势,结合了该公司自研的NPU以及Imagination的GPU,成为了全球首批可商用的基于RISC-V的高性能、低功耗的边缘侧、端侧AI推理芯片。

大会中,Imagination公司专家介绍了与奕斯伟计算的合作成果:作为奕斯伟计算向全球发布的EIC77 系列边缘智能SoC中的一款产品,全新的EIC7700X 器件基于 12nm 工艺,采用了 Imagination 的 IMG A 系列 GPU IP;该 GPU 拥有 128 宽 ALU 单元和专用 AI 处理通道,可提供 0.25 TFLOPS、1 TOPS 和 8 Gpixels 的性能。EIC7700X也搭载了奕斯伟自研的NPU单元,可提供19.95 TOPS INT8、9.975 TOPS INT16、 9.975 FTOPS FP16 算力。EIC7700X为边缘智能提供了强劲的计算和图形处理能力,可支持大语言模型,其在深度神经网络(DNN)推理上的算力高达13.3TOPS INT8,可满足分类、检测、分割、追踪等各类需求。

2.jpg

谈到边缘计算的应用多元化与架构创新,Imagination公司专家表示:首先,我们需要确保边缘计算架构能够进行有效的、可持续的扩展,在系统资源、电能和带宽等资源稀缺,以及不同应用场景对资源需求各不相同的情况下,这一点在边缘计算领域更为重要。因此,灵活通用的异构计算架构才能确保我们的边缘智能解决方案不会因为碎片化而无法实现,这要求我们拥有的模型也将是通用的、可持续的,同时才能保障边缘系统中内计算核的数量可以合理地缩减以满足功耗要求。

为了确保足够的通用性以运行目前的工作负载和未来的工作负载,就需要对边缘智能SoC中计划采用的处理器性能和需求进行充分的评估,大家往往首先看的是两个潜在的选择。一个选择可以是 NPU或者在Imagination的产品组合中被称为AI,这类硬件的每瓦最高性能非常出色,但为了达到更高的性能,使用NPU就需要牺牲一些灵活性。第二种选择是 GPU,其优点是可以提供可编程的、可扩展的硬件加速能力,并可根据应用方向上的需求来选择相应的GPU去支持所需渲染和计算能力。

虽然这两种器件类型各有优势,边缘智能最终需要的是能够完美适用于应用的、在高性能和可扩展性,定制化和通用化中做出最明智决策的系列解决方案。从我们已有的实践和Richard Sutton的《苦涩的教训》中大家可以看到,人们在边缘人工智能中希望能够利用通用的硬件和软件解决方案,尽量避免使用特定的解决方案,因为人工智能一直在发展,所有的解决方案都要确保与时俱进。

在确定了要用更加通用的硬件和软件来推动基础模型的开发和应用这一方向之后,越来越多的计算技术正在加速诸如EIC77这样的边缘智能芯片走向更广泛的应用:一方面,RISC-V正在向机器学习的核心领域进发,不仅是更多RISC-V CPU厂商在向此方向努力,而且RISC-V的相关标准也在进一步完善,使RISC-V成为进入AI领域的一条开销最低的途径。另一方面,边缘人工智能软件也在摆脱其他AI应用受制于CUDA生态的局限,越来越多诸如OneAPI这样的应用程序接口可支持工作负载的开发和运行,以及诸如UXL等行业组织也提供了将CUDA上的AI工作负载转化为SYCL为在 GPU 或 CPU 上运行的移植解决方案。

展望未来,Imagination将继续支持奕斯伟计算倡导的RISC-V数字基础设施(RISC-V Digital Infrastructure)生态,在GPU 被用于越来越多和越来越广泛的工作负载,以及支持越来越多的基础模型和算法的同时,与更多的合作伙伴在边缘计算、AI PC和AI加速等领域中,共同打造更多高性能的智能产品。

文章来源于:电子创新网    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    性,以及主流付费模式,云端AI体验还无法与终端AI便利性比拟;例如,近期外媒透露微软下一代Windows改版中,Copilot的许多关键功能将直接运行在NPU上,在AI驱动下,Copilot可帮......
    XeSS加持游戏体验升级!英特尔锐炫A750全新驱动实测;2月初,英特尔发布了锐炫GPU新版驱动31.0.101.4091。本次更新为锐炫显卡带来了颇为显著的DX9游戏性能提升,同时在DX11和......
    GPU等,后者多用于手机处理器、基带芯片、射频模组和DRAM、NAND等存储产品。 在半导体热潮的带动下,载板为近年来全球PCB产业最亮眼的产品。2022年的......
    三星 Exynos 1380/1330 处理器发布:采用 5nm 工艺,前者支持;IT之家 2 月 23 日消息,今日发布了用于 Galaxy A 系列智能手机的新 Exynos 处理......
    智能(AI)半导体需求将激增。这是由于生成式 AI 市场的增长,预计将导致对集成到图形处理单元 (GPU) 中的高性能内存 HBM 的需求显着增加。事实上,据报道,在强劲性能的推动下,NVIDIA 计划......
    于预期,估计2023年下半年需求才会缓步回升。 台积电3纳米已在2022年第4季末量产,在智能手机应用的驱动下,预期2023年将平稳量产,客户......
    的全部潜力得以释放。我们率先实现了LPDDR5的量产,并率先将uMCP5技术应用于5G市场。我们持续助力手机厂商,帮助他们充分利用1Gbps甚至更快的5G下载速度,以发挥先进处理引擎的能力。 一股创新浪潮已经到来——支持......
    新应用趋势带动半导体发展,台积电指汽车是下个亮点;近期,台积电研究发展副总经理曹敏表示,人工智能(AI)驱动下,2030年全球半导体业营收可望达1万亿美元,高性能运算(HPC)占最大宗,比重达40......
    对诸多应用和游戏的不兼容给几款使用这个AP 的华为手机带来了不少的差评。而后续在Kirin92X 系列和Kirin 930 华为都是采用了ARM Mali-T 628 MP4 GPU ,这款GPU 整体......
    ESP8266自动下载电路设计方案;前言 使用过51单片机的朋友会清楚:51单片机在烧写程序的时候需要断一下电再上电;使用过STM32单片机的朋友会清楚:烧写程序时需要设置Boot模式......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>