Imagination GPU为边缘智能提供高效率的加速

发布时间:2024-09-11  

作为奕斯伟计算的重要合作伙伴,Imagination 公司受邀出席了9月10日在北京亦庄举办的“2024奕斯伟计算开发者伙伴大会”,来自Imagination英国总部的专家在大会上发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。


image.png

在人工智能(AI)浪潮中成立的奕斯伟计算一直致力于研究和开发创新的计算架构,并通过与Imagination这样的全球领先处理器技术和IP产品提供商合作,针对多模态AI大模型技术带动多元化人工智能应用加速涌现的新需求,开发了面向边缘智能和AI PC等多种应用场景的EIC77系列芯片。这些AI SoC芯片利用了RISC-V计算架构开放、灵活、精简、可拓展的优势,结合了该公司自研的NPU以及Imagination的GPU,成为了全球首批可商用的基于RISC-V的高性能、低功耗的边缘侧、端侧AI推理芯片。


大会中,Imagination公司专家介绍了与奕斯伟计算的合作成果:作为奕斯伟计算向全球发布的EIC77 系列边缘智能SoC中的一款产品,全新的EIC7700X 器件基于 12nm 工艺,采用了 Imagination 的 IMG A 系列 GPU IP;该 GPU 拥有 128 宽 ALU 单元和专用 AI 处理通道,可提供 0.25 TFLOPS、1 TOPS 和 8 Gpixels 的性能。EIC7700X也搭载了奕斯伟自研的NPU单元,可提供19.95 TOPS INT8、9.975 TOPS INT16、 9.975 FTOPS FP16 算力。EIC7700X为边缘智能提供了强劲的计算和图形处理能力,可支持大语言模型,其在深度神经网络(DNN)推理上的算力高达13.3TOPS INT8,可满足分类、检测、分割、追踪等各类需求。


image.png


谈到边缘计算的应用多元化与架构创新,Imagination公司专家表示:首先,我们需要确保边缘计算架构能够进行有效的、可持续的扩展,在系统资源、电能和带宽等资源稀缺,以及不同应用场景对资源需求各不相同的情况下,这一点在边缘计算领域更为重要。因此,灵活通用的异构计算架构才能确保我们的边缘智能解决方案不会因为碎片化而无法实现,这要求我们拥有的模型也将是通用的、可持续的,同时才能保障边缘系统中内计算核的数量可以合理地缩减以满足功耗要求。


为了确保足够的通用性以运行目前的工作负载和未来的工作负载,就需要对边缘智能SoC中计划采用的处理器性能和需求进行充分的评估,大家往往首先看的是两个潜在的选择。一个选择可以是 NPU或者在Imagination的产品组合中被称为AI,这类硬件的每瓦最高性能非常出色,但为了达到更高的性能,使用NPU就需要牺牲一些灵活性。第二种选择是 GPU,其优点是可以提供可编程的、可扩展的硬件加速能力,并可根据应用方向上的需求来选择相应的GPU去支持所需渲染和计算能力。


虽然这两种器件类型各有优势,边缘智能最终需要的是能够完美适用于应用的、在高性能和可扩展性,定制化和通用化中做出最明智决策的系列解决方案。从我们已有的实践和Richard Sutton的《苦涩的教训》中大家可以看到,人们在边缘人工智能中希望能够利用通用的硬件和软件解决方案,尽量避免使用特定的解决方案,因为人工智能一直在发展,所有的解决方案都要确保与时俱进。


在确定了要用更加通用的硬件和软件来推动基础模型的开发和应用这一方向之后,越来越多的计算技术正在加速诸如EIC77这样的边缘智能芯片走向更广泛的应用:一方面,RISC-V正在向机器学习的核心领域进发,不仅是更多RISC-V CPU厂商在向此方向努力,而且RISC-V的相关标准也在进一步完善,使RISC-V成为进入AI领域的一条开销最低的途径。另一方面,边缘人工智能软件也在摆脱其他AI应用受制于CUDA生态的局限,越来越多诸如OneAPI这样的应用程序接口可支持工作负载的开发和运行,以及诸如UXL等行业组织也提供了将CUDA上的AI工作负载转化为SYCL为在 GPU 或 CPU 上运行的移植解决方案。


展望未来,Imagination将继续支持奕斯伟计算倡导的RISC-V数字基础设施(RISC-V Digital Infrastructure)生态,在GPU 被用于越来越多和越来越广泛的工作负载,以及支持越来越多的基础模型和算法的同时,与更多的合作伙伴在边缘计算、AI PC和AI加速等领域中,共同打造更多高性能的智能产品。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    面IT解决方案提供商Supermicro, Inc.(纳斯达克股票代码:SMCI)将展示其最新一代系统,为整个电信行业尤其是网络边缘加速工作负载。这些系统是基于英特尔技术的Supermicro最新......
    面IT解决方案提供商Supermicro, Inc.(纳斯达克股票代码:SMCI)将展示其最新一代系统,为整个电信行业尤其是网络边缘加速工作负载。这些系统是基于英特尔技术的Supermicro最新......
    诺半导体)发布适用于边缘智能领域的新品——集成边缘加速器的低功耗双核MAX7800X系列。        边缘智能的“边缘”逐渐已经成为人体感官的延伸,比如各种温度传感器、加速度传感器、声学......
    作依托于吴汉明院士牵头的浙江省12吋CMOS成套工艺研发平台,通过少样本学习、多模态驱动的垂直领域知识学习和边缘加速器设计这三项核心技术,实现了精确的缺陷检测及根因分析、多模态IC领域......
    ,SCDN),即拥有分布式安全防护能力的CDN加速服务。能够提供稳定加速,同时在加速节点深度集成抗DDoS、CC攻击的防护功能,基于加速节点的计算能力,使用深度学习的算法,智能预判分析攻击行为,在边缘加速......
    盒子,提供自洽式边缘加固型解决方案,在节能、增效、安全、自洽四个方面为边缘计算负载提供更好的支持。戴尔为科舸物联打造的分布式数字原生服务平台可提供跨多云、数据中心、边缘侧设备的通用PaaS服务。从整......
    的嵌入式MXM图形模块,其专为边缘加速计算和AI工作负载而打造。全新嵌入式图形模块采用紧凑型移动PCI express(MXM)外形设计,可实现实时光线追踪、AI加速图形和高能效AI推理加速。这些......
    波雷达点云数量的增加,数据处理需求也在增长。传统算法处理能力有限,而AI深度学习算法可应对更多数据,成为未来趋势。同时,E/E架构的进化提升了整车算力,使深度学习的边缘加速成为可能。 相关图谱推荐 联系咨询 推 ......
    互感器一般过热有以下原因: 1、产品质量不好:如果由于产品本身绝缘、铁芯叠片及绕制工艺不过关等,均可使电压互感器发热过量使绝缘长期处于高温下运行,从而导致绝缘加速老化,形成恶性循环。 2、过载、三相不平衡、谐振造成PT......
    低噪声传输。科索独特设计的MH3在日本制造,保修期为5年。 奉行高可靠性的设计理念,科索MH3系列进行绝缘加强且根据安全标准进行3kVAC和4.2kVAC绝缘测试,其变......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>