8月25日,在无锡举办的“第二届中国集成电路设计创新大会暨 IC 应用博览会(ICDIA 2022)高峰论坛上,安谋科技产品研发负责人刘澍表示,随着软件定义硬件成为未来的发展趋势,各种场景化的软件增加了系统的碎片化和复杂度,CPU、GPU、NPU以及ISP、VPU等计算单元构成的异构融合计算平台,将能够在各种碎片化场景中,对计算的差异化需求提供有效解决方案。安谋科技在立足全球生态、本土创新的基础上,将自研IP和Arm IP打造成一体化、高质量的异构计算平台,助力本土产业持续创新。
软件定义硬件时代,异构计算解决复杂场景问题
AI、5G等飞速发展的技术给我们的生活带来了巨大的便利性和高效性,随之而来的是成本以及软件复杂度的大幅增加。以汽车为例,一辆燃油车的技术成本约为2000美元,其中软件成本约为10%;混动汽车的技术成本约为1.5万美元,其中软件成本占比提高到20%;而在L5级别的自动驾驶汽车中,技术成本则将达到近4万美元,软件部分占比将高达50%。技术成本以及软件成本占比的提升,意味着两者的重要性越来越高,并影响到整个系统以及硬件的设计。同样,在服务器市场也显示出软件定义硬件的趋势,例如容器技术、虚拟化技术、微服务技术等带来的软件定义计算、软件定义网络、软件定义存储等。 “未来软件定义硬件的趋势会从云发展到边缘,进而发展到端侧。”刘澍表示。
8月25日,在无锡举办的“第二届中国集成电路设计创新大会暨 IC 应用博览会(ICDIA 2022)高峰论坛上,安谋科技产品研发负责人刘澍表示,随着软件定义硬件成为未来的发展趋势,各种场景化的软件增加了系统的碎片化和复杂度,CPU、GPU、NPU以及ISP、VPU等计算单元构成的异构融合计算平台,将能够在各种碎片化场景中,对计算的差异化需求提供有效解决方案。安谋科技在立足全球生态、本土创新的基础上,将自研IP和Arm IP打造成一体化、高质量的异构计算平台,助力本土产业持续创新。
软件定义硬件时代,异构计算解决复杂场景问题
AI、5G等飞速发展的技术给我们的生活带来了巨大的便利性和高效性,随之而来的是成本以及软件复杂度的大幅增加。以汽车为例,一辆燃油车的技术成本约为2000美元,其中软件成本约为10%;混动汽车的技术成本约为1.5万美元,其中软件成本占比提高到20%;而在L5级别的自动驾驶汽车中,技术成本则将达到近4万美元,软件部分占比将高达50%。技术成本以及软件成本占比的提升,意味着两者的重要性越来越高,并影响到整个系统以及硬件的设计。同样,在服务器市场也显示出软件定义硬件的趋势,例如容器技术、虚拟化技术、微服务技术等带来的软件定义计算、软件定义网络、软件定义存储等。 “未来软件定义硬件的趋势会从云发展到边缘,进而发展到端侧。”刘澍表示。
随着软件定义硬件成为趋势,多种算法不断涌现,场景化的软件增加了系统的碎片化和复杂度。例如在拍照优化这个应用场景中,需要用RGB图像深度抠图、背景虚化后再进行超分处理,最终显示出符合需求的高质量图片。在这个处理过程背后,硬件方面涉及到CPU和ISP的协同以及GPU和NPU的协同,乃至SoC中各个异构计算的协同和配合。
在谈及如何应对场景碎片化、多样化的问题时,刘澍表示:“碎片化的场景更需要异构计算核心的配合,不仅需要CPU、GPU等通用计算单元,也需要高质量的人工智能处理单元NPU,视频图像处理单元VPU、ISP或是其它安全处理功能。通过各个计算单元之间的异构融合和协同工作,来满足复杂场景对计算的差异化需求。”
评估系统真实需求,为客户提供满足真实应用场景的设计
面对越来越复杂的碎片化场景,如何满足硬件上的需求?答案是需要评估系统真实的需求。刘澍指出,通用的Benchmark无法代表真实场景的需求。以自动驾驶场景分析为例,用一个赛道上简单的几辆车在运行的场景,通过车速来判断真实的性能需求显然不够准确,因为真实的城市交通场景是非常复杂的,存在着交通指示、人和各种各样的物体之间大量的交互。
为评估系统的真实需求,安谋科技提出了基于场景的分析办法,对游戏、编解码、安全等客户关心的关键场景进行分析和提取,分化出CPU、GPU的工作量以及NPU、VPU等其它异构核心单元的工作量。通过对各计算单元工作量的评估,进而得到性能模型和功耗模型进一步分析,进而通过对带宽、功耗、性能的分析最终达到最优化的系统设计。”刘澍介绍到。
“通过Total Compute对系统级异构的分析,结合客户的应用分析出真实需求,从而定义出满足真实复杂场景的系统设计和芯片设计方案。”刘澍指出,基于Arm的开发工具、分析工具以及强大的软件生态,我们为客户提供相关的驱动、软件以及分析工具,还可以通过物理库产品,为CPU、GPU定制最优的PPA物理实现所需要的基础单元。 “Total Compute方案已经得到了很多国内合作伙伴的深度参与。例如,通过Total Compute分析,游戏开发引擎取得了内存带宽节省30%的成果,这对提升性能和减少功耗以及对芯片的成本节省都有很大的提升。”刘澍表示。
构建多元异构计算平台,助力客户加速产品开发
据刘澍介绍,安谋科技的自研IP和Arm产品形成了完整的 异构核心计算矩阵。除了Arm CPU、GPU等通用计算IP外,安谋科技 “周易”NPU、“星辰”CPU、“山海”SPU以及“玲珑”ISP和VPU等自研IP产品在异构计算中同样是不可或缺的核心。刘澍表示: “安谋科技自研IP和Arm IP,追求的是一体化的、完整的异构计算的矩阵。在这个矩阵下,各个计算单元通过协同和互补形成一个完整的平台。安谋科技将持续致力于异构计算产品研发,为客户提供多元化的、满足实际场景需求的解决方案。”
数据显示,自安谋科技成立以来,在国内的授权合作伙伴超过300家,累计芯片出货量突破250亿片,促进了下游年产值过万亿元人民币规模的科技产业发展,这也是安谋科技在整个Arm生态里所做出的重要贡献。“我们希望通过Arm生态助力本土芯片产业,欢迎更多的合作伙伴加入到Arm生态中来。”刘澍总结道。
随着软件定义硬件成为趋势,多种算法不断涌现,场景化的软件增加了系统的碎片化和复杂度。例如在拍照优化这个应用场景中,需要用RGB图像深度抠图、背景虚化后再进行超分处理,最终显示出符合需求的高质量图片。在这个处理过程背后,硬件方面涉及到CPU和ISP的协同以及GPU和NPU的协同,乃至SoC中各个异构计算的协同和配合。
在谈及如何应对场景碎片化、多样化的问题时,刘澍表示:“碎片化的场景更需要异构计算核心的配合,不仅需要CPU、GPU等通用计算单元,也需要高质量的人工智能处理单元NPU,视频图像处理单元VPU、ISP或是其它安全处理功能。通过各个计算单元之间的异构融合和协同工作,来满足复杂场景对计算的差异化需求。”
评估系统真实需求,为客户提供满足真实应用场景的设计
面对越来越复杂的碎片化场景,如何满足硬件上的需求?答案是需要评估系统真实的需求。刘澍指出,通用的Benchmark无法代表真实场景的需求。以自动驾驶场景分析为例,用一个赛道上简单的几辆车在运行的场景,通过车速来判断真实的性能需求显然不够准确,因为真实的城市交通场景是非常复杂的,存在着交通指示、人和各种各样的物体之间大量的交互。
为评估系统的真实需求,安谋科技提出了基于场景的分析办法,对游戏、编解码、安全等客户关心的关键场景进行分析和提取,分化出CPU、GPU的工作量以及NPU、VPU等其它异构核心单元的工作量。通过对各计算单元工作量的评估,进而得到性能模型和功耗模型进一步分析,进而通过对带宽、功耗、性能的分析最终达到最优化的系统设计。”刘澍介绍到。
“通过Total Compute对系统级异构的分析,结合客户的应用分析出真实需求,从而定义出满足真实复杂场景的系统设计和芯片设计方案。”刘澍指出,基于Arm的开发工具、分析工具以及强大的软件生态,我们为客户提供相关的驱动、软件以及分析工具,还可以通过物理库产品,为CPU、GPU定制最优的PPA物理实现所需要的基础单元。 “Total Compute方案已经得到了很多国内合作伙伴的深度参与。例如,通过Total Compute分析,游戏开发引擎取得了内存带宽节省30%的成果,这对提升性能和减少功耗以及对芯片的成本节省都有很大的提升。”刘澍表示。
构建多元异构计算平台,助力客户加速产品开发
据刘澍介绍,安谋科技的自研IP和Arm产品形成了完整的 异构核心计算矩阵。除了Arm CPU、GPU等通用计算IP外,安谋科技 “周易”NPU、“星辰”CPU、“山海”SPU以及“玲珑”ISP和VPU等自研IP产品在异构计算中同样是不可或缺的核心。刘澍表示: “安谋科技自研IP和Arm IP,追求的是一体化的、完整的异构计算的矩阵。在这个矩阵下,各个计算单元通过协同和互补形成一个完整的平台。安谋科技将持续致力于异构计算产品研发,为客户提供多元化的、满足实际场景需求的解决方案。”
数据显示,自安谋科技成立以来,在国内的授权合作伙伴超过300家,累计芯片出货量突破250亿片,促进了下游年产值过万亿元人民币规模的科技产业发展,这也是安谋科技在整个Arm生态里所做出的重要贡献。“我们希望通过Arm生态助力本土芯片产业,欢迎更多的合作伙伴加入到Arm生态中来。”刘澍总结道。
相关文章