ISCA、MICRO、HPCA并称为体系结构领域三大顶级会议,ISCA创办于1973年,见证了诸多突破性成果的首次亮相,包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。官方信息显示,ISCA论文录取率常年低于20%。近两年,阿里巴巴已有多个成果在该会议亮相,是ISCA历史上论文入选最多的中国企业。
本次入选的达摩院论文,致力于解决图神经网络硬件的问题。图神经网络是人工智能领域的热门技术之一,可应用于蛋白质结构预测、分子制药、推荐系统、金融风控等领域。大规模图神经网络的处理,对存储规模、通信时延的要求更高,如果仅靠传统硬件处理,效率低下。
ISCA、MICRO、HPCA并称为体系结构领域三大顶级会议,ISCA创办于1973年,见证了诸多突破性成果的首次亮相,包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。官方信息显示,ISCA论文录取率常年低于20%。近两年,阿里巴巴已有多个成果在该会议亮相,是ISCA历史上论文入选最多的中国企业。
本次入选的达摩院论文,致力于解决图神经网络硬件的问题。图神经网络是人工智能领域的热门技术之一,可应用于蛋白质结构预测、分子制药、推荐系统、金融风控等领域。大规模图神经网络的处理,对存储规模、通信时延的要求更高,如果仅靠传统硬件处理,效率低下。
在该论文中,达摩院提出了一种新的硬件架构,可硬件卸载远端内存访问,提升并行度、减小延时。该架构以玄铁906处理器为控制核心,并辅以本地访存加速器Access Engine(AxE)以及远端访存加速器Memory-Over-Fabric(MoF)。该硬件系统高效地分担了传统CPU的部分任务,大幅减小访存延时,并增加了带宽利用率。
达摩院基于此架构实现了单机四卡FPGA的原型系统,并通过AliGraph软件部署到云端,根据测试,相比购买CPU服务,使用该原型系统的云上FPGA性价比提升约 2倍。
达摩院研究人员表示:“大规模图神经网络的应用越来越广阔,但业界主流加速方案多数仍局限于图数据量较小的场景,我们研发的硬件架构可有效解决大规模分布式图神经网络的硬件瓶颈。”
据介绍,2020年,阿里巴巴三篇论文入选ISCA,创造国内企业纪录,相关论文研究包括玄铁910处理器、存算一体芯片以及AI硬件基准测试等。
在该论文中,达摩院提出了一种新的硬件架构,可硬件卸载远端内存访问,提升并行度、减小延时。该架构以玄铁906处理器为控制核心,并辅以本地访存加速器Access Engine(AxE)以及远端访存加速器Memory-Over-Fabric(MoF)。该硬件系统高效地分担了传统CPU的部分任务,大幅减小访存延时,并增加了带宽利用率。
达摩院基于此架构实现了单机四卡FPGA的原型系统,并通过AliGraph软件部署到云端,根据测试,相比购买CPU服务,使用该原型系统的云上FPGA性价比提升约 2倍。
达摩院研究人员表示:“大规模图神经网络的应用越来越广阔,但业界主流加速方案多数仍局限于图数据量较小的场景,我们研发的硬件架构可有效解决大规模分布式图神经网络的硬件瓶颈。”
据介绍,2020年,阿里巴巴三篇论文入选ISCA,创造国内企业纪录,相关论文研究包括玄铁910处理器、存算一体芯片以及AI硬件基准测试等。
相关文章