1(计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190);2(中国科学院大学 北京 100049);3(美国加州大学圣塔芭芭拉分校 美国加利福利亚州圣塔芭芭拉 93106) (yanmingyu@ict.ac.cn)
出版日期:
2021-04-01基金资助:
国家重点研发计划项目(2018YFB1003501);国家自然科学基金项目(61732018,61872335,61802367,61672499);中国科学院战略性先导科技专项(C类)(XDC05000000);数学工程与先进计算国家重点实验室开放基金(2019A07)A Survey on Graph Processing Accelerators
Yan Mingyu1,2,3, Li Han1,2, Deng Lei3, Hu Xing3, Ye Xiaochun1, Zhang Zhimin1, Fan Dongrui1,2, Xie Yuan31(State Key Laboratory of Computer Architecture (Institute of Computing Technology,Chinese Academy of Sciences),Beijing 100190);2(University of Chinese Academy of Sciences,Beijing 100049);3(University of California at Santa Barbara,Santa Barbara,California,USA 93106)
Online:
2021-04-01Supported by:
This work was supported by the National Key Research and Development Plan of China (2018YFB1003501), the National Natural Science Foundation of China (61732018, 61872335, 61802367, 61672499), the Strategic Priority Research Program of Chinese Academy of Sciences (XDC05000000), and the Open Project Program of the State Key Laboratory of Mathematical Engineering and Advanced Computing (2019A07).摘要/Abstract
摘要: 在大数据时代,图被用于各种领域表示具有复杂联系的数据.图计算应用被广泛用于各种领域,以挖掘图数据中潜在的价值.图计算应用特有的不规则执行行为,引发了不规则负载、密集读改写更新操作、不规则访存和不规则通信等挑战.现有通用架构无法有效地应对上述挑战.为了克服加速图计算应用面临的挑战,大量的图计算硬件加速架构设计被提出.它们为图计算应用定制了专用的计算流水线、访存子系统、存储子系统和通信子系统.得益于这些定制的硬件设计,图计算加速架构相比于传统的通用处理器架构,在性能和能效上均取得了显著的提升.为了让相关的研究****深入了解图计算硬件加速架构,首先基于计算机的金字塔组织结构,从上到下对现有工作进行分类和总结,并以多个完整架构实例分析应用于不同层次的优化技术之间的关系.接着以图神经网络加速架构的具体案例讨论新兴图计算应用的加速架构设计.最后对该领域的前沿研究方向进行了总结,并放眼于未来探讨图计算加速架构的发展趋势.
参考文献
相关文章 15
[1] | 李涵, 严明玉, 吕征阳, 李文明, 叶笑春, 范东睿, 唐志敏. 图神经网络加速结构综述[J]. 计算机研究与发展, 2021, 58(6): 1204-1229. |
[2] | 陈晋音, 黄国瀚, 张敦杰, 张旭鸿, 纪守领. 一种面向图神经网络的图重构防御方法[J]. 计算机研究与发展, 2021, 58(5): 1075-1091. |
[3] | 汤嘉武, 郑龙, 廖小飞, 金海. 面向高性能图计算的高效高层次综合方法[J]. 计算机研究与发展, 2021, 58(3): 467-478. |
[4] | 郭进阳, 邵传明, 王靖, 李超, 朱浩瑾, 过敏意. FPGA图计算的编程与开发环境:综述和探索[J]. 计算机研究与发展, 2020, 57(6): 1164-1178. |
[5] | 马卿云, 季航旭, 赵宇海, 毛克明, 王国仁. 一种分布式异构带宽环境下的高效数据分区方法[J]. 计算机研究与发展, 2020, 57(12): 2683-2693. |
[6] | 张强,梁杰,许胤龙,李永坤. 基于工作负载感知的固态硬盘阵列系统的架构设计与研究[J]. 计算机研究与发展, 2019, 56(4): 755-766. |
[7] | 孙茹君,张鲁飞,郝子宇,陈左宁. 图计算中基于一致性约束条件的迭代模型研究[J]. 计算机研究与发展, 2019, 56(2): 431-441. |
[8] | 王煜炜,刘敏,马诚,李鹏飞. 面向网络功能虚拟化的高性能负载均衡机制[J]. 计算机研究与发展, 2018, 55(4): 689-703. |
[9] | 易建亮, 陈志广, 肖侬, 卢宇彤. 基于代理的并行文件系统元数据优化与实现[J]. 计算机研究与发展, 2018, 55(2): 438-446. |
[10] | 刘炳涛,王达,叶笑春,范东睿,张志敏,唐志敏. 基于数据流块的空间指令调度方法[J]. 计算机研究与发展, 2017, 54(4): 750-763. |
[11] | 胡海洋,姬朝配,胡华,葛季栋. 基于协作相容性的工作流任务分配优化方法[J]. 计算机研究与发展, 2017, 54(4): 872-885. |
[12] | 李哲涛,臧浪,田淑娟,李仁发. 基于混合压缩感知的分簇式网络数据收集方法[J]. 计算机研究与发展, 2017, 54(3): 493-501. |
[13] | 李琪,钟将,李雪. 基于启发策略的动态平衡图划分算法[J]. 计算机研究与发展, 2017, 54(12): 2851-2857. |
[14] | 张洋,王达,叶笑春,朱亚涛,范东睿,李宏亮,谢向辉. 众核处理器片上网络的层次化全局自适应路由机制[J]. 计算机研究与发展, 2016, 53(6): 1211-1220. |
[15] | 方民权,张卫民,周海芳. 集成众核上快速独立成分分析降维并行算法[J]. 计算机研究与发展, 2016, 53(5): 1136-1146. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4407