高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法
汤洋1, 赵达非2,3, 黄智濒2,3, 戴志涛2,31. 北京邮电大学 理学院, 北京 100876;
2. 北京邮电大学 智能通信软件与多媒体北京市重点实验室, 北京 100876;
3. 北京邮电大学 计算机学院, 北京 100876
收稿日期:
2018-10-09出版日期:
2019-06-28发布日期:
2019-06-20作者简介:
汤洋(1997-),男,硕士生;黄智濒(1978-),男,讲师,硕士生导师,E-mail:huangzb@bupt.edu.cn.基金资助:
中央高校基本科研业务费专项资金项目(2017RC42);IBMSUR项目(IA2016010);提升政府治理能力大数据应用技术国家工程实验室重点支持项目;中国博士后科学基金面上项目(2014M550662)High Performance Row-Based Hashing GPU SpGEMM
TANG Yang1, ZHAO Da-fei2,3, HUANG Zhi-bin2,3, DAI Zhi-tao2,31. School of Science, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China;
3. School of Computer Science, Beijing University of Posts and Telecommunication, Beijing 100876, China
Received:
2018-10-09Online:
2019-06-28Published:
2019-06-20摘要/Abstract
摘要: 针对一般稀疏矩阵-矩阵乘法(SpGEMM)的性能问题,提出了一种基于任务分类和低延迟散列表的图形处理器上的加速SpGEMM算法RBSPARSE.该算法由一种低成本子任务复杂度预分析方法和一种低延迟共享内存上的散列表的方法组成,以达到最大效率.通过解决负载均衡和内存延迟问题,RBSPARSE可以显著减少计算的总时间.比较了RBSparse和BHSparse,前者是最快的SpGEMM算法,结果表明RBSparse的性能是BHSparse的平均3.1倍,在最佳情况下可达到14.49倍.
中图分类号:
TP391
引用本文
汤洋, 赵达非, 黄智濒, 戴志涛. 高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法[J]. 北京邮电大学学报, 2019, 42(3): 106-113.
TANG Yang, ZHAO Da-fei, HUANG Zhi-bin, DAI Zhi-tao. High Performance Row-Based Hashing GPU SpGEMM[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2019, 42(3): 106-113.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3355