删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

并行对称矩阵三对角化算法在GPU集群上的有效实现

本站小编 Free考研考试/2022-01-01

刘世芳1,2,赵永华1,于天禹1,2,黄荣锋1,2
1(中国科学院计算机网络信息中心 北京 100190);2(中国科学院大学 北京 100190) (liushifang@cnic.cn)
出版日期: 2020-12-01


基金资助:国家重点研发计划项目(2017YFB0202202);中国科学院战略性先导科技专项(C类)(XDC01040000)

Efficient Implementation of Parallel Symmetric Matrix Tridiagonalization Algorithm on GPU Cluster

Liu Shifang1,2, Zhao Yonghua1, Yu Tianyu1,2, Huang Rongfeng1,2
1(Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190);2(University of Chinese Academy of Sciences, Beijing 100190)
Online: 2020-12-01


Supported by:This work was supported by National Key Research and Development Program of China (2017YFB0202202) and the Strategic Priority Research Program of Chinese Academy of Sciences (C) (XDC01040000).




摘要/Abstract


摘要: 对称矩阵三对角化是求解稠密特征问题的关键计算过程.针对GPU集群采用了MPI(message passing interface)和GPU级2级并行方法设计实现了基于MPI和CUDA(compute unified device architecture )的稠密对称矩阵三对角化算法.在MPI集群级并行中,通过将2维通信域中行-列通信域间的全局数据通信设计为完全并行的点-点数据通信方式,改善了三对角化MPI并行算法的通信性能.通过改进原矩阵三对角化的MPI并行算法,避免了在GPU级并行中使用的不规则的矩阵-向量运算,这部分的并行性能提升了1倍左右.并且,将在GPU并行中存在的小粒度计算合并为较大粒度计算,该策略可通过加大计算密集度来充分地发挥GPU的计算能力,增加GPU的利用率,从而提升了算法的性能.此外,利用多个CUDA流使算法中独立的CUDA操作可以在不同的流中并发执行.并且,在并行算法中,利用CPU与GPU之间的异步数据传输,使得在不同流中的数据传输和核函数同时执行,隐藏了数据传输的时间,进一步提升了算法的性能.在中国科学院超级计算机系统“元”上,使用Nvidia Tesla K20 GPGPU测试了不同规模矩阵的基于MPI+CUDA的三对角化并行块算法的性能,取得了较好的加速效果与性能,并且具有良好的可扩展性.






[1]毛安琪, 汤小春, 丁朝, 李战怀. 集中式集群资源调度框架的可扩展性优化[J]. 计算机研究与发展, 2021, 58(3): 497-512.
[2]潘晨,刘志强,刘振,龙宇. 区块链可扩展性研究:问题与方法[J]. 计算机研究与发展, 2018, 55(10): 2099-2110.
[3]陈继承,赵雅倩,李一韩,王恩东,史宏志,唐士斌. MPD:结点具有多个并行缓存一致性域的CC-NUMA系统[J]. 计算机研究与发展, 2017, 54(4): 775-786.
[4]张东,亓开元,吴楠,辛国茂,刘正伟,颜秉珩,郭锋. 云海大数据一体机体系结构和关键技术[J]. 计算机研究与发展, 2016, 53(2): 374-389.
[5]雷斐,董德尊,庞征斌,廖湘科,杨明英. Paleyfly:一种可扩展的高速互连网络拓扑结构[J]. 计算机研究与发展, 2015, 52(6): 1329-1340.
[6]赵长海,王狮虎,罗国安,文佳敏,张建磊. 高度可扩展的3D叠前Kirchhoff时间偏移并行算法[J]. 计算机研究与发展, 2015, 52(4): 869-878.
[7]孙振元,许鲁,刘振军,董欢庆,刘昌. 网络分簇BWRAID:更快的扩展、恢复和读写性能[J]. 计算机研究与发展, 2015, 52(11): 2568-2576.
[8]周 江, 王伟平, 孟 丹, 马 灿, 古晓艳, 蒋 杰,. 面向大数据分析的分布式文件系统关键技术[J]. 计算机研究与发展, 2014, 51(2): 382-394.
[9]熊焕亮,曾国荪,吴沧海. 一种等性能面积的并行计算可扩展性度量方法[J]. 计算机研究与发展, 2014, 51(11): 2547-2558.
[10]曹宏嘉 卢宇彤 谢 旻 周恩强. 并行作业启动及其可扩展性分析[J]. , 2013, 50(8): 1755-1761.
[11]王少辉, 刘素娟, 陈丹伟,. 满足后向隐私的可扩展RFID双向认证方案[J]. 计算机研究与发展, 2013, 50(6): 1276-1284.
[12]刘 全, 傅启明, 杨旭东, 荆 玲, 李 瑾, 李 娇,. 一种基于智能调度的可扩展并行强化学习方法[J]. , 2013, 50(4): 843-851.
[13]穆 飞 薛 巍 舒继武 郑纬民. 一种面向大规模存储系统的数据副本映射算法[J]. , 2009, 46(3): 492-497.
[14]吴 艾 刘心松 符青云 刘克剑. DPVoD:基于P2P的视频点播体系结构[J]. , 2008, 45(2): 269-277.
[15]赵永华, 迟学斌, 程 强,. 广义Hermitian特征问题标准化转换的有效并行块算法[J]. , 2007, 44(10): 1724-1732.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4316
相关话题/计算机 计算 中国科学院 通信 网络

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于散度的网络流概念漂移分类方法
    程光1,2,3,钱德鑫1,2,3,郭建伟4,史海滨1,2,3,吴桦1,2,3,赵玉宇1,2,31(东南大学网络空间安全学院南京211189);2(教育部计算机网络和信息集成重点实验室(东南大学)南京211189);3(江苏省计算机网络技术重点实验室(东南大学)南京211189);4(华为技术有限公司 ...
    本站小编 Free考研考试 2022-01-01
  • 基于自适应广义回归神经网络的链路质量评估
    舒坚,高素,陈宇斌(南昌航空大学软件学院南昌330063)(shujian@nchu.edu.cn)出版日期:2020-12-01基金资助:国家自然科学基金项目(61962037,61762065);江西省自然科学基金重点项目(20202BABL202039,20181BAB202015);江西省研 ...
    本站小编 Free考研考试 2022-01-01
  • 基于边缘计算的进化多目标优化图像隐写算法
    丁旭阳1,谢盈1,2,张小松11(电子科技大学计算机科学与工程学院成都611731);2(西南民族大学计算机科学与工程学院成都610041)(dingxuyang@uestc.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金项目(61902326);西南民族大学中央高校基本科研 ...
    本站小编 Free考研考试 2022-01-01
  • 基于双向循环神经网络的安卓浏览器指纹识别方法
    刘奇旭1,2,刘心宇1,2,罗成3,王君楠1,2,陈浪平1,2,刘嘉熹1,21(中国科学院信息工程研究所北京100093);2(中国科学院大学网络空间安全学院北京100049);3(中国信息通信研究院北京100191)(liuqixu@iie.ac.cn)出版日期:2020-11-01基金资助:中国 ...
    本站小编 Free考研考试 2022-01-01
  • MSRD: 多模态网络谣言检测方法
    刘金硕1,冯阔1,JeffZ.Pan2,邓娟1,王丽娜11(空天信息安全与可信计算教育部重点实验室,武汉大学国家网络安全学院武汉430072);2(阿伯丁大学苏格兰阿伯丁AB243FX)(liujinshuo@whu.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金项目(U19 ...
    本站小编 Free考研考试 2022-01-01
  • 基于校园行为信息网络的生活习惯相似学生搜索
    王新澳1,段磊1,崔丁山1,卢莉1,顿毅杰2,秦蕊琦11(四川大学计算机学院成都610065);2(西北民族大学数学与计算机科学学院兰州730030)(wangxinao@stu.scu.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金项目(61972268,61572332) ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算隐私保护研究进展
    周俊,沈华杰,林中允,曹珍富,董晓蕾(上海市高可信计算重点实验室(华东师范大学)上海200062)(jzhou@sei.ecnu.edu.cn)出版日期:2020-10-01基金资助:上海市自然科学基金项目(20ZR1418400);国家自然科学基金项目(61632012,61672239,U163 ...
    本站小编 Free考研考试 2022-01-01
  • 量子计算与量子密码的原理及研究进展综述
    王永利1,徐秋亮21(山东大学数学学院济南250100);2(山东大学软件学院济南250101)(wyl@mail.sdu.edu.cn)出版日期:2020-10-01基金资助:国家自然科学基金项目(61632020)PrincipleandResearchProgressofQuantumComp ...
    本站小编 Free考研考试 2022-01-01
  • 面向集合计算的隐私保护统计协议
    宋祥福1,盖敏2,赵圣楠1,蒋瀚21(山东大学计算机科学与技术学院济南250101);2(山东大学软件学院济南250101)(bintasong@gmail.com)出版日期:2020-10-01基金资助:国家自然科学基金项目(61632020,61572294)Privacy-Preserving ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算专题前言
    卢宇彤(中山大学国家超级计算广州中心广州510006)出版日期:2020-09-01Online:2020-09-01摘要/Abstract摘要:近年来,随着智能万物互联时代的快速到来和新一代无线通信网络的高速普及,各类新兴智能应用如智慧城市、智能制造、新零售、智能安防等百花齐放.这些新兴数据密集型 ...
    本站小编 Free考研考试 2022-01-01