删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究

本站小编 Free考研考试/2022-01-01

谢震1,2,3,谭光明1,2,孙凝晖1,2
1(计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190);2(中国科学院计算技术研究所 北京 100190);3(中国科学院大学计算机与控制学院 北京 100049) (xiezhen@ncic.ac.cn)
出版日期: 2021-03-01


基金资助:国家重点研发项目(2018YFB0204400);中国科学院战略性先导科技专项(C类)(XDC05010100);国家自然科学基金项目(62032023, 61972377, 61702483)

Research on Optimal Performance of Sparse Matrix-Vector Multiplication and Convoulution Using the Probability-Process-Ram Model

Xie Zhen1,2,3, Tan Guangming1,2, Sun Ninghui1,2
1(State Key Laboratory of Computer Architecture (Institute of Computing Technology, Chinese Academy of Sciences), Beijing 100190);2(Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190);3(School of Computer and Control Engineering, University of Chinese Academy of Sciences, Beijing 100049)
Online: 2021-03-01


Supported by:This work was supported by the National Key Research and Development Program of China (2018YFB0204400), the Strategic Priority Research Program of Chinese Academy of Sciences (C)(XDC05010100), and the National Natural Science Foundation of China (62032023, 61972377, 61702483).




摘要/Abstract


摘要: 稀疏矩阵向量乘和卷积作为高性能计算的两大计算核心, 是非规则和规则访存的典型代表.目前已经做了许多针对性的优化工作, 但是对于大量运行着不同指令集和拥有不同计算和访存性能的机器, 仍然无法判定在特定的体系结构下导致性能效率无法被完全释放的主要原因及性能瓶颈, 同时也很难准确预测出程序在特定机器上可达到的最佳性能.通过使用性能模型方法, 建模程序在真实机器上的运行细节, 可以得出更加精确的性能预测, 并且根据模型输出的反馈信息提出针对性的优化指导.提出了PPR(probability-process-ram)模型, 并在一个通用处理器上建模程序内指令执行和数据传输开销, 其中包括使用模型预测各种指令数量及内存层次之间的数据传输大小去分析程序各个阶段的性能瓶颈, 并且根据模型反馈的信息提出优化方案以及优化后的性能期望.最终使用PPR建模和优化2个计算核心, 同时也比较了与常用的Roofline和ECM模型的区别.






[1]刘雁孝, 吴萍, 孙钦东. 基于区域卷积神经网络的图像秘密共享方案[J]. 计算机研究与发展, 2021, 58(5): 1065-1074.
[2]李腾, 乔伟, 张嘉伟, 高怿旸, 王申奥, 沈玉龙, 马建峰. 隐私保护的基于图卷积神经网络的攻击溯源方法[J]. 计算机研究与发展, 2021, 58(5): 1006-1020.
[3]周航, 詹永照, 毛启容. 基于时空融合图网络学习的视频异常事件检测[J]. 计算机研究与发展, 2021, 58(1): 48-59.
[4]陈可佳, 鲁浩, 张嘉俊. 条件变分时序图自编码器[J]. 计算机研究与发展, 2020, 57(8): 1663-1673.
[5]陈亦琦, 钱铁云, 李万理, 梁贻乐. 基于复合关系图卷积的属性网络嵌入方法[J]. 计算机研究与发展, 2020, 57(8): 1674-1682.
[6]林培光, 周佳倩, 温玉莲. SCONV:一种基于情感分析的金融市场趋势预测方法[J]. 计算机研究与发展, 2020, 57(8): 1769-1778.
[7]李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[8]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[9]于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530.
[10]李曈, 马伟, 徐士彪, 张晓鹏. 适应立体匹配任务的端到端深度网络[J]. 计算机研究与发展, 2020, 57(7): 1531-1538.
[11]王庆林, 李东升, 梅松竹, 赖志权, 窦勇. 面向飞腾多核处理器的Winograd快速卷积算法优化[J]. 计算机研究与发展, 2020, 57(6): 1140-1151.
[12]张蕊, 李锦涛. 基于深度学习的场景分割算法研究综述[J]. 计算机研究与发展, 2020, 57(4): 859-875.
[13]刘烨, 黄金筱, 马于涛. 基于混合神经网络和注意力机制的软件缺陷自动分派方法[J]. 计算机研究与发展, 2020, 57(3): 461-473.
[14]杜鹏, 丁世飞. 基于混合词向量深度学习模型的DGA域名检测方法[J]. 计算机研究与发展, 2020, 57(2): 433-446.
[15]贾子钰, 林友芳, 刘天航, 杨凯昕, 张鑫旺, 王晶. 基于多尺度特征提取与挤压激励模型的运动想象分类方法[J]. 计算机研究与发展, 2020, 57(12): 2481-2489.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4378
相关话题/计算机 优化 计算 程序 中国科学院

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 面向高性能图计算的高效高层次综合方法
    汤嘉武,郑龙,廖小飞,金海(华中科技大学计算机科学与技术学院武汉430074);(大数据技术与系统国家地方联合工程研究中心(华中科技大学)武汉430074);(服务计算技术与系统教育部重点实验室(华中科技大学)武汉430074);(集群与网格计算湖北省重点实验室(华中科技大学)武汉430074)(j ...
    本站小编 Free考研考试 2022-01-01
  • 基于双向位图的CSR大规模图存储优化
    甘新标,谭雯,刘杰(国防科技大学计算机学院长沙430017)(xinbiaogan@nudt.edu.cn)出版日期:2021-03-01基金资助:国家数值风洞项目(NNW2019ZT6-B21,NNW2019ZT6-B20,NNW2019ZT5-A10);国家重点研发计划项目(2018YFB020 ...
    本站小编 Free考研考试 2022-01-01
  • 一种融合程序员和神经网络的自动化程序生成方法
    周鹏1,2,武延军1,3,赵琛1,31(中国科学院软件研究所北京100190);2(中国科学院大学北京100049);3(计算机科学国家重点实验室(中国科学院软件研究所)北京100190)(zhoupengwork01@163.com)出版日期:2021-03-01基金资助:中国科学院战略性先导科技 ...
    本站小编 Free考研考试 2022-01-01
  • 基于蚁群优化算法的纠删码存储系统数据更新方案
    李乾,胡玉鹏,叶振宇,肖叶,秦拯(湖南大学信息科学与工程学院长沙410082)(qianli160@hnu.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(61872130,61572181);湖南省交通厅科技项目(201928);长沙市重点研发计划项目(kq190710 ...
    本站小编 Free考研考试 2022-01-01
  • 基于持久化内存的索引设计重新思考与优化
    韩书楷,熊子威,蒋德钧,熊劲(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(hanshukai@ict.ac.cn)出版日期:2021-02-01基金资助:国家重点研发计划项目(2018YFB1003303);中国科学院战略性先导科技专 ...
    本站小编 Free考研考试 2022-01-01
  • 基于在网计算加速的拜占庭容错算法
    杨帆1,2,张鹏1,2,王展1,元国军1,安学军11(中国科学院计算技术研究所北京100190);2(中国科学院大学北京100049)(yangfan@ncic.ac.cn)出版日期:2021-01-01基金资助:国家重点研发计划项目(2018YFB0204400,2016YFB0200205);国 ...
    本站小编 Free考研考试 2022-01-01
  • 基于已有实例的Linux驱动程序前向移植接口补丁推荐
    李斌1,2,贺也平1,2,3,马恒太1,2,芮建武1,21(中国科学院大学北京100049);2(中国科学院软件研究所基础软件国家工程研究中心北京100190);3(计算机科学国家重点实验室(中国科学院软件研究所)北京100190)(libin@iscas.ac.cn)出版日期:2021-01-01 ...
    本站小编 Free考研考试 2022-01-01
  • 一种面向边缘计算的高效异步联邦学习机制
    芦效峰1,廖钰盈1,PietroLio2,PanHui31(北京邮电大学网络空间安全学院北京100876);2(剑桥大学计算机实验室英国剑桥CB30FD);3(香港科技大学计算机科学与工程学院香港999077)(luxf@bupt.edu.cn)出版日期:2020-12-01基金资助:国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 基于超图的EBSN个性化推荐及优化算法
    于亚新,张文超,李振国,李莹(东北大学计算机科学与工程学院沈阳110169)(医学影像智能计算教育部重点实验室(东北大学)沈阳110169)(yuyx@mail.neu.edu.cn)出版日期:2020-12-01基金资助:国家自然科学基金项目(61871106,61973059);国家重点研发计划 ...
    本站小编 Free考研考试 2022-01-01
  • 飞腾处理器上向量三角函数的设计实现与优化
    沈洁,龙标,姜浩,黄春(国防科技大学计算机学院长沙410073)(j.shen@nudt.edu.cn)出版日期:2020-12-01基金资助:“核高基”国家科技重大专项基金项目(2018ZX01029-103);国家自然科学基金项目(61902407);湖南省自然科学基金资助项目(2018JJ36 ...
    本站小编 Free考研考试 2022-01-01