删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向飞腾多核处理器的Winograd快速卷积算法优化

本站小编 Free考研考试/2022-01-01

王庆林,李东升,梅松竹,赖志权,窦勇
(国防科技大学并行与分布处理国防科技重点实验室 长沙 410073) (国防科技大学计算机学院 长沙 410073) (wangqinglin@nudt.edu.cn)
出版日期: 2020-06-01


基金资助:“核高基”国家科技重大专项基金项目(2018ZX01028101)

Optimizing Winograd-Based Fast Convolution Algorithm on Phytium Multi-Core CPUs

Wang Qinglin, Li Dongsheng, Mei Songzhu, Lai Zhiquan, Dou Yong
(Science and Technology on Parallel and Distributed Processing Laboratory, National University of Defense Technology, Changsha 410073) (College of Computer, National University of Defense Technology, Changsha 410073)
Online: 2020-06-01


Supported by:This work was supported by the National Science and Technology Major Projects of Hegaoji (2018ZX01028101).




摘要/Abstract


摘要: 随着深度学习的快速发展,卷积神经网络已广泛应用于计算机视觉、自然语言处理等人工智能领域中.Winograd快速卷积算法因能有效降低卷积神经网络中卷积操作的计算复杂度而受到广泛关注.随着国防科技大学自主研制的飞腾多核处理器在智能领域的推广应用,对面向飞腾多核处理器的高性能卷积实现提出了强烈需求.针对飞腾多核处理器的体系结构特征与Wingorad快速卷积算法的计算特点,提出了一种高性能并行Winograd快速卷积算法.该算法不依赖通用矩阵乘库函数,由卷积核转换、输入特征图转换、逐元素乘、输出特征图逆变换等4个部分构成,融合设计了4个部分的数据操作,并设计了与之配套的数据布局、多级并行数据转换算法与多级并行矩阵乘算法,实现访存性能以及算法整体性能的提升.在两款飞腾多核处理器上的测试结果显示,与开源库ACL和NNPACK中的Winograd快速卷积实现相比,该算法分别能获得1.05~16.11倍与1.66~16.90倍的性能加速;集成到开源框架Mxnet后,该算法使得VGG16网络的前向计算获得了3.01~6.79倍的性能加速.






[1]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538.
[3]付章杰, 李恩露, 程旭, 黄永峰, 胡雨婷. 基于深度学习的图像隐写研究进展[J]. 计算机研究与发展, 2021, 58(3): 548-568.
[4]古天龙, 冯旋, 李龙, 包旭光, 李云辉. 基于社会新闻数据集的伦理行为判别方法[J]. 计算机研究与发展, 2021, 58(2): 253-263.
[5]陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280.
[6]李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21.
[7]孟子尧, 谷雪, 梁艳春, 许东, 吴春国. 深度神经架构搜索综述[J]. 计算机研究与发展, 2021, 58(1): 22-33.
[8]朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115.
[9]林培光, 周佳倩, 温玉莲. SCONV:一种基于情感分析的金融市场趋势预测方法[J]. 计算机研究与发展, 2020, 57(8): 1769-1778.
[10]李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[11]李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[12]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[13]胡超文, 邬昌兴, 杨亚连. 基于扩展的S-LSTM的文本蕴含识别[J]. 计算机研究与发展, 2020, 57(7): 1481-1489.
[14]于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530.
[15]成科扬, 王宁, 师文喜, 詹永照. 深度学习可解释性研究进展[J]. 计算机研究与发展, 2020, 57(6): 1208-1217.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4191
相关话题/计算机 数据 国防科技大学 网络 计算

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于Spark的大数据访存行为跨层分析工具
    许丹亚1,王晶1,2,王利3,张伟功2,31(首都师范大学信息工程学院北京100048);2(高可靠嵌入式技术北京市工程研究中心(首都师范大学)北京100048);3(北京成像理论与技术高精尖创新中心(首都师范大学)北京100048)(xudanya@cnu.edu.cn)出版日期:2020-06- ...
    本站小编 Free考研考试 2022-01-01
  • FPGA图计算的编程与开发环境:综述和探索
    郭进阳,邵传明,王靖,李超,朱浩瑾,过敏意(上海交通大学电子信息与电气工程学院上海200240)(lazarus@sjtu.edu.cn)出版日期:2020-06-01基金资助:国家重点研发计划项目(2018YFB1003500)ProgrammingandDevelopingEnvironment ...
    本站小编 Free考研考试 2022-01-01
  • 面向高通量计算机的图算法优化技术
    张承龙1,2,曹华伟1,王国波1,2,郝沁汾1,张洋1,叶笑春1,范东睿1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学计算机与控制学院北京100049)(caohuawei@ict.ac.cn)出版日期:2020-06-01基金资助:国家重点 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多视角RGB-D图像帧数据融合的室内场景理解
    李祥攀1,张彪1,孙凤池2,刘杰31(南开大学计算机学院天津300750);2(南开大学软件学院天津300750);3(南开大学人工智能学院天津300750)(xiangpan.li@qq.com)出版日期:2020-06-01基金资助:国家自然科学基金项目(61873327)IndoorScene ...
    本站小编 Free考研考试 2022-01-01
  • 基于Jacobi ADMM的传感网分布式压缩感知数据重构算法
    李国瑞1,孟婕1,彭三城2,王聪11(东北大学计算机科学与工程学院沈阳110819);2(广东外语外贸大学语言工程与计算实验室广州510006)(lgr@neuq.edu.cn)出版日期:2020-06-01基金资助:国家自然科学基金项目(61876205);中央高校基本科研业务费专项资金(N172 ...
    本站小编 Free考研考试 2022-01-01
  • RGNE:粗糙粒化的网络嵌入式重叠社区发现方法
    赵霞1,张泽华1,张晨威2,李娴11(太原理工大学信息与计算机学院太原030024);2(伊利诺伊大学芝加哥分校计算机科学学院美国芝加哥60607)(zhaoxiazzzz@163.com)出版日期:2020-06-01基金资助:国家自然科学基金项目(61503273,61702356);国家留学基 ...
    本站小编 Free考研考试 2022-01-01
  • 算礼:探索计算系统的可分析抽象
    徐志伟,王一帆,赵永威,李春典(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(zxu@ict.ac.cn)出版日期:2020-05-01基金资助:国家重点研发计划项目(2016YFB1000200);国家自然科学基金重点项目(61532 ...
    本站小编 Free考研考试 2022-01-01
  • 融合多元信息的多关系社交网络节点重要性研究
    罗浩1,闫光辉1,张萌1,包峻波1,李俊成1,刘婷1,杨波2,魏军21(兰州交通大学电子与信息工程学院兰州730070);2(国网甘肃省电力公司信通公司兰州730050)(luoh382@163.com)出版日期:2020-05-01基金资助:国家自然科学基金项目(61662066,61163010 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多级注意力机制网络的app流行度预测
    张艺璇,郭斌,刘佳琪,欧阳逸,於志文(西北工业大学计算机学院西安710029)(zhangyixuan2014@mail.nwpu.edu.cn)出版日期:2020-05-01基金资助:国家重点研发计划项目(2017YFB1001803);国家自然科学基金项目(61772428,61725205)a ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算可信协同服务策略建模
    乐光学,戴亚盛,杨晓慧,刘建华,游真旭,朱友康(嘉兴学院数理与信息工程学院浙江嘉兴314001)(ygx_9018@163.com)出版日期:2020-05-01基金资助:国家自然科学基金项目(61572014)ModelofTrustedCooperativeServiceforEdgeCompu ...
    本站小编 Free考研考试 2022-01-01