删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于Intel平台的Winograd快速卷积算法研究与优化

本站小编 Free考研考试/2022-01-01

武铮,安虹,金旭,迟孟贤,吕国锋,文可,周鑫
(中国科学技术大学 合肥 230022) (zhengwu@mail.ustc.edu.cn)
出版日期: 2019-04-01


基金资助:国家自然科学基金项目(61520106005,61761136014);国家重点研发计划项目(2017YFB1010000)

Research and Optimization of Fast Convolution Algorithm Winograd on Intel Platform

Wu Zheng, An Hong, Jin Xu, Chi Mengxian, Lü Guofeng, Wen Ke, Zhou Xin
(University of Science and Technology of China, Hefei 230022)
Online: 2019-04-01







摘要/Abstract


摘要: 随着深度学习的快速发展,其在语音处理、图像识别和自然语言理解等领域被广泛应用,为科研产业以及日常生活带去了巨大的变革.Intel紧跟深度学习的浪潮,推出了第2代Xeon Phi处理器KNL(knights landing),其后又发布了第3代Xeon Phi处理器KNM(knights mill),为深度学习的蓬勃发展带去了新的活力.通过在Intel平台上进行快速卷积算法Winograd的研究与优化,对比Intel MKL(math kernel library) DNN(deep neural network)中的卷积性能,推动Intel MKL DNN中深度神经网络接口的完善以及Intel平台上深度学习的发展.研究中结合Intel最新深度学习平台的AVX-512指令集、高速内存MCDRAM、多Memory/SNC模式、二维网格状内核结构等特性,并通过对内存分配、数据调度等情况的分析,设计优化Winograd算法,一方面选取典型的卷积神经网络(convolutional neural network, CNN)网络模型VGG19,测试对比Intel MKL DNN的卷积实现,最终取得了2倍多的性能加速比;另一方面,通过测试常用卷积类型,对比Intel MKL DNN和NVIDIA cuDNN,验证了实现的Winograd对于常用卷积类型具有很好的适用性且具有实际使用价值.该研究工作期望为Intel平台在深度学习领域的发展提供重要的指导意义.






[1]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538.
[3]付章杰, 李恩露, 程旭, 黄永峰, 胡雨婷. 基于深度学习的图像隐写研究进展[J]. 计算机研究与发展, 2021, 58(3): 548-568.
[4]古天龙, 冯旋, 李龙, 包旭光, 李云辉. 基于社会新闻数据集的伦理行为判别方法[J]. 计算机研究与发展, 2021, 58(2): 253-263.
[5]陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280.
[6]李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21.
[7]孟子尧, 谷雪, 梁艳春, 许东, 吴春国. 深度神经架构搜索综述[J]. 计算机研究与发展, 2021, 58(1): 22-33.
[8]朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115.
[9]林培光, 周佳倩, 温玉莲. SCONV:一种基于情感分析的金融市场趋势预测方法[J]. 计算机研究与发展, 2020, 57(8): 1769-1778.
[10]李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[11]李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[12]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[13]胡超文, 邬昌兴, 杨亚连. 基于扩展的S-LSTM的文本蕴含识别[J]. 计算机研究与发展, 2020, 57(7): 1481-1489.
[14]于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530.
[15]王庆林, 李东升, 梅松竹, 赖志权, 窦勇. 面向飞腾多核处理器的Winograd快速卷积算法优化[J]. 计算机研究与发展, 2020, 57(6): 1140-1151.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3911
相关话题/计算机 网络 优化 图像 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于带权词格的循环神经网络句子语义表示建模
    张祥文1,2,陆紫耀1,杨静1,林倩1,卢宇1,王鸿吉1,苏劲松1,21(厦门大学福建厦门361000);2(江苏省计算机信息处理技术重点实验室(苏州大学)江苏苏州215006)(xwzhang@stu.xmu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(615201 ...
    本站小编 Free考研考试 2022-01-01
  • 面向WS-BPEL程序的变异测试优化技术
    孙昌爱1,2,王真1,潘琳11(北京科技大学计算机与通信工程学院北京100083);2(宇航智能控制技术重点实验室北京100854)(casun@ustb.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(61520106005,61761136014);国家重点研发计划项 ...
    本站小编 Free考研考试 2022-01-01
  • 基于网络节点聚类的目标IP城市级定位方法
    李明月1,2,罗向阳1,2,柴理想1,2,袁福祥1,2,甘勇31(中国人民解放军战略支援部队信息工程大学郑州450001);2(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);3(郑州轻工业大学计算机与通信工程学院郑州450001)(lmypretty@ ...
    本站小编 Free考研考试 2022-01-01
  • 基于稀疏框架的静态污点分析优化技术
    王蕾,何冬杰,李炼,冯晓兵(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(wanglei2011@ict.ac.cn)出版日期:2019-03-01基金资助:国家自然科学基金项目(61521092,61432016);国家重点研发计划项 ...
    本站小编 Free考研考试 2022-01-01
  • 基于双线性映射的支持全操作的公共可验证外包数据库模型
    王强,周福才,玄鹏开,吴淇毓(东北大学软件学院沈阳110169)(wangq3635@126.com)出版日期:2019-03-01基金资助:国家自然科学基金项目(61772127,61472184,61321491);国家自然科学基金青年科学基金项目(61703088);中央高校基本科研业务费专项 ...
    本站小编 Free考研考试 2022-01-01
  • 点差分隐私下图数据的度直方图发布方法
    张宇轩1,魏江宏1,李霁1,刘文芬2,胡学先11(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);2(广西密码学与信息安全重点实验室(桂林电子科技大学)广西桂林541004)(bigzhangq@163.com)出版日期:2019-03-01基金资助:国 ...
    本站小编 Free考研考试 2022-01-01
  • 基于智能手机感知数据的心理压力评估方法
    王丰1,2,5,王亚沙1,3,王江涛1,2,熊昊一4,赵俊峰1,2,张大庆1,21(高可信软件技术教育部重点实验室(北京大学)北京100871);2(北京大学信息科学技术学院北京100871);3(北京大学软件工程国家工程研究中心北京100871);4(密苏里科技大学计算机科学系美国密苏里州罗拉65 ...
    本站小编 Free考研考试 2022-01-01
  • 多元数据融合的非干扰身份识别方法
    于佃存1,2,陈益强1,3,彭晓晖1,焦帅1,李啸海1,钟习1,31(中国科学院计算技术研究所北京100190);2(山东大学软件学院济南250101);3(中国科学院大学北京100049)(yudiancun@ict.ac.cn)出版日期:2019-03-01基金资助:国家重点研发计划基金项目(2 ...
    本站小编 Free考研考试 2022-01-01
  • 硬件加速神经网络综述
    陈桂林,马胜,郭阳(国防科技大学计算机学院长沙410073)(cglnudt@163.com)出版日期:2019-02-01基金资助:国家自然科学基金项目(61672526);国防科技大学科研计划项目(ZK17-03-06)SurveyonAcceleratingNeuralNetworkwithH ...
    本站小编 Free考研考试 2022-01-01
  • 基于多目标演化聚类的大规模动态网络社区检测
    李赫,印莹,李源,赵宇海,王国仁(东北大学计算机科学与工程学院沈阳110819)(15040107713@163.com)出版日期:2019-02-01基金资助:国家自然科学基金项目(61772124,61332014);中央高校基本科研业务费专项资金(N150404008,N150402002)L ...
    本站小编 Free考研考试 2022-01-01