删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于粗粒度数据流架构的稀疏卷积神经网络加速

本站小编 Free考研考试/2022-01-01

吴欣欣1,2,3,欧焱1,2,3,李文明1,2,王达1,2,张浩1,2,范东睿1,2,3
1(计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190);2(中国科学院计算技术研究所 北京 100190);3(中国科学院大学计算机科学与技术学院 北京 100049) (wuxinxin@ict.ac.cn)
出版日期: 2021-07-01


基金资助:国家自然科学基金项目(61732018,61872335,61802367,61672499);中国科学院战略性先导科技专项(C类)(XDC05000000);中国科学院国际伙伴计划(171111KYSB20170032);计算机体系结构国家重点实验室创新项目(CARCH4408,CARCH4412)

Acceleration of Sparse Convolutional Neural Network Based on Coarse-Grained Dataflow Architecture

Wu Xinxin1,2,3, Ou Yan1,2,3, Li Wenming1,2, Wang Da1,2, Zhang Hao1,2, Fan Dongrui1,2,3
1(State Key Laboratory of Computer Architecture (Institute of Computing Technology, Chinese Academy of Sciences), Beijing 100190);2(Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190);3(School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 100049)
Online: 2021-07-01


Supported by:This work was supported by the National Natural Science Foundation of China (61732018, 61872335, 61802367, 61672499), the Strategic Priority Research Program of Chinese Academy of Sciences (XDC05000000), the International Partnership Program of Chinese Academy of Sciences (171111KYSB20170032), and the Innovation Project of the State Key Laboratory of Computer Architecture (CARCH4408, CARCH4412).




摘要/Abstract


摘要: 卷积神经网络(convolutional neural network, CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).






[1]欧焱, 冯煜晶, 李文明, 叶笑春, 王达, 范东睿. 面向数据流结构的指令内访存冲突优化研究[J]. 计算机研究与发展, 2019, 56(12): 2720-2732.
[2]向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速[J]. 计算机研究与发展, 2019, 56(6): 1192-1204.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4460
相关话题/网络 计算 计算机 中国科学院 结构

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 一种面向工业边缘计算应用的缓存替换算法
    张雷1,李琳1,陈鸿龙2,Daniel,Bovensiepen31(南京邮电大学物联网学院南京210009);2(中国石油大学(华东)控制科学与工程学院山东青岛266580);3(西门子中国研究院北京100102)(lei.z@njupt.edu.cn)出版日期:2021-07-01基金资助:国家自 ...
    本站小编 Free考研考试 2022-01-01
  • 闪存固态硬盘系统结构与技术
    高聪明1,石亮2,刘凯3,薛春4,舒继武11(清华大学计算机科学与技术系北京100083);2(华东师范大学计算机科学与技术学院上海200062);3(重庆大学计算机学院重庆400044);4(香港城市大学计算机系香港999077)(gaocm92@gmail.com)出版日期:2021-07-01 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机芯片关键技术前沿与进展专题前言
    出版日期:2021-06-01Online:2021-06-01摘要/Abstract摘要:“计算机体系结构前沿技术2021”专题———“计算机芯片关键技术前沿与进展”,集中介绍计算机芯片设计、测试、验证方面的新理论、新技术,以及新型部件和新型芯片系统.本专题包括关于处理器芯片敏捷设计和类脑计算的2 ...
    本站小编 Free考研考试 2022-01-01
  • 实现软硬件解耦合的类脑计算硬件设计方法
    渠鹏1,2,陈嘉杰1,张悠慧1,郑纬民11(清华大学计算机科学与技术系,北京信息科学与技术国家研究中心北京100084);2(数学工程与先进计算国家重点实验室江苏无锡214125)(shen_yhx@163.com)出版日期:2021-06-01基金资助:国家自然科学基金项目(62050340);数 ...
    本站小编 Free考研考试 2022-01-01
  • 图神经网络加速结构综述
    李涵1,2,严明玉1,2,吕征阳1,2,李文明1,叶笑春1,范东睿1,2,唐志敏1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学北京100049)(lihan-ams@ict.ac.cn)出版日期:2021-06-01基金资助:国家自然科学基金 ...
    本站小编 Free考研考试 2022-01-01
  • 一种自主设计的面向E级高性能计算的异构融合加速器
    刘胜,卢凯,郭阳,刘仲,陈海燕,雷元武,孙海燕,杨乾明,陈小文,陈胜刚,刘必慰,鲁建壮(国防科技大学计算机学院长沙410073)(liusheng83@nudt.edu.cn)出版日期:2021-06-01基金资助:国家重点研发计划项目(2018YFB0204301课题1)ASelf-Designe ...
    本站小编 Free考研考试 2022-01-01
  • 枫林一号:一款面向高端装备定制的低功耗时间敏感网络芯片
    全巍,付文文,孙志刚,李韬(国防科技大学计算机学院长沙410073)(w.quan@nudt.edu.cn)出版日期:2021-06-01基金资助:国家自然科学基金项目(61802417,91938301);之江实验室开放课题(2020LE0AB01)HX-DS09:ACustomizedLowPo ...
    本站小编 Free考研考试 2022-01-01
  • 面向云网融合的细粒度多接入边缘计算架构
    王璐1,张健浩1,王廷2,伍楷舜11(深圳大学计算机与软件学院广东深圳518060);2(上海市高可信计算重点实验室(华东师范大学)上海200062)(wanglu@szu.edu.cn)出版日期:2021-06-01基金资助:国家自然科学基金项目(61872246,U2001207,6187224 ...
    本站小编 Free考研考试 2022-01-01
  • 一种减少网络振动的智能路由选择算法设计
    邵天竺,王晓亮,陈文龙,唐晓岚,徐敏(首都师范大学信息工程学院北京100048)(nestea_god@hotmail.com)出版日期:2021-06-01基金资助:国家重点研发计划项目(2018YFB1800403);国家自然科学基金项目(61872252);北京市自然科学基金项目(420201 ...
    本站小编 Free考研考试 2022-01-01
  • 支持网络切片和绿色通信的软件定义虚拟化接入网
    王廷1,2,刘刚31(华东师范大学软件工程学院上海200062);2(上海市高可信计算重点实验室(华东师范大学)上海200062);3(上海诺基亚贝尔股份有限公司贝尔实验室上海201206)(twang@sei.ecnu.edu.cn)出版日期:2021-06-01SoftwareDefinedVi ...
    本站小编 Free考研考试 2022-01-01