基于细粒度数据流架构的稀疏神经网络全连接层加速

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-01

向陶然^1,2，叶笑春¹，李文明¹，冯煜晶^1,2，谭旭^1,2，张浩¹，范东睿^1,2

¹（计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190）；²（中国科学院大学北京 100049) (xiangtaoran@ict.ac.cn)

出版日期: 2019-06-01

基金资助:国家重点研发计划项目(2018YFB1003501)；国家自然科学基金项目(61732018,61872335,61802367)；中国科学院国际伙伴计划(171111KYSB20170032)；计算机体系结构国家重点实验室创新项目(CARCH3303,CARCH3407,CARCH3502,CARCH3505)

Accelerating Fully Connected Layers of Sparse Neural Networks with Fine-Grained Dataflow Architectures

Xiang Taoran^1,2, Ye Xiaochun¹, Li Wenming¹, Feng Yujing^1,2, Tan Xu^1,2 , Zhang Hao¹， Fan Dongrui^1,2

¹（State Key Laboratory of Computer Architecture (Institute of Computing Technology, Chinese Academy of Sciences), Beijing 100190）；²（University of Chinese Academy of Sciences, Beijing 100049)

Online: 2019-06-01

Supported by:This work was supported by the National Key Research and Development Plan of China (2018YFB1003501), the National Natural Science Foundation of China (61732018, 61872335, 61802367), the International Partnership Program of Chinese Academy of Sciences (171111KYSB20170032), and the Innovation Project of the State Key Laboratory of Computer Architecture (CARCH3303, CARCH3407, CARCH3502, CARCH3505).

摘要/Abstract

摘要： 深度神经网络(deep neural network, DNN)是目前最先进的图像识别算法，被广泛应用于人脸识别、图像识别、文字识别等领域.DNN具有极高的计算复杂性，为解决这个问题，近年来涌出了大量可以并行运算神经网络的硬件加速器.但是，DNN中的全连接层有大量的权重参数，对加速器的带宽提出了很高的要求.为了减轻加速器的带宽压力，一些DNN压缩算法被提出.然而基于FPGA和ASIC的DNN专用加速器，通常是通过牺牲硬件的灵活性获得更高的加速比和更低的能耗，很难实现稀疏神经网络的加速.而另一类基于CPU，GPU的CNN加速方案虽然较为灵活，但是带来很高的能耗.细粒度数据流体系结构打破了传统的控制流结构的限制，展示出了加速DNN的天然优势，它在提供高性能的运算能力的同时也保持了一定的灵活性.为此，提出了一种在基于细粒度数据流体系结构的硬件加速器上加速稀疏的DNN全连接层的方案.该方案相较于原有稠密的全连接层的计算减少了2.44×~ 6.17×的峰值带宽需求.此外细粒度数据流加速器在运行稀疏全连接层时的计算部件利用率远超过其他硬件平台对稀疏全连接层的实现，平均比CPU，GPU和mGPU分别高了43.15%，34.57%和44.24%.

参考文献

相关文章 1

[1]	申毅杰, 曾丹, 熊劲. 基于收益模型的Spark SQL数据重用机制[J]. 计算机研究与发展, 2020, 57(2): 318-332.

PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3944

相关话题/计算 计算机 方案 实验室 中国科学院

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于CNN噪声分离模型的噪声水平估计算法
徐少平,刘婷云,李崇禧,唐祎玲,胡凌燕(南昌大学信息工程学院南昌330031)(xushaoping@ncu.edu.cn)出版日期:2019-05-01基金资助:国家自然科学基金项目(61662044,61163023,51765042)；江西省自然科学基金项目(20171BAB202017)No ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
高效低存储开销可验证外包求解大规模线性方程组方案
冯达,周福才,王强,吴淇毓(东北大学软件学院沈阳110169)(dfengneu@gmail.com)出版日期:2019-05-01基金资助:国家自然科学基金项目(61772127,61472184)；国家科技重大专项基金项目(2013ZX03002006)；辽宁省科技攻关项目(2013217004 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
轻量级窄带物联网应用系统中高效可验证加密方案
钱涵佳1,王宜怀1,2,彭涛1,陈成1,罗喜召11(苏州大学计算机科学与技术学院江苏苏州215006);2(苏州市嵌入式技术及应用重点实验室(苏州大学)江苏苏州215006)(20164227026@stu.suda.edu.cn)出版日期:2019-05-01基金资助:国家自然科学基金项目(616 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
纠删码存储系统中基于网络计算的高效故障重建方法
唐英杰,王芳,谢燕文(武汉光电国家研究中心(华中科技大学)武汉430074)(信息存储系统教育部重点实验室(华中科技大学)武汉430074)(深圳华中科技大学研究院广东深圳518000)(tangyingjie@mail.hust.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
一种基于斯格明子介质的高效存内计算框架
刘必成,顾海峰,陈铭松,谷守珍,陈闻杰(上海市高可信计算重点实验室(华东师范大学)上海200062)(51151500030@stu.ecnu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(61520106005，61761136014)；国家重点研发计划项目(2017 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
划分序乘积空间：基于划分的粒计算模型
徐怡1,2,姚一豫31(计算智能与信号处理教育部重点实验室(安徽大学)合肥230039);2(安徽大学计算机科学与技术学院合肥230601);3(里贾纳大学计算机科学系加拿大里贾纳S4S0A2)(xuyi1023@126.com)出版日期:2019-04-01基金资助:国家自然科学基金项目(6152 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于聚类索引的多关键字排序密文检索方案
杜瑞忠,李明月,田俊峰(河北大学网络空间安全与计算机学院河北保定071002)(河北省高可信信息系统重点实验室(河北大学)河北保定071002)(drzh@hbu.edu.cn)出版日期:2019-03-01基金资助:国家自然科学基金项目(61170254,60873203)；河北省自然科学基金项目 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
主编寄语--纪念《计算机研究与发展》创刊六十周年
徐志伟(中国科学院计算技术研究所北京100190)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要：时光荏苒，《计算机研究与发展》已经走过六十年，其前身为《电子计算机动态》，创刊于1958年12月，是我国第一个计算机刊物。当时我国的计算机事业刚刚起步，《电子 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
面向云存储的支持完全外包属性基加密方案
赵志远1,王建华1,2,徐开勇1,郭松辉11(中国人民解放军信息工程大学郑州450001);2(空军电子技术研究所北京100195)(zzy_taurus@foxmail.com)出版日期:2019-02-01基金资助:国家“九七三”重点基础研究发展计划基金项目(2013CB338000)；国家重点 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
图计算中基于一致性约束条件的迭代模型研究
孙茹君1,张鲁飞1,郝子宇1,陈左宁21(数学工程与先进计算国家重点实验室江苏无锡214125);2(国家并行计算机工程技术研究中心北京100190)(sun.rujun@meac-skl.cn)出版日期:2019-02-01基金资助:国家自然科学基金项目(9143020017)；国家重点研发计划项 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01