基于可融合残差卷积块的深度神经网络模型层剪枝方法
徐鹏涛, 曹健?, 孙文宇, 李普, 王源, 张兴? 北京大学软件与微电子学院, 北京 102600收稿日期:
2021-09-30修回日期:
2021-12-04出版日期:
2022-09-20基金资助:
国家重点研发计划(2018YFE0203801)资助Layer Pruning via Fusible Residual Convolutional Blockfor Deep Neural Networks
XU Pengtao, CAO Jian?, SUN Wenyu, LI Pu, WANG Yuan, ZHANG Xing? School of Software and Microelectronics, Peking University, Beijing 102600Received:
2021-09-30Revised:
2021-12-04Published:
2022-09-20摘要/Abstract
摘要: 针对当前主流的剪枝方法所获得的压缩模型推理时间较长和效果较差的问题, 提出一种易用且性能优异的层剪枝方法。该方法将原始卷积层转化为可融合残差卷积块, 然后通过稀疏化训练的方法实现层剪枝, 得到一种具有工程易用性的层剪枝方法, 兼具推理时间短和剪枝效果好的优点。实验结果表明, 在图像分类任务和目标检测任务中, 该方法可使模型在精度损失较小的情况下获得极高的压缩率, 优于先进的卷积核剪枝方法。
引用本文
徐鹏涛, 曹健, 孙文宇, 李普, 王源, 张兴. 基于可融合残差卷积块的深度神经网络模型层剪枝方法[J]. 北京大学学报自然科学版, 2022, 58(5): 801-807.
XU Pengtao, CAO Jian, SUN Wenyu, LI Pu, WANG Yuan, ZHANG Xing. Layer Pruning via Fusible Residual Convolutional Blockfor Deep Neural Networks[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 801-807.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3782