删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于ARM+FPGA异构平台的目标检测加速模块设计与实现

本站小编 Free考研考试/2023-11-25

基于ARM+FPGA异构平台的目标检测加速模块设计与实现

李放1, 曹健1,?, 李普1, 谢豪1, 赵雄波2, 王源3,?, 张兴1,?
1. 北京大学软件与微电子学院, 北京 1026002. 北京航天自动控制研究所, 北京 1000703. 北京大学集成电路学院, 北京 100871
收稿日期:2021-12-20修回日期:2022-05-18出版日期:2022-11-20发布日期:2022-11-20
通讯作者:曹健, E-mail: caojian(at)ss.pku.edu.cn, 王源, E-mail: wangyuan(at)pku.edu.cn,张兴, E-mail: zhx(at)pku.edu.cn

基金资助:国家重点研发计划项目(2018YFE0203801)资助

Design and Implementation of Object Detection Acceleration ModuleBased on an ARM+FPGA Heterogeneous Platform

LI Fang1, CAO Jian1,?, LI Pu1, XIE Hao1, ZHAO Xiongbo2, WANG Yuan3,?, ZHANG Xing1,?
1. School of Software & Microelectronics, Peking University, Beijing 1026002. Beijing Aerospace Automatic Control Institute, Beijing 1000703. School of Integrated Circuits, Peking University, Beijing 100871
Received:2021-12-20Revised:2022-05-18Online:2022-11-20Published:2022-11-20
Contact:CAO Jian, E-mail: caojian(at)ss.pku.edu.cn, WANG Yuan, E-mail: wangyuan(at)pku.edu.cn,ZHANG Xing, E-mail: zhx(at)pku.edu.cn






摘要/Abstract


摘要: 为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题, 以YOLO目标检测模型为例, 设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型, 在FPGA实现神经网络前向推理加速, 在ARM中实现加速器调度。实验结果表明, 部署至Xilinx ZCU102开发板上, 该模块在200 MHz工作频率下, 平均计算性能达到425.8 GOP/s, 推理压缩模型速度达到30.3 fps, 模块功耗为3.56 W, 证明该加速模块具备可配置性。

引用本文



李放, 曹健, 李普, 谢豪, 赵雄波, 王源, 张兴. 基于ARM+FPGA异构平台的目标检测加速模块设计与实现[J]. 北京大学学报自然科学版, 2022, 58(6): 1035-1041.
LI Fang, CAO Jian, LI Pu, XIE Hao, ZHAO Xiongbo, WANG Yuan, ZHANG Xing. Design and Implementation of Object Detection Acceleration ModuleBased on an ARM+FPGA Heterogeneous Platform[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1035-1041.





PDF全文下载地址:

http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3808
相关话题/

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19