删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向深度神经网络加速芯片的高效硬件优化策略

本站小编 Free考研考试/2022-01-03

张萌1,
张经纬1,,,
李国庆1,
吴瑞霞1,
曾晓洋2
1.东南大学电子学院国家专用集成电路系统工程技术研究中心 南京 210096
2.复旦大学专用集成电路与系统国家重点实验室 上海 200433
基金项目:国家重点研发计划(2018YFB2202703),江苏省自然科学基金(BK20201145)

详细信息
作者简介:张萌:男,1964年生,研究员,研究方向为数字信号处理、深度学习算法及硬件加速
张经纬:男,1997年生,硕士生,研究方向为深度学习硬件加速器设计
李国庆:男,1991年生,博士生,研究方向为计算机视觉和深度学习硬件加速器设计
吴瑞霞:女,1996年生,硕士生,研究方向为深度学习算法
曾晓洋:男,1972年生,教授,研究方向为高能效系统芯片(SoC)
通讯作者:张经纬 zhangjingwei@seu.edu.cn
中图分类号:TN79.1

计量

文章访问数:320
HTML全文浏览量:164
PDF下载量:93
被引次数:0
出版历程

收稿日期:2021-01-04
修回日期:2021-04-21
网络出版日期:2021-04-29
刊出日期:2021-06-18

Efficient Hardware Optimization Strategies for Deep Neural Networks Acceleration Chip

Meng ZHANG1,
Jingwei ZHANG1,,,
Guoqing LI1,
Ruixia WU1,
Xiaoyang ZENG2
1. National ASIC Engineering Center, School of Electronic Sci. and Eng., Southeast University, Nanjing 210096, China
2. National ASIC Key Laboratory, Fudan University, Shanghai 200433, China
Funds:The National Key R&D Program of China(2018YFB2202703), Jiangsu Province of Natural Science and Technology(BK20201145)


摘要
摘要:轻量级神经网络部署在低功耗平台上的解决方案可有效用于无人机(UAV)检测、自动驾驶等人工智能(AI)、物联网(IOT)领域,但在资源有限情况下,同时兼顾高精度和低延时来构建深度神经网络(DNN)加速器是非常有挑战性的。该文针对此问题提出一系列高效的硬件优化策略,包括构建可堆叠共享计算引擎(PE)以平衡不同卷积中数据重用和内存访问模式的不一致;提出了可调的循环次数和通道增强方法,有效扩展加速器与外部存储器之间的访问带宽,提高DNN浅层网络计算效率;优化了预加载工作流,从整体上提高了异构系统的并行度。经Xilinx Ultra96 V2板卡验证,该文的硬件优化策略有效地改进了iSmart3-SkyNet和SkrSkr-SkyNet类的DNN加速芯片设计。结果显示,优化后的加速器每秒处理78.576帧图像,每幅图像的功耗为0.068 J。
关键词:深度神经网络/
目标检测/
神经网络加速器/
低功耗/
硬件优化
Abstract:Lightweight neural networks deployed on low-power platforms have proven to be effective solutions for Artificial Intelligence (AI) and Internet Of Things (IOT) domains such as Unmanned Aerial Vehicle (UAV) detection and unmanned driving. However, in the case of limited resources, it is very challenging to build Deep Neural Networks (DNN) accelerator with both high precision and low delay. In this paper, a series of efficient hardware optimization strategies are proposed, including stackable shared Processing Engine (PE) to balance the inconsistency of data reuse and memory access patterns in different convolutions; Regulable loop parallelism and channel augmentation are proposed to increase effectively the access bandwidth between accelerator and external memory. It also improve the efficiency of DNN shallow layers computing; Pre-Workflow is applied to improve the overall parallelism of heterogeneous systems. Verified by Xilinx Ultra96 V2 board, the hardware optimization strategies in this paper improve effectively the design of DNN acceleration chips like iSmart3-SkyNet and SkrSkr-SkyNet. The results show that the optimized accelerator processes 78.576 frames per second, and the power consumption of each picture is 0.068 Joules.
Key words:Deep Neural Networks (DNN)/
Object detection/
Neural network accelerator/
Low power consumption/
Hardware optimization



PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=e9c5238d-7319-4f09-be16-6c3d80d0af98
相关话题/优化 设计 系统 网络 图像

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于FPGA的水平集图像分割算法加速器
    刘野,肖剑彪,吴飞,常亮,周军,电子科技大学成都611731基金项目:国家自然科学基金委员会-中国工程物理研究院NSAF联合基金(U2030204)详细信息作者简介:刘野:男,1991年生,博士生,研究方向为图像处理算法与芯片协同设计肖剑彪:男,1998年生,硕士生,研究方向为智能感知专用处理芯片设 ...
    本站小编 Free考研考试 2022-01-03
  • 基于异构忆阻器的1T2M多值存储交叉阵列设计
    孙晶茹1,,,李梦圆1,康可欣1,邾少鹏2,SunYichuang31.湖南大学信息科学与工程学院长沙4100822.北京邮电大学电子工程学院北京1000893.英国赫特福德大学物理工程与计算机科学学院哈特菲尔德英国AL109AB基金项目:国家自然科学基金重大研究计划(91964108),国家自然科 ...
    本站小编 Free考研考试 2022-01-03
  • 单光子探测盖革雪崩焦平面用低抖动多相位时钟电路设计
    刘煦1,2,3,李云铎1,2,3,叶联华1,2,3,黄张成1,2,马英杰1,2,黄松垒1,2,,,方家熊1,21.中国科学院上海技术物理研究所传感技术联合国家重点实验室上海2000832.中国科学院上海技术物理研究所中国科学院红外成像材料与器件重点实验室上海2000833.中国科学院大学北京1000 ...
    本站小编 Free考研考试 2022-01-03
  • 基于粒子群算法的LCLC谐振变换器优化设计
    赵斌1,王刚1,2,,,宋婧妍1,2,刘雅琳11.中国科学院空天信息创新研究院高功率微波源与技术重点实验室北京1001902.中国科学院大学北京100039详细信息作者简介:赵斌:男,1988年生,研究员,研究方向为高压、高频变换器以及高频磁性元器件王刚:男,1971年生,研究员,研究方向为高压电源 ...
    本站小编 Free考研考试 2022-01-03
  • 基于改进简化实频技术的超宽带功率放大器设计
    刘国华,,周国祥,郭灿天赐,程知群杭州电子科技大学射频电路与系统教育部重点实验室杭州310018基金项目:国家自然科学基金(91938201,61871169);浙江省自然科学基金(LZ20F010004)详细信息作者简介:刘国华:男,1975年生,博士,副教授,研究方向为射频功率放大器设计周国祥: ...
    本站小编 Free考研考试 2022-01-03
  • 一种异构网络多协议并行数据分发方法
    刘建航1,,,武万萍1,王树庆1,李世宝1,张玉成21.中国石油大学(华东)计算机与通信工程学院青岛2665802.中国科学院智能农业机械装备工程实验室北京100190基金项目:国家自然科学基金(61972417),山东省自然科学基金(ZR201911070168),中央高校基本科研业务费专项资金( ...
    本站小编 Free考研考试 2022-01-03
  • 异构云无线接入网下基于功率域NOMA的能效优化算法
    唐伦,李子煜,,管令进,陈前斌1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信技术重点实验室重庆400065基金项目:国家自然科学基金(62071078),重庆市教委科学技术研究项目(KJZD-M201800601),重庆市重大主题专项项目(cstc2019jscx-zdz ...
    本站小编 Free考研考试 2022-01-03
  • 基于改进深度强化学习的虚拟网络功能部署优化算法
    唐伦1,2,贺兰钦1,2,,,连沁怡3,谭颀1,21.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信技术重点实验室重庆4000653.三峡大学国际交流学院宜昌443002基金项目:国家自然科学基金(62071078),重庆市教委科学技术研究项目(KJZD-M201800601 ...
    本站小编 Free考研考试 2022-01-03
  • 滤波器组多载波系统中基于双层优化的峰均比抑制算法
    赵辉,,王薇,莫谨荣,孙振江,张天骐1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学信号与信息处理重庆市重点实验室重庆400065基金项目:国家自然科学基金(61671095)详细信息作者简介:赵辉:女,1980年生,教授,硕士生导师,研究方向为信号与图像处理、深空光通信王薇:女, ...
    本站小编 Free考研考试 2022-01-03
  • 基于多尺度增强网络的人群计数方法
    徐涛,段仪浓,杜佳浩,刘才华,1.中国民航大学计算机科学与技术学院天津3003002.中国民航大学中国民航信息技术科研基地天津300300基金项目:天津市自然科学基金(18JCYBJC85100),中央高校基本科研业务基金项目中国民航大学专项(3122018C024),中国民航大学科研启动项目(20 ...
    本站小编 Free考研考试 2022-01-03