删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于动作注意策略的树形DDQN目标候选区域提取方法

本站小编 Free考研考试/2022-01-03

左国玉,,
杜婷婷,
马蕾,
卢佳豪,
龚道雄
1.北京工业大学信息学部 ??北京 ??100124
2.北京市计算智能与智能系统重点实验室 ??北京 ??100124
基金项目:国家自然科学基金(61873008),北京市自然科学基金(4182008),北京工业大学智能制造领域大科研推进计划

详细信息
作者简介:左国玉:男,1971年生,副教授,研究方向为机器人学习与控制、人机交互
杜婷婷:女,1991年生,硕士生,研究方向为强化学习、目标检测
马蕾:女,1992年生,硕士生,研究方向为深度学习、目标检测
卢佳豪:男,1994年生,硕士生,研究方向为机器人学习、强化学习
龚道雄:男,1968年生,副教授,研究方向为模式识别、计算智能
通讯作者:左国玉 zuoguoyu@bjut.edu.cn
中图分类号:TP242

计量

文章访问数:1061
HTML全文浏览量:602
PDF下载量:40
被引次数:0
出版历程

收稿日期:2018-04-18
修回日期:2018-11-16
网络出版日期:2018-12-04
刊出日期:2019-03-01

Region Proposal Generation for Object Detection Using Tree-DDQN by Action Attention

Guoyu ZUO,,
Tingting DU,
Lei MA,
Jiahao LU,
Daoxiong Gong
1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China
2. Beijing Key Laboratory of Computing Intelligence and Intelligent System, Beijing 100124, China
Funds:The National Natural Science Foundation of China (61873008), The Beijing Natural Science Foundation (4182008), The BJUT United Grand Scientific Research Program on Intelligent Manufacturing


摘要
摘要:针对机器人在家庭环境下的目标检测问题,该文提出一种基于动作注意策略的树形双深度Q网络(TDDQN)目标候选区域提取的方法,该方法将双深度Q网络(DDQN)的方法与树结构的方法相结合,通过执行改变检测框的动作以使目标逐渐集中在检测框内。首先采用DDQN方法在执行较少的动作后选择出当前状态的最佳动作,获取符合条件的候选区域。然后根据执行所选择动作之后所得到的状态重复执行上述过程,以此构成树结构的多条“最佳”路径。最后采用非极大值抑制的方法从多个符合条件的候选区域选择出最佳候选区域。在Pascal VOC2007以及Pascal VOC2012上的实验结果表明,在不同数量的候选区域、不同阈值的IoU和不同大小以及不同种类对象的实验条件下,所提方法较其他方法都有着更好的检测性能,可以较好地实现目标检测。
关键词:目标检测/
候选区域/
树结构/
双深度Q网络/
动作注意
Abstract:Considering the problem of object detection of robots in the home environments, a Tree-Double Deep Q Network (TDDQN) based on the attention action strategy is proposed to determine the locations of region proposals. It combines DDQN with hierarchical tree structure. First, DDQN is used to select the best action of current state and obtain the right region proposal with a few actions executed. According to the state obtained after executing the selected action, the above process is repeated to create multiple "best" paths of the hierarchical tree structure. The best region proposal is selected using non-maximum suppression on region proposals that meet the conditions. Experimental results on Pascal VOC2007 and Pascal VOC2012 show that the proposed method based on TDDQN has better detection performance than other methods for region proposals of different numbers, different Intersection-over-Union (IoU) values and objects of different sizes and kinds, respectively.
Key words:Object detection/
Region proposal/
Tree structure/
Double Deep Q Network (DDQN)/
Action attention



PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=fa3b5e02-04e4-49ce-83cb-87b43b97e59c
相关话题/网络 结构 智能 北京工业大学 北京