基于深度强化学习的区域化视觉导航方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-02-12

李鹏, 阮晓钢, 朱晓庆(

), 柴洁, 任顶奇, 刘鹏飞

北京工业大学信息学部,北京 100124

收稿日期:2019-09-26出版日期:2021-05-28发布日期:2021-06-01
通讯作者:朱晓庆E-mail:alex.zhuxq@bjut.edu.cn
作者简介:李鹏(1992-),男,河北省廊坊市人,博士生,主要研究方向为机器人导航.
基金资助:国家自然科学基金(61773027);北京市自然科学基金(4202005)

A Regionalization Vision Navigation Method Based on Deep Reinforcement Learning

LI Peng, RUAN Xiaogang, ZHU Xiaoqing(

), CHAI Jie, REN Dingqi, LIU Pengfei

Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China

Received:2019-09-26Online:2021-05-28Published:2021-06-01
Contact:ZHU Xiaoqing E-mail:alex.zhuxq@bjut.edu.cn

摘要/Abstract

摘要： 针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型, 实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的目标导向行为,在区域导航子模块中增加奖励预测任务,并结合经验池回放奖励序列.最后,在原有探索策略的基础上添加景深约束,防止因碰撞导致的遍历停滞.结果表明: 奖励预测和景深避障的应用有助于提升导航性能.在多区域环境测试过程中,区域化模型在训练时间和所获奖励上展现出单一模型不具备的优势,表明其能更好地应对大范围导航.此外,实验在第一人称视角的3D环境下进行,状态是部分可观察的,利于实际应用.
关键词: 深度强化学习, 分布式环境, 区域化模型, 奖励预测, 景深避障
Abstract: Aimed at the problems of navigation in distributed environment of a mobile robot, a regionalization vision navigation method based on deep reinforcement learning is proposed. First, considering the characteristics of distributed environment, the independent submodule learning control strategy is used in different regions and the regionalization model is built to switch and combine navigation control strategies. Then, in order to make the robot have a better goal-oriented behavior, reward prediction task is integrated into the submodule, and reward sequence is played back in combination with the experience pool. Finally, depth limitation is added to the primitive exploration strategy to prevent the traversal stagnation caused by collision. The results show that the application of reward prediction and depth obstacle avoidance is helpful to improve navigation performance. In the process of multi-area environment test, the regionalization model shows the advantages that the single model does not have in terms of training time and rewards, indicating that it can better deal with large-scale navigation. In addition, the experiment is conducted in the first-person 3D environment, and the state is partially observable, which is conducive to practical application.
Key words: deep reinforcement learning, distributed environment, regionalization model, reward prediction, depth obstacle avoidance

PDF全文下载地址:

点我下载PDF

相关话题/奖励 环境 控制 北京工业大学 视觉

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
混合励磁电机的电动汽车增程器控制策略
侯珏,姚栋伟(),吴锋,吕成磊,王涵,沈俊昊浙江大学　动力机械及车辆工程研究所，杭州　310027收稿日期:2019-07-15出版日期:2021-02-01发布日期:2021-03-03通讯作者:姚栋伟E-mail:dwyao@zju.edu.cn作者简介:侯珏(1994-)，女，浙江省诸暨市人， ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
大型油轮艏摇混沌现象的仿真与滑模控制
张显库(),韩旭大连海事大学　航海学院，辽宁　大连　116026收稿日期:2019-04-16出版日期:2021-01-01发布日期:2021-01-19作者简介:张显库(1968-)，男，辽宁省辽阳市人，教授，博士生导师，现主要从事船舶运动控制的研究．电话(Tel.):0411-84729572； ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
面向能耗控制的预知维护与刀具更换联合优化策略
石郭,司国锦,夏唐斌(),潘尔顺,奚立峰上海交通大学　机械系统与振动国家重点实验室；机械与动力工程学院，上海　200240收稿日期:2019-05-14出版日期:2020-12-01发布日期:2020-12-31通讯作者:夏唐斌E-mail:xtbxtb@sjtu.edu.cn作者简介:石郭(199 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
高精度数控机床主轴系统热误差的控制方法
赵亮,雷默涵,朱星星,王帅,凌正,杨军,梅雪松西安交通大学陕西省智能机器人重点实验室；机械制造系统工程国家重点实验室，西安710049收稿日期:2019-01-16出版日期:2020-11-28发布日期:2020-12-04通讯作者:杨军，男，副教授，博士生导师，电话(Tel.)：029-82663 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
单输入单输出系统离散积分滑模预测控制
刘邱,赵东亚()中国石油大学(华东)新能源学院,山东青岛266580收稿日期:2019-12-11出版日期:2020-09-28发布日期:2020-10-10通讯作者:赵东亚E-mail:dyzhao@upc.edu.cn作者简介:刘邱(1995-),男,重庆市人,硕士生,从事滑模控制和预测控制的研 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
欠驱动水面船舶的自适应神经网络-滑模路径跟随控制
贺宏伟a,邹早建a,b(),曾智华aa.上海交通大学船舶海洋与建筑工程学院,上海200240b.上海交通大学海洋工程国家重点实验室,上海200240收稿日期:2019-04-26出版日期:2020-09-28发布日期:2020-10-10通讯作者:邹早建E-mail:zjzou@sjtu.edu.c ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
拒绝服务攻击下信息物理系统事件触发广义预测控制
王志文(),刘伟兰州理工大学电气工程与信息工程学院;甘肃省工业过程先进控制重点实验室;电气与控制工程国家级实验教学示范中心,兰州730050收稿日期:2020-01-10出版日期:2020-09-28发布日期:2020-10-10作者简介:王志文(1976-),男,甘肃省武威市人,教授,现主要从事网 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
基于高斯过程回归的车辆巡航系统学习预测控制
何德峰(),彭彬彬,顾煜佳,余世明浙江工业大学信息工程学院,杭州310023收稿日期:2019-12-17出版日期:2020-09-28发布日期:2020-10-10作者简介:何德峰(1979-),男,浙江省义乌市人,教授,博士生导师,从事模型预测控制理论与应用的研究.电话(Tel):0571-85 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
城市污水处理过程出水氨氮优化控制
韩红桂(),杨士恒,张璐,乔俊飞北京工业大学信息学部;计算智能与智能系统北京市重点实验室,北京100124收稿日期:2019-07-30出版日期:2020-09-28发布日期:2020-10-10作者简介:韩红桂(1983-),男,江苏省泰州市人,教授,现主要从事城市污水处理过程建模、优化和控制研究 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12
舰载机无杆式牵引车横摆稳定性控制
戚基艳,金嘉琦,付景顺()沈阳工业大学机械工程学院,沈阳110870收稿日期:2019-09-12出版日期:2020-09-28发布日期:2020-10-10通讯作者:付景顺E-mail:fujingshun@sut.edu.cn作者简介:戚基艳(1984-),女,辽宁省大连市人,博士生,现主要从事 ...
上海交通大学科研学术本站小编 Free考研考试 2022-02-12