基于线性滤波器的四旋翼无人机强化学习控制策略

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

华和安¹,
方勇纯^1,,,
钱辰¹,
张雪涛²
1.南开大学人工智能学院天津 300350
2.大连理工大学智能机器人实验室大连 116024
基金项目:国家自然科学基金(61873132, 61633012)

详细信息

作者简介:华和安：男，1995年生，博士生，研究方向为旋翼无人机的智能控制与规划
方勇纯：男，1973年生，教授，研究方向为非线性控制、机器人视觉伺服、无人机和桥式吊车等欠驱动系统控制
钱辰：男，1993年生，博士生，研究方向为扑翼飞行器和其他仿生机器人的设计和控制
张雪涛：男，1992年生，副教授，研究方向为自主旋翼无人机的运动计划，视觉伺服，状态和干扰估计

通讯作者:方勇纯　fangyc@nankai.edu.cn

中图分类号:V279; TP273

计量

文章访问数:143
HTML全文浏览量:67
PDF下载量:44
被引次数:0

出版历程

收稿日期:2021-03-26
修回日期:2021-10-20
网络出版日期:2021-10-27
刊出日期:2021-12-21

Reinforcement Learning Control Strategy of Quadrotor Unmanned Aerial Vehicles Based on Linear Filter

He’an HUA¹,
Yongchun FANG^1,,,
Chen QIAN¹,
Xuetao ZHANG²
1. College of Artificial Intelligence, Nankai University, Tianjin 300350, China
2. Intelligent Robotic Laboratory, Dalian University of Technology, Dalian 116024, China
Funds:The National Natural Science Foundation of China (61873132, 61633012)

摘要
摘要:针对四旋翼无人机(UAVs)系统，该文提出一种基于线性降阶滤波器的深度强化学习(RL)策略，进而设计了一种新型的智能控制方法，有效地提高了旋翼无人机对外界干扰和未建模动态的鲁棒性。首先，基于线性降阶滤波技术，设计了维数更少的滤波器变量作为深度网络的输入，减小了策略的探索空间，提高了策略的探索效率。在此基础上，为了增强策略对稳态误差的感知，该文结合滤波器变量和积分项，设计集总误差作为策略的新输入，提高了旋翼无人机的定位精度。该文的新颖之处在于，首次提出一种基于线性滤波器的深度强化学习策略，有效地消除了未知干扰和未建模动态对四旋翼无人机控制系统的影响，提高了系统的定位精度。对比实验结果表明，该方法能显著地提升旋翼无人机的定位精度和对干扰的鲁棒性。
关键词:四旋翼无人机/
智能控制/
强化学习/
未知干扰
Abstract:In this paper, based on linear filter, a deep Reinforcement Learning (RL) strategy is proposed, then a novel intelligent control method is put forward for quadrotor Unmanned Aerial Vehicles (UAVs), which improves effectively the robustness against disturbance and unmodeled dynamics. First of all, based on linear reduced-order filtering technology, filter variables with fewer dimensions are designed as the input of the deep network, which reduces the exploration space of the strategy and improves the exploration efficiency. On this basis, to enhance strategy perception of steady-state errors, the filter variables and integration terms are combined to design the lumped error as the new network input, which improves the positioning accuracy of quadrotor UAVs. The novelty of this paper lies in that it is the first intelligent approach based on linear filtering technology, to eliminate successfully the influence of unknown disturbance and unmodeled dynamics of quadrotor UAVs, which improves the positioning accuracy. The results of comparative experiments show the effectiveness of the proposed method in terms of improving positioning accuracy and enhancing robustness.
Key words:Quadrotor Unmanned Aerial Vehicles (UAVs)/
Intelligent control/
Reinforcement Learning(RL)/
Unknown disturbance

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=e3c2b359-e980-4074-b056-aa52dddf4960

相关话题/干扰 设计 控制 未知 系统

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于矩阵半张量积的信息物理融合系统状态不透明性分析与控制
张志鹏,许倩,夏承遗,1.天津理工大学智能计算机及软件新技术天津市重点实验室天津3003842.天津理工大学学习型智能系统教育部工程研究中心天津300384基金项目:国家自然科学基金(62173247)详细信息作者简介:张志鹏：男，1990年生，讲师，研究方向为信息物理系统的隐私分析与安全控制、博弈 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于NOMA的移动边缘计算系统公平能效调度算法
胡晗1,2,,,鲍楠1,凌章2,沈乐21.南京邮电大学物联网学院南京2100032.江苏省无线通信重点实验室南京210003基金项目:国家自然科学基金(61871446,61801244)，江苏省科技厅自然科学基金项目(BK20191378)，江苏省高等学校自然科学研究面上项目(18KJB51003 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
无人机基站的飞行路线在线优化设计
张广驰1,严雨琳1,崔苗1,,,陈伟2,张景31.广东工业大学信息工程学院广州5100062.广东省环境地质勘查院广州5100803.中国电子科学研究院北京100043基金项目:广东省科技计划(2017B090909006,2019B010119001,2020A050515010,2021A050 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
全双工中继协作下的移动边缘计算系统能耗优化算法
徐勇军,,谷博文,谢豪,陈前斌重庆邮电大学通信与信息工程学院重庆400065基金项目:国家自然科学基金(61601071)，重庆市自然科学基金(cstc2019jcyj-xfkxX0002)，重庆市研究生科研创新项目(CYS20251,CYS20253)详细信息作者简介:徐勇军：男，1986年生，副 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种面向物联网的轻量级增强型长距离物理层设计方法
谢桂辉1,2,唐晓庆3,,,焦向开1,2,李乳演41.中国地质大学(武汉)自动化学院武汉4300742.复杂系统先进控制与智能自动化湖北省重点实验室武汉4300743.湖北大学计算机与信息工程学院武汉4300624.武昌首义学院信息科学与工程学院武汉430070基金项目:湖北省自然科学基金(2019 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
导航接收机跟踪环路电磁干扰的预测方法研究
张庆龙1,2,王玉明1,程二威1,陈亚洲1,,,马立云1,张喆21.陆军工程大学石家庄校区电磁环境效应国防重点试验室石家庄0500032.海军航空大学第二飞行训练基地长治046000详细信息作者简介:张庆龙：男，1987年生，博士生，研究方向为电磁环境效应与防护王玉明：女，1980年生，讲师，研究方 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于改进多元宇宙优化算法的光伏系统最大功率点跟踪
吴忠强,,曹碧莲,侯林成,胡晓宇,马博岩燕山大学工业计算机控制工程河北省重点实验室秦皇岛066004基金项目:河北省自然科学基金(F2020203014)详细信息作者简介:吴忠强：男，1966年生，教授，博士生导师，主要研究方向为新能源发电系统的状态监测与控制、参数测量与辨识、能量管理与优化等曹碧莲 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
星地高速数传系统低复杂度可重构LDPC编码器设计
康婧1,2,,,安军社1,王冰冰1,21.中国科学院国家空间科学中心北京1001902.中国科学院大学北京100049基金项目:中国科学院空间科学先导卫星专项(XDA15320100)详细信息作者简介:康婧：女，1993年生，博士生，研究方向为数字通信、信道编译码技术及大规模集成电路设计安军社：男， ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种通信对抗干扰资源分配智能决策算法
许华,宋佰霖,,蒋磊,饶宁,史蕴豪空军工程大学信息与导航学院西安710077详细信息作者简介:许华：男，1976年生，教授，博士生导师，研究方向为通信信号处理、智能通信对抗宋佰霖：男，1997年生，硕士生，研究方向为通信对抗智能决策蒋磊：男，1974年生，副教授，研究方向为通信抗干扰、智能通信对抗饶 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
智能多载波波形调制系统：信号的产生与识别
邵凯1,2,3,,,付旭阳1,2,王光宇1,2,31.重庆邮电大学通信与信息工程学院重庆4000652.移动通信技术重庆市重点实验室重庆4000653.移动通信教育部工程研究中心重庆400065详细信息作者简介:邵凯：男，1977年生，副教授，研究方向为新型多载波调制技术、新型多址接入技术付旭阳：男 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03