RWPSO与马尔科夫链的无人机航路规划
胡美富1,宁芊1,陈炳才2,雷印杰1
(1.四川大学 电子信息学院,成都 610065; 2.大连理工大学 计算机科学与技术学院,辽宁 大连 116024)
摘要:
粒子群算法(PSO)是基于种群的全局搜索算法,具有原理简单,搜索稳定高效等特性,在航路规划领域被普遍运用,但是其在陷入局部最优以及收敛速度方面都存在一定的缺陷.本文针对无人机的任务权重值与生存权重值引入随机游走策略,按照一定规律改变粒子的惯性权重值,可以有效的避免上述情况发生,提升无人机在航路规划中找到最优路径的效率.另一方面,为了能够给规划的路径提供优劣性的判断标准或参考依据,需要构建适用于评估无人机飞行路径点上的生存状态概率模型,本文将随机游走粒子群算法(RWPSO)的航路规划模型与马尔科夫链生存状态随机性模型相结合,得到一个可以用来评估路径点生存概率的航路规划问题模型.仿真结果表明,基于任务权重、生存权重、任务生存权重随机游走的RWPSO算法在寻优时比PSO、量子粒子群算法(QPSO)效率更高,并成功结合马尔科夫链得到一个可以描述出无人机生存概率变化的模型.此模型框架还能够扩展应用于有辐射源、武器、电磁干扰等复杂场景中的航路与任务规划.
关键词: 无人机 RWPSO优化算法 马尔科夫链 生存概率模型
DOI:10.11918/j.issn.0367-6234.201812040
分类号:TP301
文献标识码:A
基金项目:国家自然科学基金(61771089)
UAV route planning based on RWPSO and Markov chain
HU Meifu1,NING Qian1,CHEN Bingcai2,LEI Yinjie1
(1.School of Electronics and Information Engineering, Sichuan University, Chengdu 610065, China; 2.School of Computer Science and Technology, Dalian University of Technology, Dalian 116024, Liaoning, China)
Abstract:
Particle swarm optimization (PSO) is a global search algorithm based on population, which is characterized by simple principle and stable and efficient search. It is widely used in the field of route planning, but it is defective when falling into local optimum and in convergence speed. In this paper, random walk strategy is introduced to the mission weight and survival weight of UAV. By changing the inertia weight of particles according to certain rules, PSO’s defects can be effectively avoided, and UAV’s efficiency in finding the optimal path can be improved. On the other hand, in order to provide a criterion or reference to evaluate planned path, it is necessary to construct a survival state probability model to evaluate UAV flight path points. The route planning model of the random walk particle swarm optimization algorithm (RWPSO) was combined with the Markov chain survival state randomness model, thereby building up a route planning model for estimating the survival probability of path points. Simulation results show that RWPSO based on random walk of task weight, survival weight, and task survival weight was more efficient than PSO and quantum particle swarm optimization (QPSO) in optimization. A model describing the change of survival probability of UAV was thus obtained successfully by combining Markov chain with RWPSO. The framework can be extended to route and mission planning in complex scenes with radiation sources, weapons, or electromagnetic interference.
Key words: unmanned aerial vehicle (UAV) random walk particle swarm optimization algorithm (RWPSO) Markov chain survival probability model
胡美富, 宁芊, 陈炳才, 雷印杰. RWPSO与马尔科夫链的无人机航路规划[J]. 哈尔滨工业大学学报, 2019, 51(11): 75-81. DOI: 10.11918/j.issn.0367-6234.201812040.
HU Meifu, NING Qian, CHEN Bingcai, LEI Yinjie. UAV route planning based on RWPSO and Markov chain[J]. Journal of Harbin Institute of Technology, 2019, 51(11): 75-81. DOI: 10.11918/j.issn.0367-6234.201812040.
基金项目 国家自然科学基金(61771089) 作者简介 胡美富(1995—), 男, 硕士研究生 通信作者 宁芊, ningq@scu.edu.cn 文章历史 收稿日期: 2018-12-11
Contents -->Abstract Full text Figures/Tables PDF
RWPSO与马尔科夫链的无人机航路规划
胡美富1, 宁芊1, 陈炳才2, 雷印杰1
1. 四川大学 电子信息学院, 成都 610065;
2. 大连理工大学 计算机科学与技术学院, 辽宁 大连 116024
收稿日期: 2018-12-11
基金项目: 国家自然科学基金(61771089)
作者简介: 胡美富(1995—), 男, 硕士研究生
通信作者: 宁芊, ningq@scu.edu.cn
摘要: 粒子群算法(PSO)是基于种群的全局搜索算法, 具有原理简单, 搜索稳定高效等特性, 在航路规划领域被普遍运用, 但是其在陷入局部最优以及收敛速度方面都存在一定的缺陷.本文针对无人机的任务权重值与生存权重值引入随机游走策略, 按照一定规律改变粒子的惯性权重值, 可以有效的避免上述情况发生, 提升无人机在航路规划中找到最优路径的效率.另一方面, 为了能够给规划的路径提供优劣性的判断标准或参考依据, 需要构建适用于评估无人机飞行路径点上的生存状态概率模型, 本文将随机游走粒子群算法(RWPSO)的航路规划模型与马尔科夫链生存状态随机性模型相结合, 得到一个可以用来评估路径点生存概率的航路规划问题模型.仿真结果表明, 基于任务权重、生存权重、任务生存权重随机游走的RWPSO算法在寻优时比PSO、量子粒子群算法(QPSO)效率更高, 并成功结合马尔科夫链得到一个可以描述出无人机生存概率变化的模型.此模型框架还能够扩展应用于有辐射源、武器、电磁干扰等复杂场景中的航路与任务规划.
关键词: 无人机 RWPSO优化算法 马尔科夫链 生存概率模型
UAV route planning based on RWPSO and Markov chain
HU Meifu1, NING Qian1, CHEN Bingcai2, LEI Yinjie1
1. School of Electronics and Information Engineering, Sichuan University, Chengdu 610065, China;
2. School of Computer Science and Technology, Dalian University of Technology, Dalian 116024, Liaoning, China
Abstract: Particle swarm optimization (PSO) is a global search algorithm based on population, which is characterized by simple principle and stable and efficient search. It is widely used in the field of route planning, but it is defective when falling into local optimum and in convergence speed. In this paper, random walk strategy is introduced to the mission weight and survival weight of UAV. By changing the inertia weight of particles according to certain rules, PSO's defects can be effectively avoided, and UAV's efficiency in finding the optimal path can be improved. On the other hand, in order to provide a criterion or reference to evaluate planned path, it is necessary to construct a survival state probability model to evaluate UAV flight path points. The route planning model of the random walk particle swarm optimization algorithm (RWPSO) was combined with the Markov chain survival state randomness model, thereby building up a route planning model for estimating the survival probability of path points. Simulation results show that RWPSO based on random walk of task weight, survival weight, and task survival weight was more efficient than PSO and quantum particle swarm optimization (QPSO) in optimization. A model describing the change of survival probability of UAV was thus obtained successfully by combining Markov chain with RWPSO. The framework can be extended to route and mission planning in complex scenes with radiation sources, weapons, or electromagnetic interference.
Keywords: unmanned aerial vehicle (UAV) random walk particle swarm optimization algorithm (RWPSO) Markov chain survival probability model
随着现代军事逐渐无人化的发展,无人机已经成为了航空科技领域中最活跃和最重要的发展方向之一[1].预计到21世纪初,全球军用无人机的数量将达到23 000多架,这些无人机将主要被应用在侦察,电子对抗,以及攻击战斗等领域.如何使无人机在敌方的雷达、武器等威胁环境中成功完成任务,是一个备受关注的问题.目前世界上已经掀起了一场关于无人机的研究热潮,无人机的航路规划也将会来到一个新的阶段.
粒子群算法在航路规划中得到了非常广泛的应用.文献[2-4]分别对基本粒子群算法在航路规划中的使用做了相应的改进.文献[5-6]对PSO,(RandomWalkPSO, RWPSO)以及一些其他改进的PSO算法包括(QuantumPSO, QPSO)等进行了比较与分析,结果表明RWPSO算法在运行时间,跳出局部最优的能力等方面较大部分改进PSO算法有一定的优势.本文首先验证了RWPSO优化算法在航路规划领域的可行性与优越性,并进一步的将RWPSO与马尔科夫链生存模型相结合,可以实时的评估无人机的状态概率.非常直观的了解无人机在有敌方威胁的环境中执行任务时其状态转移变化与生存率情况.
1 无人机航路规划问题建模 1.1 基于PSO的航路规划模型粒子群算法是一种模拟鸟群寻食的算法,每一只鸟的个体被抽象成没有质量与体积的粒子.在d维的搜索空间中,每个粒子都有自己的位置向量Xi=(xi1,xi2,…, xid),速度向量Vi=(vi1,vi2,…, vid), 以及一个最为关键的适应度值J(n).适应度值由适应度函数确定,在每一次的迭代中,粒子自身的个体最优解为Pbest=(pi1,pi2,…, pid),整个群体找到的全局最优解为Gbest=(gi1,gi2,…, gid),然后根据下面的迭代公式来更新第i个粒子的位置和速度.
$\begin{array}{*{20}{c}}{{V_i}(t + 1) = w*{v_{ij}}(t) + {c_1}*\left( {{p_{ij}} - {x_{ij}}(t)} \right) + }\\{{c_2}*\left( {{g_{ij}} - {x_{ij}}(t)} \right), }\\\end{array}$ (1)
${X_i}(t + 1) = {V_i}(t + 1) + {X_i}(t).$ (2)
式中:w为惯性权重,c1、c2为加速因子.c1是粒子的认知部分的权重,表明粒子吸取自身经验的能力,c2是粒子社会部分的权重,表明粒子间的交互能力.相对来说:认知能力越强的粒子收敛的越快,但易于陷入局部最优,社会能力越强的粒子,越能找到最优解,但是算法效率越低.
本文适应度函数的基本结构如下:
$\begin{array}{*{20}{c}}{J(n) = {w_{\rm{S}}}*{C_{\rm{S}}}(n) + {w_{\rm{P}}}*{C_{\rm{P}}}(n) + {w_{\rm{R}}}*}\\{{C_{\rm{R}}}(n) + {w_{\rm{O}}}*{C_{\rm{O}}}(n) + {w_{\rm{H}}}*{C_{\rm{H}}}(n).}\end{array}$ (3)
其综合考虑了无人机的生存代价、任务的完成代价、参考路径代价,无人机油耗代价,飞行高度代价.
1) 生存代价:wS*CS(n)
CS(n)=Sn-Sn-1;Sn为第n次搜索后的生存代价,Sn-1为已执行路径的生存代价和.其差值将作为本次搜索所持有的生存代价,wS为生存代价的权重值.
2) 任务完成的代价:wP*CP(n)
CP(n)=|Ptarget-Pn|;Ptarget为下一个任务点的位置,Pn为第n步搜索后的位置,取空间中这两点的模即为任务完成的代价,wP为任务重要性的权重值.如果任务点都执行完毕,则下一个任务点为终点.
3) 参考路径代价:wR*CR(n)
CR(n)=Dn(Pn, Lreference);Lreference为参考路径如图 1所示.Dn为点Pn到直线段Lreference距离的函数,返回值即为参考路径对飞行航线的代价.如果wR越大,无人机的飞行轨迹越靠近参考路线.
Fig. 1
图 1 参考路径和约束表示 Fig. 1 Reference path and constraint representation
4) 油耗与飞行高度代价:wO*CO(n)+wH*CH(n)
${C_{\rm{O}}}(n) = \left\{ {\begin{array}{*{20}{l}}{0, \;\sum\limits_{n = 1}^n {{\rm{ oil}}} *{\rm{Di}}{{\rm{s}}_{\rm{n}}} < {\rm{oi}}{{\rm{l}}_{{\rm{All}}}};}\\{{C_{{\rm{destory}}}}, \;\sum\limits_{n = 1}^n {{\rm{oil}}} *{\rm{Di}}{{\rm{s}}_{\rm{n}}} \ge {\rm{oi}}{{\rm{l}}_{{\rm{All}}{\rm{.}}}}}\end{array}} \right.$ (4)
式中:oil为耗油率, Disn为第n次搜索的步长,oilAll为总的油量.当总油量不能够支称第n步搜索所需的油耗量时,则引入惩罚Cdestory.
${C_{\rm{H}}}(n) = \left\{ {\begin{array}{*{20}{l}}{0, {H_{\min }} < {H_{\rm{n}}} < {H_{\max }};}\\{{C_{{\rm{destory }}}}, {\rm{ otherwise}}{\rm{.}}}\end{array}} \right.$ (5)
同上,当无人机下一次搜索的高度在约束的空间Hmin,Hmax外,同样引入惩罚Cdestory.wO,wH分别为两者的权重.
1.2 RWPSO优化算法在对PSO算法的优化问题中,通过调整参数来提高性能是最为常见的一种方法[7-8].
通过对适应度函数的介绍,可以发现权重对其代价或约束起到一个非常重要的权衡作用,直接影响到飞行的规划航迹.标准的PSO算法中,主要是靠粒子间的相互影响来寻优的,如果固定权重系数,粒子很难兼顾全局寻优与局部寻优的能力.但是采取随机游走策略来更新权重,算法的寻优速度会得到大大提升,这使无人机在航路规划时遇到敌方雷达或武器后会有更快的反应速度,尽早脱离危险区域,提高生存率.图 2为RWPSO算法的流程图:
Fig. 2
图 2 RWPSO算法流程图 Fig. 2 Flow diagram of RWPSO
RWPSO算法的权重随机游走策略是通过将代价的权重系数设置为服从某种随机分布的数.如果粒子在初始化时就已经在最优点附近,那么RWPSO算法会找出相对小的权重值来增加收敛速度.如果不在最优解附近,甚至陷入局部最优时,由于RWPSO算法中的粒子受到不等权重的影响,会不断尝试跳出局部最优.具体权重值设置如下:
$w = \mu + \sigma *N(0, 1).$ (6)
式中:w为RWPSO算法的权重系数,μ为权重的均值,σ为方差,Ν(0, 1)是服从标准正态分布的随机数.
$\mu = {\mu _{\min }} + \left( {{\mu _{\max }} - {\mu _{\min }}} \right)*{\mathop{\rm rand}\nolimits} (0, 1).$ (7)
式中:μmax,μmin分别为随机权重的最大值与最小值,rand(0, 1)为取一个(0, 1)之间随机数的函数.这约束了在路径规划中无人机生存代价和任务代价过低或过高的情况发生.
2 基于马尔科夫链的无人机生存概率模型本文使用时间连续状态离散的马尔科夫链构建一个包含五种生存状态[9]的概率模型,用来描述无人机在穿过敌方雷达武器等威胁区域后的生存概率.文献[10]提出了一种状态之间的转移强度和代价函数.通过将RWPSO算法与状态转移强度相结合,规划出一条包含生存概率的航线.
2.1 五状态生存概率模型五状态即为飞机的5种状态:未被发现(undetected);被侦测(detected);被追踪(tracked);交战(engage);被击落(hit).生存状态之间是可以相互转换的,但只能是相邻的两个状态转换.假设无人机从安全区飞入敌方雷达区,无人机可能就会被敌方雷达发现而进入被侦测状态,甚至再由被侦测转移到被追踪状态,此时如果无人机飞离敌方雷达区域,将又会由被追踪转移到被侦测状态,而不能直接由被追踪转移到未被发现状态.无人机一旦从交战状态转移到了被击落状态,则为吸收态,将永远处于被击落状态.状态概率计算公式:
$\begin{array}{*{20}{c}}{P\left( {{X_{{\rm{t}} + \Delta }} = j|{X_{\rm{t}}} = i} \right) = {\lambda _{ij}}\Delta , }\\{P\left( {{X_{{\rm{t}} + \Delta }} = i|{X_{\rm{t}}} = i} \right) = 1 - \sum\limits_{k \ne i} {{\lambda _{ik}}} \Delta .}\end{array}$
式中:i与j,k分别为无人机的两相邻生存状态,λij为两状态间的转移强度,Δ为无限小的时间长,P为状态间的转移概率.因为RWPSO算法收敛速度快,所以当无人机发现危险时,特别当任务点在敌方威胁区域内时,能够在完成任务后把在威胁区域内总的Δ缩小,迅速飞离危险区,以提高生存率.
2.2 转移强度与代价函数 2.2.1 转移强度的设定转移强度描述了从一个状态到另一个状态的转移概率[9],为λij.
图 3中的U,D,T,E,H分别为五种生存状态,右边部分为无人机所处的区域,包括安全区与威胁区,威胁区又分为雷达区和武器区.转移强度默认值的设置将参考文献[10],但是在威胁区域中所有点采用其固定的默认值,会导致生存代价相同.因此本文使用下面的公式来更新威胁区域内不同点的转移强度:
Fig. 3
图 3 状态转移强度的设定 Fig. 3 Setting of transfer strength
${\lambda _{ij}} = \left\{ {\begin{array}{*{20}{l}}{{\lambda _{{\rm{ou}}{{\rm{t}}_ - }{\rm{ij}}}}, {\rm{ position }} \in S;}\\{\lambda _{{\rm{i}}{{\rm{n}}_ - }{\rm{ij}}}^*(r - d)/r, {\rm{ position }} \notin S.}\end{array}} \right.$ (8)
position为无人机的位置,S为安全区域,λout_ij,λin_ij为无人机在威胁区域外和内的默认转移强度.r为威胁半径,d为点position距离威胁中心的欧式距离.
2.2.2 重叠区域的转移强度设定如果无人机飞入了雷达和武器都辐射到的范围,那么式(8)中的d将无法表示.关于重叠区域转移强度的计算公式如下:
$\lambda _{ij}^{\rm{c}} = \left\{ \begin{array}{l}\lambda _{ij}^1 + \lambda _{ij}^2, (i, j) = (U, D){\rm{\& }}(D, T), \\\max \left( {\lambda _{ij}^1, \lambda _{ij}^2} \right), (i, j) = (T, E){\rm{\& }}(E, H), \\\frac{{\lambda _{ij}^1\lambda _{ij}^2\left( {\lambda _{ij}^1 + \lambda _{ij}^2} \right)}}{{\lambda _{ij}^1\lambda _{ij}^2 + {{\left( {\lambda _{ij}^1} \right)}^2} + {{\left( {\lambda _{ij}^2} \right)}^2}}}, (i, j) = (D, U){\rm{\& }}(T, D), \\都是搜索雷达\\\min \left( {\lambda _{ij}^1, \lambda _{ij}^2} \right), (i, j) = (D, U){\rm{\& }}(T, D), \\不都是搜索雷达\\\min \left( {\lambda _{ij}^1, \lambda _{ij}^2} \right), (i, j) = (E, T).\end{array} \right.$ (9)
式中:λijc为重叠区域无人机的转移强度,λij1为针对第一个威胁点区域的转移强度,λij2为针对第二个威胁点区域的转移强度.
2.2.3 代价函数代价为无人机在执行第n次搜索前后的生存概率变化.生存概率是通过该点的转移强度值来计算得到的[9].具体计算公式为
$\left( {\begin{array}{*{20}{l}}{{{\dot p}_{\rm{U}}}({\rm{n}})}\\{{{\dot p}_{\rm{D}}}({\rm{n}})}\\{{{\dot p}_{\rm{T}}}({\rm{n}})}\\{{{\dot p}_{\rm{E}}}({\rm{n}})}\\{{{\dot p}_{\rm{H}}}({\rm{n}})}\\{\underbrace {\dot \xi ({\rm{n}})}_{{\rm{\dot X}}\left( {{{\rm{t}}_{\rm{n}}}} \right)}}\end{array}} \right) = \left( {\underbrace {\begin{array}{*{20}{c}}{ - {v_{\rm{U}}}({\rm{n}})}&{{\lambda _{{\rm{DU}}}}({\rm{n}})}&{{\lambda _{{\rm{TU}}}}({\rm{n}})}&{{\lambda _{{\rm{EU}}}}({\rm{n}})}&{{\lambda _{{\rm{HU}}}}({\rm{n}})}&0\\{{\lambda _{{\rm{UD}}}}({\rm{n}})}&{ - {v_{\rm{D}}}({\rm{n}})}&{{\lambda _{{\rm{TD}}}}({\rm{n}})}&{{\lambda _{{\rm{ED}}}}({\rm{n}})}&{{\lambda _{{\rm{HD}}}}({\rm{n}})}&0\\{{\lambda _{{\rm{UT}}}}({\rm{n}})}&{{\lambda _{{\rm{DT}}}}({\rm{n}})}&{ - {v_{\rm{T}}}({\rm{n}})}&{{\lambda _{{\rm{ET}}}}({\rm{n}})}&{{\lambda _{{\rm{HT}}}}({\rm{n}})}&0\\{{\lambda _{{\rm{UE}}}}({\rm{n}})}&{{\lambda _{{\rm{DE}}}}({\rm{n}})}&{{\lambda _{{\rm{TE}}}}({\rm{n}})}&{ - {v_{\rm{E}}}({\rm{n}})}&{{\lambda _{{\rm{HE}}}}({\rm{n}})}&0\\{{\lambda _{{\rm{UH}}}}({\rm{n}})}&{{\lambda _{{\rm{DH}}}}({\rm{n}})}&{{\lambda _{{\rm{TH}}}}({\rm{n}})}&{{\lambda _{{\rm{EH}}}}({\rm{n}})}&{ - {v_{\rm{H}}}({\rm{n}})}&0\\{{\xi _{\rm{U}}}({\rm{n}})}&{{\xi _{\rm{U}}}({\rm{n}})}&{{\xi _{\rm{U}}}({\rm{n}})}&{{\xi _{\rm{U}}}({\rm{n}})}&{{\xi _{\rm{U}}}({\rm{n}})}&0\end{array}}_{{\rm{A}}({\rm{n}})}} \right)\left( {\begin{array}{*{20}{l}}{{p_{\rm{U}}}({\rm{n}})}\\{{p_{\rm{D}}}({\rm{n}})}\\{{p_{\rm{T}}}({\rm{n}})}\\{{p_{\rm{E}}}({\rm{n}})}\\\begin{array}{l}{p_{\rm{H}}}({\rm{n}})\\\;\underbrace {\xi ({\rm{n}})}_{{\rm{X}}\left( {{{\rm{t}}_{\rm{n}}}} \right)}\end{array}\end{array}} \right)$ (10)
式中:pI(n)为第n+1次搜索时处于I状态的概率,I为U, D, T, E, H中的某一状态.
$\begin{array}{*{20}{c}}{{v_I}(n) = \sum\limits_{i \ne j} {{\lambda _{ij}}} (n), }\\{{\xi _{\rm{M}}}(n) = {b_i} + \sum\limits_{i \ne j} {{\lambda _{ij}}} (n){C_{ij}}.}\end{array}$
其中,ξM(n)为截至前n次搜索飞机累计生存代价.bi为处于i状态时,其每个单位时间的生存代价.由于i有5种状态,故bi用b=(0, bD, bT, bE, 0)表示.
${C_{ij}} = \left\{ {\begin{array}{*{20}{l}}{{C_{{\rm{destory }}}}, i = E, j = H;}\\{0, {\rm{ otherwise}}{\rm{.}}}\end{array}} \right.$ (11)
式中:Cij为从状态i转移到状态j的转移代价,最后可以算出生存代价的矩阵向量X(tn+1).
$X\left( {{t_{{\rm{n}} + 1}}} \right) = {{\rm{e}}^{{\rm{A}}(n)*\Delta t}}X\left( {{t_{\rm{n}}}} \right).$
3 试验仿真与分析 3.1 基本参数在Intel Core i5- 4460@3.2 GHz, 8 G内存的硬件,Matlab2017a版软件环境下进行的仿真实验.场景参数由表 1给出,其中搜索雷达的搜索半径为150 km,火控雷达的打击半径为90 km,任务点的半径为15 km.转移强度具体参数如表 2,状态代价如表 3.
表 1
表 1 场景参数 Tab. 1 Parameters of the scene 描述 位置坐标/km 颜色显示
原点坐标 (300, 300, 0) 无
场景范围 (700*600*500) 彩色
起点 (300, 450, 285) 绿色
终点 (930, 810, 300) 绿色
搜索雷达1 (500, 475, 238) 蓝色
搜索雷达2 (675, 750, 275) 蓝色
搜索雷达3 (830, 515, 240) 蓝色
火控雷达1 (530, 520, 263) 红色
火控雷达2 (700, 680, 275) 红色
任务点1 (410, 545, 280) 黄色
任务点2 (555, 675, 280) 黄色
任务点3 (800, 580, 278) 黄色
表 1 场景参数 Tab. 1 Parameters of the scene
表 2
表 2 转移强度参数 Tab. 2 Parameters of transfer strength 转移强度 安全区 探测雷达区 武器雷达区
λUD 0 0.4 0
λDU 0.2 0.1 0.2
λDT 0 0.3 0
λTD 0.2 0.1 0.2
λTE 0 0 0.2
λET 1 1 0.1
λEH 1 0 0.3
表 2 转移强度参数 Tab. 2 Parameters of transfer strength
表 3
表 3 状态代价参数 Tab. 3 Parameters of state cost 不同状态代价 bU bD bT bE bH Cdestory
代价 0 1 10 100 0 8 000
表 3 状态代价参数 Tab. 3 Parameters of state cost
3.2 仿真结果与分析一方面为了证明随机游走策略的优越性,在下面分别对任务权重,生存权重采用控制变量法,并将仿真结果与标准的PSO优化算法进行比较,在最后将改进的QPSO与任务生存权重均随机游走的RWPSO进行对比.另一方面根据粒子群算法与马尔科夫链的结合模型,分别给出每次航路的无人机生存状态概率分布图.
3.2.1 基于随机游走的任务代价权重首先设定初始的代价权重值,其设置如表 4所示:
表 4
表 4 初始权重值设置 Tab. 4 Setting of initial weight value 代价 权重值
任务代价 5.00
生存代价 0.60
参考路径约束 0.10
高度约束 0.10
油耗约束 0.05
表 4 初始权重值设置 Tab. 4 Setting of initial weight value
在此权重值下,PSO优化算法的搜索路径如图 4中的黑色虚线所示,任务权重随机游走的RWPSO算法将按照式(6)对其任务权重进行更新,并且设置μmax=6,μmin=4,最后RWPSO搜索路径如图 4中的红色实线所示,其中横纵坐标表示位置.
Fig. 4
图 4 基于RWPSO(红实)与PSO(黑虚)航路搜索俯视 Fig. 4 Top view of route search based on RWPSO (red solid line) and PSO (black dotted line)
观察图 4发现,在任务点1,2,3中,PSO优化算法都出现局部最优的情况,特别是任务点1与3.但是RWPSO优化算法很好的避免了这个问题,跳出局部最优的能力显然强于PSO算法.
图 5为这两条搜索航线的状态概率图,横坐标为执行的步数,每次搜索执行4步,纵坐标为每步搜索对应的状态概率,且5状态概率相加始终等于1.在图 5中可以发现PSO算法陷入了局部最优,导致其生存状态概率不断跳变.同样,生存状态概率图提供了一个有力的参考证据,用来评估在这种威胁环境中是否适合使用无人机去完成本次任务.
Fig. 5
图 5 基于RWPSO与PSO的生存状态概率 Fig. 5 Survival state probability diagram based on RWPSO and PSO
3.2.2 基于随机游走的生存代价权重生存代价的初始权重设置的是0.6,属于使无人机具有较高的生存能力,当然这是现代战争所必然的.现在将wS设置为0.3,其他权重值不变,这样做的好处是方便对RWPSO优化算法与PSO优化算法在收敛速度与寻优能力方面进行比较.
与设置任务权重一样.生存权重随机游走的RWPSO算法是把生存权重按照式(6)进行更新,μmax,μmin分别设置为0.4与0.2,其他权重值按照表 4给出.仿真效果如图 6:
Fig. 6
图 6 基于RWPSO(红实)与PSO(黑虚)的航路搜索俯视 Fig. 6 Top view of route search based on RWPSO (red solid line) and PSO (black dotted line)
在图 6中的2号任务点,执行完任务后,PSO优化算法由于收敛较慢,使得无人机飞入敌方武器威胁区域.RWPSO优化算法由于生存代价是不固定的,故种群肯定会往高生存率方向移动,即可迅速飞离危险区,也就避免出现图 7中被hit的状态.
Fig. 7
图 7 基于RWPSO与PSO的生存状态概率 Fig. 7 Survival state probability diagram based on RWPSO and PSO
同样在3号任务点附近的轨迹也验证了这一结论的正确性,RWPSO优化算法在完成3号任务后可以迅速转移到高生存率的地方,减少在威胁区域内的飞行时间.
3.2.3 基于随机游走的任务与生存代价权重在表 4的权重参数中,实验一组生存代价与任务代价权重都是基于随机游走的数据,并将此实验结果与QPSO进行对比.一般的PSO优化算法都需要迭代100次左右[11-12],但本文实验只初始化了30个种群,迭代30次,缩小了约3倍的时间.
仿真效果如图 8所示:RWPSO的搜索路径用红实线标出,QPSO的搜索路径用黑虚线标出.与图 4相比,生存权重与任务权重均随机游走的RWPSO在2号任务点与3号任务点之间不会出现一直贴着敌方武器雷达飞行的情况出现,避免了图 5中RWPSO在第55步附近出现被追踪概率骤增的情况发生.QPSO在执行完2号任务点后依旧飞入了敌方的武器雷达区域,导致了图 9中约30%的被击毁概率.3号任务点时QPSO飞出任务区域后的收敛速度依旧不及RWPSO,过多时间处于敌方搜索雷达范围内.
Fig. 8
图 8 基于RWPSO(红实)与QPSO(黑虚)的航路搜索俯视图 Fig. 8 Top view of route search based on RWPSO (red solid line) and PSO (black dotted line)
Fig. 9
图 9 基于RWPSO与QPSO的生存状态概率 Fig. 9 Survival state probability diagram based on RWPSO and QPSO
图 10对上面的6条航路的生存代价进行了对比,由于高生存权重的PSO优化算法陷入了局部最优故没有在图中标出.在低生存权重时:基于任务权重随机游走的RWPSO算法航路代价低于PSO算法.高生存权重时:两条RWPSO算法航路代价也只是略高于低生存权重PSO算法的航路代价值,QPSO由于飞入敌方武器威胁区域过多导致航路代价超过7 000.
Fig. 10
图 10 生存代价对比 Fig. 10 Cost of survival contrast diagram
4 结论通过对比RWPSO优化算法与PSO、QPSO优化算法在无人机航路规划应用中的仿真效果与实验数据,证明了RWPSO优化算法跳出局部最优能力强,收敛速度快等特点.再结合马尔科夫链生存模型,实时的对飞行路径中的每一个点进行生存代价的评估,得到生存概率图,为无人机在复杂场景中的航路规划与生存状态动态评估提供了一种可行方法.
参考文献
[1] NONAMI K. Prospect and recent research & development for civil use autonomous unmanned aircraft as UAV and MAV[J]. Journal of System Design & Dynamics, 2007, 1(2): 120. DOI:10.1299/jsdd.1.120
[2] WANG Qiang, ZHANG An, QI Linghui. Three-dimensional path planning for UAV based on improved PSO algorithm[C]//The 26th Chinese Control and Decision Conference (2014 CCDC). IEEE, 2014: 3981. DOI: 10.1109/CCDC.2014.6852877
[3] GENG Qingbo, ZHAO Zheng. A kind of route planning method for UAV based on improved PSO algorithm[C]//2013 25th Chinese Control and Decision Conference (CCDC). IEEE, 2013: 2328. DOI: 10.1109/CCDC.2013.6561326
[4] MARINI F, WALCZAK B. Particle swarm optimization (PSO). A tutorial[J]. Chemometrics & Intelligent Laboratory Systems, 2015, 149: 153. DOI:10.1016/j.chemolab.2015.08.020
[5] CHEN Chenyu, CHANG Kuochou, HO S H. Improved framework for particle swarm optimization: Swarm intelligence with diversity-guided random walking[J]. Expert Systems with Applications, 2011, 38(10): 12214. DOI:10.1016/j.eswa.2011.03.086
[6] FU Yangguang, DING Mingyue, ZHOU Chengping. Phase angle-encoded and quantum-behaved particle swarm optimization applied to three-dimensional route planning for UAV[J]. IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, 2011, 42(2): 511. DOI:10.1109/tsmca.2011.2159586
[7] CHEN H C, FENG H M, LIN T H, et al. Adapt DB-PSO patterns clustering algorithms and its applications in image segmentation[J]. Multimedia Tools and Applications, 2016, 75(23): 15327. DOI:10.1007/s11042-015-2518-4
[8] SHI Y, EBERHART R C. Empirical study of particle swarm optimization[C]//Proceedings of the 1999 Congress on Evolutionary Computation-CEC99 (Cat. No. 99TH8406). IEEE, 1999, 3: 1945. DOI: 10.1109/CEC.1999.785511
[9] ERLANDSSON T, NIKLASSON L. A five states survivability model for missions with ground-to-air threats[C]//Modeling and Simulation for Defense Systems and Applications Ⅷ. International Society for Optics and Photonics, 2013, 8752: 875207. DOI: 10.1117/12.2015022
[10] ERLANDSSON T. Route planning for air missions in hostile environments[J]. The Journal of Defense Modeling and Simulation: Applications, Methodology, Technology, 2015, 12(3): 289.
[11] NEX F, REMONDINO F. UAV for 3D mapping applications: a review[J]. Applied Geomatics, 2014, 6(1): 1. DOI:10.1007/s12518-013-0120-x
[12] 高芳, 崔刚, 吴智博, 等. 求解背包问题的病毒协同进化粒子群算法[J]. 哈尔滨工业大学学报, 2009, 41(6): 103-107.
GAO Fang, CUI Gang, WU Zhibo, et al. Virus-evolutionary particle swarm optimization algorithm for knapsack problem[J]. Journal of Harbin Institute of Technology, 2009, 41(6): 103-107. DOI:10.3321/J.issn:0367-6234
[13] MUELLER M, SMITH N, GHANEM B. A Benchmark and Simulator for UAV Tracking[J]. Far East Journal of Mathematical Sciences, 2016, 2(2): 445.
[14] MARINAKIS Y, MARINAKI M. A hybrid multi-swarm particle swarm optimization algorithm for the probabilistic traveling salesman problem[J]. Computers & Operations Research, 2010, 37(3): 432. DOI:10.1016/j.cor.2009.03.004
[15] WANG Gaige, GUO Lihong, DUAN Hong, et al. A bat algorithm with mutation for UCAV path planning[J]. The Scientific World Journal, 2012, 2012: 1. DOI:10.1100/2012/418946
[16] GUPTA L, JAIN R, VASZKUN G. Survey of important issues in UAV communication networks[J]. IEEE Communications Surveys & Tutorials, 2016, 18(2): 1123. DOI:10.1109/COMST.2015.2495297
[17] HUANG Yu, GUO Feng, LI Yongling, et al. Parameter estimation of fractional-order chaotic systems by using quantum parallel particle swarm optimization algorithm[J]. Plos One, 2015, 10(1): e0114910. DOI:10.1371/journal.pone.0114910
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
RWPSO与马尔科夫链的无人机航路规划
本站小编 哈尔滨工业大学/2019-10-24
相关话题/规划 概率 电子 信息学院 四川大学
双足爬壁机器人三维壁面环境全局路径规划
双足爬壁机器人三维壁面环境全局路径规划卢俊华1,朱海飞1,梁经伦2,管贻生1(1.广东工业大学机电工程学院,广州510006;2.东莞理工学院机械工程学院,广东东莞523808)摘要:为求解双足爬壁机器人在三维壁面环境中的全局路径,提出了一种结合壁面可过渡性分析、全局壁面序列搜索和壁面过渡落足点优化 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05桥梁颤振临界风速的概率密度演化计算
桥梁颤振临界风速的概率密度演化计算姜保宋,周志勇,唐峰(土木工程防灾国家重点实验室(同济大学),上海200092)摘要:针对桥梁结构自身特性以及外部环境的随机性(如刚度、质量、阻尼比、气动导数等因素)所造成的桥梁的颤振临界风速不确定,难以衡量桥梁颤振稳定性问题.将概率密度演化方法与桥梁颤振多模态耦合 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05变信赖域序列凸规划RLV再入轨迹在线重构
变信赖域序列凸规划RLV再入轨迹在线重构宗群,李智禹,叶林奇,田栢苓(天津大学电气自动化与信息工程学院,天津300072)摘要:针对可重复使用运载器(RLV)的再入轨迹重构问题,提出一种基于变信赖域序列凸规划的RLV再入轨迹快速求解方法.首先,通过离散化及对非凸约束的线性化处理,将RLV的非凸轨迹优 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05变分模态分解与稀疏SURE的电子图像噪声抑制
变分模态分解与稀疏SURE的电子图像噪声抑制李庆1,StevenY.Liang1,2(1.东华大学机械工程学院,上海201620;2.佐治亚理工学院乔治-伍德拉夫机械工程学院,佐治亚州亚特兰大30332-0405)摘要:为解决电子微结构图像在摄取、传输或存储的过程中易被外界噪声干扰、图像保真度差的问 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05多重威胁下的无人机自主避障航迹规划
多重威胁下的无人机自主避障航迹规划刘畅1,2,谢文俊1,张鹏1,郭庆1,高超3(1.空军工程大学装备管理与无人机工程学院,西安710051;2.空军工程大学研究生学院,西安710051;3.中国卫星海上测控部,江苏江阴214431)摘要:无人机作为一种新兴的无人作战力量和不可或缺的民用设备,现已渐渐 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05织物/纸基柔性印刷电子薄膜导电性能研究
织物/纸基柔性印刷电子薄膜导电性能研究李克伟1,2,谢森培1,2,李康1,2,赵维巍1,2(1.哈尔滨工业大学(深圳)柔性印刷电子技术研究中心,广东深圳518055;2.先进焊接与连接国家重点实验室(深圳)(哈尔滨工业大学(深圳)),广东深圳518055)摘要:为解决织物/纸基表面缺陷多,与导电油墨 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05概率语言环境下考虑专家心理行为的QFD方法
概率语言环境下考虑专家心理行为的QFD方法鞠萍华,陈资,冉琰,涂顺泽(机械传动国家重点实验室(重庆大学),重庆400044)摘要:为解决传统质量功能展开(QFD)在实际运用过程中存在关于顾客需求和工程技术之间的关系评估,顾客需求权重的确定和工程技术的优先级排序等方面的固有缺陷,提出一种概率语言环境下 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05高柔弹性电子皮肤压力触觉传感器的研究
高柔弹性电子皮肤压力触觉传感器的研究周建辉1,2,3,曹建国1,3,4,程春福1,3,尹海斌5,余宁1,范阳1,3,4(1.北京科技大学机械工程学院,北京100083;2.华北理工大学迁安学院,河北唐山064400;3.北京科技大学人工智能研究院,北京100083;4.北京科技大学顺德研究生院,广东 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05立交区域交叉口交通信息识别概率预测
立交区域交叉口交通信息识别概率预测沈强儒1,杨少伟2,曹慧1,顾镇媛1,葛婷3(1.南通大学交通与土木工程学院,江苏南通,226019;2.长安大学公路学院,西安710064;3.苏州科技大学土木工程学院,江苏苏州215011)摘要:为预测立交区域交叉口交通信息识别概率,运用汽车动力学理论、驾驶员特 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05一种招投标机制的多星自主协同任务规划方法
一种招投标机制的多星自主协同任务规划方法陈韬亦1,冯小恩2,陈金勇1,李玉庆2(1.中国电子科技集团公司第五十四研究所,石家庄050081;2.哈尔滨工业大学深空探测基础研究中心,哈尔滨150001)摘要:针对多星自主协同遥感背景下非预期任务的快速响应问题,考虑到星上计算资源有限、计算能力较弱等特点 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2019-10-24