删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于近似动态规划的目标追踪控制算法*

本站小编 Free考研考试/2021-12-25

无人机具有结构简单、成本低廉等优点,是用于自主追随的理想平台。近年来, 随着自动化技术、计算机技术、电子器件等高新科技水平的不断提高, 无人机在民用领域也大有可为, 它可应用于:跟踪拍摄、无人机集合作战等领域, 市场前景非常乐观, 具有巨大的经济意义,而这些功能的实现都依赖于无人机对目标的精确跟随。
目前国内实现无人机自主跟踪主要通过低空飞行的无人机搭载无线相机,通过相机视觉传达无人机与目标的水平位移,进而通过控制装置调节无人机的位置以及姿态,使得无人机紧随跟踪目标。但是因为整个跟踪过程基于视觉系统,所以存在背景运动、噪声、目标被遮挡以及目标逃出视野之外的等等问题,且其算法还需利用实时图像计算其跟踪对象的像素点变化从再计算得出机动规律,使得无人机自主飞行控制的变得低效以及不准确。另外如果得到较好的目标位置,其控制部分往往研究比较少,只是简单地使用控制器跟随当前目标位置,无法预测目标的下一个可能位置,加上如果应用背景是无人机博弈等对策问题,预测目标的位置显得十分重要。目前利用图像获得相对位置的方法已经较为成熟[1],如在线目标跟踪算法中的均值偏移算法[2]、子块跟踪算法[3]、子空间算法[4],滤波算法中的特征改进、多核算法[5]、尺度估计[6-8]、分块算法[9]等,深度学习中的深度目标跟踪算法[10]等,可以解决大多数图像跟踪存在的问题,但其控制器的目标都几乎只是计算目标与无人机的距离而设计控制器,之后将目标放在图像中心[9],而忽视了从控制方面改善跟踪效果。如果在控制方面加上对目标的预测,那么跟踪效果也会得到很大的改善且也可以将之使用于博弈控制,改善了现有控制算法不灵敏,对图像依赖大的问题。
本文将近似动态规划的方法应用于无人机自主追随的问题,如果已知目标的位置等条件,使用提前使用博弈方式训练好无人机的特征参数的方法,那么本文算法可以使无人机做出更好更快的选择。最后,对设计的算法进行了仿真实验,验证了算法的可行性及其良好的跟踪性能。
1 近似动态规划 基于贝尔曼方程的动态规划为无人机跟随的最佳机动策略提供了新的手段,由此产生的优化策略为无人机跟踪问题提供了更好的方法,即在给定的飞行状态下,对最优跟踪控制策略的求解,不需要大量的在线计算,能够完成实时的最优跟踪。尽管动态规划方法非常适合应用于这类问题,但是其不适用于求解计算量较大的问题,因为离散状态空间大小随状态空间变量的数量成指数增长,从而产生维数灾使得算法难以实现。而基于动态规划的近似动态规划(Approximate Dynamic Programming, ADP)为解决复杂且庞大的最优跟踪控制问题提供了新的可能。
近似动态规划使用的基本原理是利用函数近似结构(比如神经网络),来逼近经典动态规划中的性能指标函数,从而逼近得到最优性能指标和最优控制,近似动态规划的结构如图 1所示[11]
图 1 近似动态规划结构[11] Fig. 1 ADP structure[11]
图选项




近似动态规划算法主要由3部分组成:动态系统、执行网络和评价网络。在实际应用中, 每个部分的实现由神经网络执行。当系统模型未知时, 可以通过神经网络对系统模型进行辨识; 执行网络生成系统的控制策略, 通过调节执行网络的参数来达到逼近最优控制策略的目的; 评价网络用于评价执行网络生成的控制策略。不同于传统的反馈控制方法, 图 1中评价网络到执行网络的增强信号是对执行网络控制策略的评价结果,这一信号有助于指导执行网络的优化设计。本文需要指出执行网络和评价网络的权值调整优化目标之间的区别:评价网络的参数优化的目标函数是使得评价网络的输出满足贝尔曼方程; 建立在评价网络基础上, 执行网络参数优化的目标是最小化评价网络的输出。
(1)

式中:r(xk, uk)通常被称之为回报函数(rewardfunction);在k时刻, 以J(xk)性能指标表示为状态xk的函数; 在k+1时刻, 性能指标则可以表示为J(xk+1)。根据贝尔曼最优性原理[12]
(2)

则最优控制可以表示为
(3)

其方法有很多种,本文利用近似值函数的方法来实现整个算法过程,这可以很好地解决动态规划的维数灾问题。近似动态规划变量说明见表 1
表 1 近似动态规划变量说明 Table 1 ADP symbology
变量说明
x状态矢量
xi在第i步的状态
xnX的第n个状态矢量
xterm特殊的终止状态
xpos无人机x坐标
ypos无人机y坐标
X状态矢量[x1, x2, …, xn]T
f(x, u)状态转移函数
π(x)机动策略
π*(x)最佳机动策略
π(x)通过滚动算法生成的策略
J(x)状态x的未来奖励值
Jk(x)J(x)的第k次迭代
Japprox(x)J(x)的函数逼近形式
S(x)无人机的评估函数
γ奖励折扣因子
u控制或移动动作
ζ(x)状态x的特征向量
β函数参数向量
g(x)目标奖励函数
gpa(x)优势位置函数
pt终止函数的概率
TBellman逆操作因子
J*(x)J(x)的最佳值


表选项






2 算法构架 算法的基本函数是状态转移函数,将目标追踪的过程离散化,则每个状态到下一个状态由状态转移函数控制。而奖励函数、特征生成函数、轨迹采样函数等都用来生成近似值函数,值函数即状态的未来奖励值,奖励值越大,则对于无人机来说位置就越好,可以通过近似的值函数产生最佳策略。算法框架如图 2所示。
图 2 算法框架 Fig. 2 Algorithm framework
图选项




2.1 状态量、目标、控制量以及动力学 跟踪系统的状态量x由无人机和目标的位置、偏航角和滚转角组成,本文目标可以指具有滚转角特征的比如其他飞行器、鸟类等,如果为其他不具有滚转角的目标,则可替代为控制量直接作用的状态量。本文选取的是具有滚转角的对象,以我方飞行器为蓝色无人机,目标用红色代替[13]
(4)

式中:ψ为偏航角,下标b和r分别表示蓝色和红色无人机;?为滚转角;xposypos可以在x-y平面内任意取值,滚转角和偏航角需要在[-180°, 180°]取值。
跟踪的目标始终在一定范围之内,有时候还需要其他的目标来满足需求,比如必须把无人机限制在目标后方的一定扇形区域内,以保证我方无人机占据优势的战略地位。还有其他需求,比如跟随航拍,就必须把无人机限制在目标前方的扇形区域内,本文设定的目标是在其后方的扇形区域内。具体区域如算法1所示,AA和ATA分别为方位角和天线拂擦角。奖励区域如图 3所示。
图 3 奖励区域 Fig. 3 Reward area
图选项





??算法1 ?优势位置函数gpa(x)
??输入:{x}。
R=“飞行器与目标的欧几里得距离”
if(0.1 m < R < 3.0 m) & (|AA| < 60°) &
??????(|ATA| < 30°)
then
??????gpa(x)=1.0
else
??????gpa(x)=0
end if
??????输出奖励:(gpa)。


表选项






控制量以及动力学,动力学主要被使用在状态转移函数f(xi, ub, ur),如算法2所示。urub分别为敌方无人机与我方无人机的控制指令,Δt为仿真步长;?rmax?bmax分别为敌方无无人机及我方无人机的最大滚转角以及滚转角变化率;ψv分别为敌方无无人机及我方无人机的最大偏航角、偏航角变化率及速率。控制变量由3种方式构成,{向左、保持、向右},且每个控制变量只作用一个步长。控制量直接控制滚转角,而飞行器通过滚转来产生偏航加速度,由此使飞行器偏航[12]

????算法2 ??状态转移函数f(xi, ub, ur)
????输入:{xi, ub, ur}。
for i=1:5(once per Δt=0.05 s) do
????for{red, blue} do
??????????( =40(°)/s, ?rmax=18°, ?bmax=23°)
??????????if u=L then
?????????? ?????=max(?Δt, -?max)
??????????else if u=R then
?????????? ???? ?=min(?+Δt, ?max)
??????????end if
?????????? tan ?(assume v=2.5 m/s)
??????????ψ=ψ+Δt; xpos=xpostvsin ψ
??????????ypos=ypostvcos ψ
???? end for
end for


表选项






2.2 奖励函数 为了更好地训练无人机的跟踪效率,本文使用极大极小算法使跟踪目标与我方无人机进行博弈。而对于每个状态,我方及目标皆有3个机动策略,所以有9种可能的结束状态,红色目标的机动策略选择源自双方的初始状态与9种可能情况的结合机动策略,通过状态转移函数计算结束状态。而在每个状态采用一种评分体系对当前位置进行评分, 表示红色目标的优势程度,因此,我方无人机的目标就是最大化地减小其评分。
按照目标的定义,跟随在目标的后方的一定距离以内,可以得到优势位置函数gpa(x),可是它的不连续性导致近似值函数过程难于操作,所以引入连续的评估函数S(x), 将两者结合起来一起构成每个状态的评分体系[14]
评估函数表达式为
(5)

每架飞行器都有相对于另一架飞行器的对称表示,不失一般性,本文从蓝色飞行器角度描述几何。奖励区域为两箭头所夹区域,ATA为我方无人机头部与视距线的夹角,AA为视距线与敌方无人机头部反方向所成夹角。R为两物体之间的实际距离,Rd为两物体间的期望距离,常数p单位为m/(°),其为用来协调方位分数和距离分数。p的有效值为0.1 m/(°),R的有效值为2 m。目标奖励函数的具体表达式为
(6)

式中:wg=0.8为权重系数。
图 4图 5分别给出了评估函数以及具体奖励位置的三维图。假设目标在原点。
图 4 评估函数 Fig. 4 Evaluation function
图选项




图 5 优势目标奖励的位置 Fig. 5 Advantageous target reward position
图选项




2.3 特征选取 近似系统利用状态的特征来近似值函数,所以说,好的近似结果离不开选取好的特征。在2个物体跟随的状态经常被选用的特征是{, , AA, ATA, R},方位角(AA)和天线拂擦角(ATA)的定义如图 6所示,其最大幅度限制在180°以内,是飞行中重要的参数,{, }为它们对时间的导数,HCA为两飞行器头部夹角。R对于跟踪来说显然是很重要的参数。
图 6 角度定义 Fig. 6 Angle definition
图选项




(7)

(8)

(9)

(10)

(11)

(12)

角度AA及ATA的对于时间的导数,通常被用于人类飞行员驾驶飞行器的博弈战斗中,AA包含对手的偏航角度和转化率,范围和本飞行器速度转换成一个信息。ATA通常由人类飞行员在视觉上确定,并用作敌手即将进行的侵略性演习的初始指示。也被称为红色飞行器的视线率。从蓝色飞行器的角度来看,是对面飞行器穿过挡风玻璃时每秒弧度的速率。它包含了自己的偏航角度和转弯速度,射程和对手的速度。加上两物体在每个状态时的滚转角?b?r构成近似动态规划的基本特征。
这些被选取的特征被用来形成特征向量ζ(x),特征量通过相互组合进行扩充,举个例子,如果选取的特征量为{A(x), B(x), C(x)}, 则形成的特征向量为
(13)

则在第k次迭代后,值函数可以被近似为
(14)

式中:βk为各个特征对于近似值函数的权重系数。可以看出,如果特征量选取越多,则近似值函数对于真正值函数更为接近,但是由此可以看出,特征量选取的越多,则计算的复杂度和量要大大增加,这违背了本文选取近似动态规划的初衷。所以选取上述对于目标跟踪十分重要的特征, 总计如下[15]
(15)

2.4 轨迹采样 采样点越密集则对于近似值函数来说就更加精确,但是对于计算量来说,采样点越密集,计算量就越大,因此应选择采样区间。
为了使采样的空间更加符合目标跟踪时的实际情况。我方无人机以及跟踪目标的横纵坐标使用标准差为7 m的高斯分布,初始状态的偏航角以及滚转角符合均匀分布。就像最小二乘法中所使用的方法,将所有采样的状态存储于一个大矩阵X中。
(16)

使用生成的采样点生成构建近似动态规划框架的特征为
(17)

2.5 目标策略函数 为了更好地训练值函数,使得训练出来的值函数具有最大的普遍性,目标运动算法选择博弈算法,本文采用Minimax算法,Minimax算法又名极大极小算法,是一种找出失败的最大可能性中的最小值的算法[16]
Minimax算法常用于棋类等由两方较量的游戏和程序。该算法是一个零总和算法,即一方要在可选的选项中选择将其优势最大化的选择,另一方则选择令对手优势最小化的方法。而开始的时候总和为0。其算法如图 7所示。
图 7 Minimax算法流程 Fig. 7 Minimax algorithm flowchart
图选项




2.6 生成近似值函数 通过合理的轨迹采样、特征选取以及奖励函数的建立,可以通过算法得到一个与真实值函数十分近似的近似值函数。其具体思想如下所示。
假设λ是列向量的系数,本文可以把整个模型[17]写为
(18)

式中:yxε分别为因变量、自变量和估计误差。
本文假设(ε1, ε2, …, εn)符合独立同分布,参数向量λ的具体值未知,所以本文用一个λ来生成预测公式。
(19)

yn是本文对yn+1的预测,那么预测误差可以写为
(20)

那么本文的目标变为选择一个β使误差的平方和最小,即
(21)

则问题变为很熟悉的最小二乘问题,则最优的参数向量β(n轮观测之后)可以给出,将每轮观测值存储至Yn,可得
(22)

则通过以上方式,本文可以得到近似值函数,算法大概通过40次迭代,可以得到最优的参数矩阵。
2.7 策略选取(控制指令生成) 尽管本文的近似值函数相对于真正值函数来说已经十分接近,但对于策略选择来说,仍有可能不是最优的策略,所以策略选取应用rollout策略[18]。rollout算法是对于当前状态,从每一个可能的动作开始,之后根据给定的策略进行路径采样,根据多次采样的奖励和来对当前状态的行动值进行估计。在当前估计基本收敛时,会根据行动值最大的原则选择动作进入下一个状态再重复上述过程。在蒙特卡罗控制中,采样的目的是估计一个完整的,最优价值函数,但是rollout算法中的采样目的只是为了计算当前状态的行动值以便进入下一个状态,而且这些估计的行动值并不会被保留。在得到最优的策略函数后也可将结果放入神经网络训练,利用决策对特征进行分类,使得无人机在博弈或者跟随目标的程中快速做出决策。算法具体实现过程如算法3所示。

????算法3 ??rollout算法
????输入:xi
????初始化:Jbest=-∞。
for ub={L, S, R}
do xtemp=f(xi, ub, πrnom(xtemp))
????for j={1:Nrolls}
????do
??????xtemp=f(xtemp, πapproxN(xtemp), πrnom(xtemp))
????end for
????Jcurrent=[γJapproxN(xtemp)+g(xtemp)]
????if Jcurrent>Jbest
????then
??????ubest=ub, Jbest=Jcurrent
????end if
end for
????输出:ubest


表选项






3 仿真结果 对定常运动的目标以及与我方无人机博弈的目标的跟踪任务进行了仿真,任务是始终在目标的后方的0.1~3 m,最后将本控制算法与经典控制算法PID进行比较,得出本算法在复杂环境下的优势。
通过之前所叙述的利用博弈离线训练好近似值函数特征参数的方法,结合rollout算法,可以得到最优的控制指令。
通过给定两方无人机不同的初始状态以及选取目标无人机的不同策略,来模拟不同环境的工况,初始状态以及目标策略选取如表 2所示,其中,Minimax代表目标无人机选取与我方博弈的极大极小策略,Maintain代表目标无人机选取定常的直线运动。
表 2 各仿真图初始状态及目标策略 Table 2 Initial state and objet strategy of each simulation chart
xinitxbpos/mybpos/mψb/rad?b/radxrpos/myrpos/mψr/rad?r/radπr
101001000Minimax
201001000Maintain
301-π/601000Maintain
401π/601000Minimax
注:πr—敌机机动策略。


表选项






最后,对比本文与传统PID算法的仿真结果,由于PID算法只能跟踪预定轨迹,在进行PID算法的仿真时,将ADP仿真完成后得到的目标轨迹给定给PID算法,从而比较出本文算法优势。仿真结果如图 8~图 20所示,xinit为起始状态分类。各仿真图初始状态及目标策略如表 2所示。
图 8 60步长仿真(xinit=1) Fig. 8 60 step length simulation (xinit=1)
图选项




图 9 实时与目标距离(xinit=1) Fig. 9 Real-time target distance (xinit=1)
图选项




图 10 60步长仿真(xinit=2) Fig. 10 60 step length simulation (xinit=2)
图选项




图 11 实时与目标距离(xinit=2) Fig. 11 Real-time target distance (xinit=2)
图选项




图 12 60步长仿真图(xinit=3) Fig. 12 60 step length simulation chart (xinit=3)
图选项




图 13 实时与目标距离(xinit=3) Fig. 13 Real-time traget distance map (xinit=3)
图选项




图 14 60步长仿真(xinit=4) Fig. 14 60 step length simulation chart (xinit=4)
图选项




图 15 实时与目标距离(xinit=4) Fig. 15 Real-time traget distance map (xinit=4)
图选项




图 16 给定PID目标轨迹时的仿真比较 Fig. 16 Simulation comparison when PID target trajectory is given
图选项




图 17 PID跟踪误差以及ADP与目标距离 Fig. 17 PID tracking error and target distance from ADP simulation
图选项




图 18 非线性预测模型方法与ADP的跟踪比较 Fig. 18 Comparison of tracking between nonlinear prediction model methods and ADP
图选项




图 19 非线性预测模型方法与ADP的跟踪误差比较 Fig. 19 Comparison of tracking error between nonlinear prediction model method and ADP
图选项




图 20 无人机跟踪与博弈 Fig. 20 UAV tracking and gaming
图选项




由以上仿真结果可知,如果已知目标的位置,目标的运动是定常的,如图 11图 13所示可以实现很好的跟随,并且按照预定的目标始终跟在目标的后方,而对于目标运动变化较大,甚至与我方进行博弈的情况下如图 9图 15所示,由仿真图所示,该算法具有一定的预测性,该控制算法可以实现很好的跟随。与给定PID目标轨迹的控制方法比较,可以看到,即使给定传统PID算法目标轨迹,其跟踪的稳定性也不是很好,具有一定的振荡,但对于ADP算法,从图 16中可以看出其具有一定的预测性,且其与目标的距离始终保持在之前设定的0.1~3 m的范围以内,不妨假设ADP跟踪的目的为与目标为1 m,而PID的目的为与目标的距离为0 m, 可以计算得到各算法的方差分别为
(23)

(24)

(25)

(26)

在这组仿真下可知,即使在ADP算法不知道目标的轨迹的前提下,ADP算法也具有更好的稳定性。由此可知,该算法可以适应于较为复杂的环境。
图 20所示的是基于非线性模型预测跟踪控制算法的逃逸无人机控制[17-19],由图可知,虽然这种算法有着较好的跟踪结果,但是由于这种方法本身不产生机动,所以该方法有着一个天然的缺陷,它不具有在追踪和逃逸角色切换的能力。而ADP算法可以很好地实现角色的切换。
4 结论 1) 本文对无人机跟踪控制算法进行研究,提出了将近似动态规划用于目标跟踪问题中的飞行控制问题,在已知双方状态的条件下,可以应对目标的灵活运动,预测目标的运动轨迹。
2) 为了确保得到的决策是最优决策, 使用rollout算法得出结论。实现了飞行器在跟踪甚至博弈过程中的有效跟踪,在现行跟踪问题上缺少飞行控制的研究进行了补充。
3) 仿真验证了目标跟踪的有效性。对于多目标且多控制体的模型可以结合粒子群算法、遗传算法等其他智能算法[20]来实现。项目可以应用于大多数跟随场合以及大多数飞行器博弈场合。

参考文献
[1] 卢虎川, 李佩霞, 王栋. 目标跟踪算法综述[J]. 模式识别与人工智能, 2018, 31(1): 61-76.
LU H C, LI P X, WANG D. Visual object tracking:A survey[J]. Pattern Recognition and Artificial Intelligence, 2018, 31(1): 61-76. (in Chinese)
[2] CHENG Y Z. Meanshift, mode seeking, and clustering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, 17(8): 790-799. DOI:10.1109/34.400568
[3] ADAM A, RIVLIN E, SHIMSHONI I.Robust fragments-based tracking using the integral histogram[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Piscataway, NJ: IEEE Press, 2006: 798-805. http://www.cs.technion.ac.il/~amita/fragtrack/fragtrack_cvpr06.pdf
[4] TURK M, PENTLAND A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience, 1991, 3(1): 71-86. DOI:10.1162/jocn.1991.3.1.71
[5] TANG M, FENG J.Multi-kernel correlation filter for visual tracking[C]//Proceedings of the IEEE International Conference on Computer Vision.Piscataway, NJ: IEEE Press, 2016: 3038-3046. https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Tang_Multi-Kernel_Correlation_Filter_ICCV_2015_paper.pdf
[6] LI Y, ZHU J K.A scale adaptive kernel correlation filter tracker with feature integration[C]//Proceedings of the European Conference on Computer Vision.Berlin: Springer, 2014: 254-265. http://vigir.missouri.edu/~gdesouza/Research/Conference_CDs/ECCV_2014/workshops/w09/W9-07.pdf
[7] DANELLJAN M, HGER G, KHAN F S.Accurate scale estimation for robust visual tracking[EB/OL].[2017-11-27].http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/index.html.
[8] HENRIQUES J F, CASEIRO R, MARINS P, et al. High-speed tracking with kernelized correlation filters[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 37(3): 583-596.
[9] LI Y, ZHU J K, HOI S C H.Reliable patch trackers: Robust visual tracking by exploiting reliable patches[C]//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition.Piscataway, NJ: IEEE Press, 2015: 353-361. https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Li_Reliable_Patch_Trackers_2015_CVPR_paper.pdf
[10] MA C, HUANG J B, YANG X K, et al.Hierarchical convolutional features for visual tracking[C]//Proceedings of the IEEE International Conference on Computer Vision.Piscataway, NJ: IEEE Press, 2015: 3074-3082. https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Ma_Hierarchical_Convolutional_Features_ICCV_2015_paper.pdf
[11] 魏庆来.基于近似动态规划的非线性系统最优控制研究[D].沈阳: 东北大学, 2008: 6-8.
WEI Q L.Researches on optimal control of nonlinear systems based on approximate dynamic programming[D].Shenyang: Northeastern University, 2008: 6-8(in Chinese). http://cdmd.cnki.com.cn/Article/CDMD-10145-1012300362.htm
[12] BELLMAN R. On the theory of dynamic programming[J]. Proceedings of the National Academy of Sciences of the United States of America, 1952, 38(8): 716-719. DOI:10.1073/pnas.38.8.716
[13] ISAACS R. Games of pursuit[M]. Santa Monica, CA: The Rand Corporation, 1951: 256-257.
[14] AUSTIN F, CARBONE G, FALCO M, et al. Game theory for automated maneuvering during air-to-air combat[J]. Journal of Guidance, Control, and Dynamics, 1990, 13(6): 1143-1149. DOI:10.2514/3.20590
[15] MCGREW J S, HOW J P, WILLIAMS B, et al.Air combat strategy using approximate dynamic programming[C]//AIAA Guidance, Navigation, and Control Conference and Exhibit.Reston: AIAA, 2008: 6-13. https://arc.aiaa.org/doi/abs/10.2514/1.46815
[16] ANWAR H, ZHU Q Y.Minimax game-theoretic approach to multiscale H-infinity optimal filtering[C]//2017 IEEE Global Conference on Signal and Information Processing(GlobalSIP).Piscataway, NJ: IEEE Press, 2017: 853-857. https://nyuscholars.nyu.edu/en/publications/minimax-game-theoretic-approach-to-multiscale-h-infinity-optimal-
[17] SPRINKLE J, EKLUND J, KIM H, et al.Encoding aerial pursuit/evasion games with fixed wing aircraft into a nonlinear model predictive tracking controller[C]//Proceedings of 200443rd IEEE Conference on Decision and Control(CDC).Piscataway, NJ: IEEE Press, 2004: 2609-2614. https://www.researchgate.net/publication/4142744_Encoding_aerial_pursuitevasion_games_with_fixed_wing_aircraft_into_a_nonlinear_model_predictive_nacking_controller
[18] EKLUND J, SPRINKLE J, KIM H, et al.Implementing and testing a nonlinear model predictive tracking controller for aerial pursuit/evasion games on a fixed wing aircraft[C]//Proceedings of 2005 American Control Conference.Piscataway, NJ: IEEE Press, 2005: 1509-1514. https://people.eecs.berkeley.edu/~sastry/pubs/PDFs%20of%20Pubs2000-2005/Publications%20of%20Postdocs/Eklund/Eklund.ImplementingTesting%202005.pdf
[19] SHAW R. Fighter combat tactics and maneuvering[M]. Annapolis: Naval Institute Press, 1985: 12-15.
[20] POWELLW B. Approximate dynamic programming solving the curses of dimensionality[M]. 2nd ed. Hoboken: John Wiley & Sons, Inc., 2011: 305-307.


相关话题/控制 规划 网络 奖励 计算

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 结冰条件下的飞行控制律重构设计方法*
    近年来,由飞机结冰而引发的飞行事故时有发生,造成了大量的人员伤亡和财产损失。飞机结冰是指在飞行过程中遭遇结冰天气而机体表面产生结冰的现象,是影响飞行安全的重要因素之一。针对飞机结冰问题,国内外都开展了大量的研究工作[1-4],飞机的防/除冰系统也由此得到迅猛发展[5-7],但是仅依靠防除冰系统也无法 ...
    本站小编 Free考研考试 2021-12-25
  • 电磁航天器编队悬停鲁棒协同控制方法*
    编队悬停是指空间中的多个伴随航天器在控制力或自然力的作用下,相对参考航天器或其他自然天体保持相对静止的状态。编队悬停技术在航天器在轨服务、深空探测、航天器跟踪监视等领域有着广泛的应用[1-3]。航天器悬停编队的实现依赖于准确的轨道和姿态控制。在近距离悬停时,传统基于冲量原理的推力器会造成羽流污染,某 ...
    本站小编 Free考研考试 2021-12-25
  • 基于航路点布局的多目标网络结构优化方法*
    中国空域呈现碎片化、多元化特征,且部分区域航路网络结构与飞行流量分布的矛盾十分突出[1]。为了规避障碍空域,同时避免因节点失效而导致的网络崩溃,需进行航路网络结构优化。航路网络结构优化指通过调整航路点及航段的数量和位置以改变原有网络的性质和布局,从而实现优化目标[2]。根据规模大小,航路网络结构优化 ...
    本站小编 Free考研考试 2021-12-25
  • 能量有效的无线传感器网络分簇路由协议*
    微电子技术、无线通信技术的发展以及计算技术的提高,推动了多功能的低功耗传感器的进步,使其在自身微小体积内能够实现采集信息、处理数据和无线通信等多种功能。无线传感器网络(WirelessSensorNetworks,WSNs)是一种分布式传感器网络,其末梢是可以感知外部世界的廉价传感器,目的是共同感知 ...
    本站小编 Free考研考试 2021-12-25
  • 面向气热耦合的涡轮叶片计算域模型建模方法*
    推重比是航空发动机重要性能参数,提高涡轮前燃气温度是提高推重比有效措施[1]。由于涡轮前燃气温度已远高于叶片常用材料的耐受温度,为保证叶片安全工作及寿命要求,在结构设计中普遍采用复合冷却技术对叶片进行冷却,这使得涡轮叶片结构复杂[2]。准确预测涡轮叶片的温度场是提高冷却效率、延长叶片工作寿命的关键[ ...
    本站小编 Free考研考试 2021-12-25
  • 基于多轴同步控制的微尺度双向加载实验系统*
    随着环境污染、能源短缺等问题的日益突出,微型产品的市场需求显著增加。作为一种先进的微纳制造技术,微细成形具有成本低、效率高、制件性能好等优点,是解决轻质耐高温材料和特殊薄壁微结构制造的最有效途径,在微电子、汽车、航空和医疗等领域得到了广泛应用[1-3]。微细成形虽然继承了传统塑性加工技术的优点,但当 ...
    本站小编 Free考研考试 2021-12-25
  • 基于软件定义微纳卫星的多模式计算光学成像技术*
    面向未来智能卫星发展的国家重大战略需求,为实现有效载荷具备上载软件在轨定义多功能、软件可控多功能、参数可重构的软件定义微纳卫星需求,将重点围绕计算光学、认知成像、最优控制、强化学习、智能控制等基础科学和应用科学问题,突破软件一体化、综合化、人机交互功能扩展化定义等新体制卫星载荷设计和研制的关键技术瓶 ...
    本站小编 Free考研考试 2021-12-25
  • 一种软件定义卫星网络的多波束切换机制*
    世界强国政府与工业部门已经充分认识到软件定义卫星网络(Software-DefinedSatelliteNetwork,SDSN)系统在21世纪国际竞争和国民经济发展中的重要作用,对其研究和应用的投入急速增加。目前,国内外著名研究机构、卫星通信公司都大力推进SDSN的理论方法与应用基础研究[1]。S ...
    本站小编 Free考研考试 2021-12-25
  • 兼顾控制流量的软件定义卫星网络路由策略*
    卫星网络具有覆盖范围广、不受地面条件约束和抗毁性强等显著优势,受到世界各国的广泛重视。然而,现有的卫星网络一般定制专用、各成体系,呈现出“烟囱林立”的特点,难以实现网络统一融合、资源动态管理和功能灵活配置。软件定义卫星网络(SoftwareDefinedSatelliteNetworks,SDSN) ...
    本站小编 Free考研考试 2021-12-25
  • 基于深度强化学习的软件定义卫星姿态控制算法*
    近年来,随着卫星软硬件技术的迅速发展,卫星逐渐向小型化、低成本化、快速设计及部署的方向发展,每年有过百颗小卫星成功发射,这些小卫星有着不同的载荷和任务目标、物理参数和轨道等,因此对其姿态控制系统的要求也不尽相同。而随着软件定义卫星概念的提出,利用可重组的动态载荷和智能性更强的姿态控制算法,有助于研发 ...
    本站小编 Free考研考试 2021-12-25