随着一致性理论的发展,近年来在分布式编队控制领域涌现出丰硕的研究成果。Dong[2]和He[3]等分别研究了连续时间和离散时间条件下的编队控制问题。Wang等[4]给出了一种单个智能体不依赖通信拓扑全局信息的编队控制方法。Hua等[5]研究了系统存在不确定参数及未知扰动情况下的时变编队控制问题。随着研究的深入,研究者们将如何控制整个编队的移动纳入研究的重点,进而衍生出编队跟踪控制问题。Dong等[6]研究了二阶多智能体系统的编队跟踪控制问题,并将其成功应用到无人机编队飞行中。Yu等[7]基于扩张状态观测器理论构造分布式的控制协议,解决了多移动机器人系统的编队跟踪控制问题。Dong[8]和Yu[9]等分别研究了存在多个领导者情况下线性和非线性多智能体系统时变编队跟踪控制问题。Su等[10]给出了随机采样机制下多智能体系统内部同时存在通信延迟和多个领导者时编队跟踪控制问题的解决方案。Hua等[11-12]进一步将多智能体系统由同构模型扩展到异构模型,研究了异构多智能体系统的时变编队跟踪控制问题。为使编队跟踪能够在有限时间内完成,Hua等[13]还研究了高阶同构系统存在不匹配扰动情况下有限时间时变编队跟踪控制问题。更进一步,Duan等[14]研究了高阶异构多智能体系统的有限时间编队跟踪控制问题。
综上所述,有关时变编队跟踪控制的研究成果十分丰富,但需要指出的是,上述文献并没有对时变编队队形进行明确定义,仅用一个时变函数来概括性表示编队偏移量,也没有对时变编队的应用性进行研究,而且该信息实际为全局信息在上述文献中为隐含全局信息。本文提出了一种基于集群系统分布式时变编队跟踪控制方法的护航策略,并考虑了拒止环境对通信拓扑的影响,是编队跟踪控制方法的一种典型实战应用。本文的创新点主要有:①基于分布式时变编队控制理论,结合应用背景和工程意义,给出了一种能够“忠诚僚机”的护航策略控制方法;②考虑长机-僚机系统存在外部扰动且长机存在大机动的情况,构造分布式观测器对敌方来袭导弹的方位角进行估计,进而结合观测器理论、自适应控制理论、滑模控制理论设计了分布式控制器,摆脱了对敌方来袭导弹方位角、通信拓扑结构及未知扰动上界等全局信息的依赖;③考虑在拒止环境下,复杂电磁干扰带来通信时断时续,导致长机与僚机及僚机与僚机之间的通信拓扑存在切换,进而在上述分布式观测器和控制器中加入通信拓扑切换信息,并根据Lyapunov理论给出了长机-僚机闭环系统的稳定性证明。
1 图论知识和问题描述 1.1 图论知识 图论知识作为描述系统通信拓扑关系的数学基础被广泛应用。定义一个有q个节点的图G,G={Λ, Π}, Λ={n1, n2, …, nq}表示点集,Π={(ni, nj):ni, nj?Λ}表示边集。图G的邻接矩阵W=[wij]∈Rq×q定义如下:如果节点nj到节点ni存在一条有向连接,则wij=1,否则wij=0,需要指出的是,如果存在的是无向连接,则可以看作双向连接,即wij=wji=1。同时图G的度矩阵D定义为:
1.2 问题描述 本文研究的系统模型为长机-僚机模型,包含1个长机和N个僚机。由于不同类型的飞行器近似线性化后的模型不尽相同,不失一般性,长机的模型定义为
(1) |
僚机的模型定义为
(2) |
式中:A、B为模型近似线性化后的系统矩阵;y1(t), yp(t)∈Rn为状态量;u1(t), up(t)∈Rm为控制输入量;dp(t)∈Rm为未知扰动量;p=2, 3, …, 1+N。
注释1 大多数空中飞行器在其工作点附近一般都可以近似线性化处理。例如,田磊等[15]给出了旋翼飞机近似线性化处理后的模型,Wang等[16]给出了固定翼飞机近似线性化处理后的模型。因此,上述长机和僚机定义模型的应用性较为广泛。
假设1在图G所表征的通信拓扑中,长机与某个僚机之间如果存在连接,则连接关系是从长机指向僚机的单向连接,而僚机之间的连接均为双向连接。当有多枚敌方导弹来袭时,僚机被分为多个小组,且不同小组之间不存在通信,整个通信拓扑包含一棵以长机为根节点的生成树。
如果假设1成立,当有M枚敌方导弹来袭时,图G的拉普拉斯矩阵可写为如下形式:
(3) |
通过分析拉普拉斯矩阵的形式可知,对角块矩阵Lg(g=1, 2, …, M)为正定实对称矩阵[17]。令Ldiag=diag{Lg, g=1, 2, …, M}。
假设2图G所表征的通信拓扑关系在某段固定时间间隔(定义为驻留时间τ)内保持不变,该段时间间隔的最小值定义为最小驻留时间,用τmin表示。定义t0=0为初始时刻,tσ+1(σ=0, 1, 2, …)为切换时刻,则驻留时间τσ=tσ+1-tσ≥τmin,在[tσ, tσ+1)时间间隔内的拉普拉斯矩阵记为Lσ。
假设3长机的控制输入和僚机的未知扰动是有界的,但是其界限的具体数值是未知的,即满足‖u1(t)‖1≤η1、‖dp(t)‖1≤η2,η1、η2为未知正实数。
注释2在实际系统中,控制输入量和未知扰动量通常是有界的,但是其界限值通常不容易获取,因此假设2是合理的。
假设4长机上含有探测设备,能够探测出敌方来袭导弹的方位角γg(t)(g=1, 2, …, M)。
注释3通常情况下,长机是价值较大需要保护的己方个体,长机上装有探测装置,可探测出来袭导弹的方位角。
引理1[15]对于任意正定实对称矩阵H∈RM×M(M=1, 2, …), 下列不等式关系成立:
(4) |
式中:λmin(H)为矩阵H的最小特征值。
引理2[15]对于任意正定实对称矩阵H1, H2∈RM×M和任意向量x∈RM(M=1, 2, …), 下列不等式关系成立:
(5) |
式中:λmax(H1H2-1)为矩阵H1H2-1的最大特征值。
定义1对于任意有界初始状态,如果以下关系式成立,且该关系式中设计的时变编队函数能够使僚机一直处于长机和敌方来袭导弹的视线轴上,则称本文提出的基于拒止环境下的时变编队跟踪控制方法的护航策略能够实现。
(6) |
式中:p=2, 3, …, 1+N;hp(t)为设计的时变编队函数。
2 控制协议设计和系统稳定性分析 本节根据本文所提出的护航策略给出时变编队函数的设计方法,同时考虑拒止环境带来的影响,构造能够实现切换通信拓扑关系的分布式时变编队跟踪控制协议。不仅如此,设计协议时结合自适应控制理论,解决系统的外部扰动和通信拓扑全局信息不易获取的问题。通过Lyapunov理论对闭环系统的稳定性进行证明。
不失一般性,通过图 1(二维横侧向XOY平面内)可直观地理解本文所提出的护航策略。
图 1 护航策略示意图 Fig. 1 Schematic diagram of escort strategy |
图选项 |
根据图 1中给出的策略可知,二维平面内的时变编队函数可设计如下:
(7) |
式中:p=2, 3, …, 1+N;dp(t)为僚机p与长机1之间的相对位置距离;
(8) |
式中:
设计对γg(t)的分布式观测器:
(9) |
式中:p=2, 3, …, 1+N;k为可选取的正实数;wp1σ、wpkσ为t∈[tσ, tσ+1)时邻接矩阵的权重值。
基于上述观测器,构造分布式自适应控制协议如下:
(10) |
式中:sgn(·)表示标准符号函数;αp(t)为自适应增益;hp(t)为时变编队函数,其在OX轴和OY轴方向分别设计为式(7)中对应的函数,其他待确定参数由算法1确定, 具体步骤如下:
步骤1选取
步骤2根据下列Riccati方程计算正定实对称矩阵Q:
(11) |
式中:μ为可选取的正实数,满足μ≤;P为可选取的正定实对称矩阵。
步骤3根据公式K=-BTQ计算增益矩阵K。
步骤4选取βp∈(0, +∞),βp为可调参数,可根据系统其他参数综合选取,从而避免过慢的响应速度或过高的控制增益。
定理1假定系统的动力学模型如式(1)和式(2)所示,僚机采用控制协议(10),如果最小驻留时间τmin满足ln ε-μτmin < 0,ε为矩阵Ldiagi(Ldiagj)-1的最大特征值,记为ε=max{λmax(Ldiagi(Ldiagj)-1), i, j∈{0, 1, …}, i≠j},则本文所提出的拒止环境下基于时变编队跟踪控制方法的护航策略可以实现。
证明首先证明分布式观测器(9)的收敛性。
由式(9)可知
(12) |
令
(13) |
式中:t∈[tσ, tσ+1),σ=0, 1, 2, …。
对Vg(t)求导可得
(14) |
由式(14)可得
(15) |
因为系统的通信拓扑在tσ(σ=1, 2, …)时刻发生切换,由引理2可得
(16) |
式中:tσ-为tσ的左极限。
因为
(17) |
根据式(15)和式(17)可以推出
(18) |
运用递归方法可得
(19) |
根据t-t0=t-tσ+tσ-tσ-1+…+t1-t0≥t-tσ+στmin可以推出
(20) |
由ln ε-μτmin < 0和μ≤k可得ln ε-kτmin < 0,进而可知
接下来证明在控制协议(10)下,本文所提出的拒止环境下基于时变编队跟踪控制方法的护航策略可以实现。对于所有僚机,将式(10)代入式(2)中可得
(21) |
令zp(t)=yp(t)-hp(t)-y1(t),同时定义z1(t)=0,可以推出
(22) |
根据算法1中的步骤1及式(8)和式(10)可知,
(23) |
更进一步,将式(10)中的updis(t)代入式(23)可得
(24) |
令z(t)=[z2(t), z3(t), …, z1+N(t)]T,u(t)=1?u1(t),d(t)=[d2(t), d3(t), …, d1+N(t)]T,同时令α(t)=diag{α2(t), α3(t), …, α1+N(t)},其中1为元素全部为1的列向量,则式(24)可写为如下形式:
(25) |
考虑Lyapunov函数如下:
(26) |
式中:χ为可选取的正常数;t∈[tσ, tσ+1),σ=0, 1, 2, …。
对V(t)求导并由K=-BTQ可得
(27) |
因为
(28) |
且根据δTsgn(δ)=δ1可得
(29) |
所以式(27)可化为
(30) |
进一步分析可得
(31) |
同时分析可知
(32) |
因此可以推出以下关系式成立:
(33) |
根据引理1可知
(34) |
结合式(33)和式(34)可得
(35) |
选取足够大的χ满足:χ>max{η1+η2, 1/(2λmin(Ldiagσ))},并根据算法1中的步骤2可得
(36) |
式中:
由式(36)可以推出
(37) |
因为系统的通信拓扑在tσ(σ=1, 2, …)时刻发生切换,由引理2可得
(38) |
因为ξ(t)是连续的,因此以下关系式成立:
(39) |
由式(37)可推出
(40) |
结合式(37)和式(39)可得
(41) |
进而根据式(40)和式(41)可以推出
(42) |
同理可以得到以下关系式:
(43) |
(44) |
因此可将式(42)进一步化为
(45) |
更进一步运用递归方法可得
(46) |
式中:
现对V*(t)进行分析,运用分部积分法可得
(47) |
接下来分2种情况讨论:
1) 假设ξ(t)是有界的,则αp(t)(p=2, 3, …, 1+N)收敛到某个有界值,可以推出
2) 假设ξ(t)是无界的,则αp(t)(p=2, 3, …, 1+N)也是无界的,可以推出
综合上述讨论结果可知, ξ(t)是有界的,进而可以得到
注释4算法1中步骤2的Riccati方程(11)有解的条件是(A, B)可镇定[18]。因为观测器中的k和算法1中μ、P和βp均为可选参数, 它们的选取会影响到最小驻留时间τmin、增益矩阵K及自适应增益αp(t),所以根据实际应用选择恰当的参数也是十分必要的。需要特别指出的是,由于滑模控制的抖振现象及系统外部扰动的存在,αp(t)是单调递增的。为避免αp(t)的值过高,增加如下约束:如果
3 数值仿真 仿真中模仿敌方导弹来袭场景,为更好地验证本文所提出的护航策略,想定如下:在拒止环境下,我方1架空中预警机通过预警雷达探测到3枚敌方来袭导弹的方位角,在进行机动规避时同步释放6架小型无人机担任“忠诚僚机”,引导这些小型无人机处于敌方来袭导弹的视线轴上。为模拟拒止环境给通信带来的不利影响,我方预警机与小型无人机采用分布式通信方式,每种通信拓扑结构只能维持极短的时间,时变拓扑的切换过程如图 2所示,每次切换后的通信拓扑在G1、G2、G3中随机选取。为简化仿真计算,仿真仅考虑XOY横侧向平面内的质点运动,并采用文献[15]中的模型进行仿真验证,即经过近似线性化处理后,模型的系统矩阵为
图 2 拒止环境下的通信拓扑关系 Fig. 2 Communication topologies in denial environment |
图选项 |
将预警机标号为1,其在OX轴方向上的位置和速度用x1X(t)、v1X(t)表示,在OY轴方向上的位置和速度用x1Y(t)、v1Y(t)表示,将无人机标号为2~7,其X轴和Y轴方向上的位置和速度分别表示为xpX(t)、vpX(t)、xpY(t)、vpY(t)(p=2, 3, …, 7)。因为预警机可以做规避机动,所以其控制输入可以实时改变,为了凸显仿真效果,将其X轴和Y轴方向上的控制输入分别设定为u1X(t)=-5,u1Y(t)=15,而无人机所受外部扰动任意选取,其控制输入均采用控制协议(10),时变编队函数设计为
式中:
同时通过定理1计算可得τmin>0.962 4 s,可设定图中的通信拓扑驻留时间为2s。预警机t=0时刻的位置在坐标原点,在OX轴和OY轴正方向的速度均为100 m/s,同时在该时刻释放出无人机担任“忠诚僚机”。3枚敌方来袭导弹的t=0时刻的位置分别选定为(12 000, 10 000)m、(15 000, 3 000)m、(12 000, -4 000)m,导弹的速度均设为800 m/s。仿真中敌方来袭导弹采用真比例导引方式攻击我方预警机。图 3给出了分布式观测器的估计误差
图 3 分布式观测器的估计误差 Fig. 3 Estimate error of distributed observer |
图选项 |
图 4 无人机自适应增益曲线 Fig. 4 Curves of adaptive gains for UAVs |
图选项 |
图 5 整个护航过程图例 Fig. 5 Legend of whole escort process |
图选项 |
图 6 护航误差曲线 Fig. 6 Curves of escort error |
图选项 |
4 结束语 本文提出了一种基于“忠诚僚机”的护航策略,该策略主要采用分布式时变编队跟踪控制的相关方法,设计控制协议时结合了观测器理论、自适应控制理论、滑模控制理论等,通过理论推导和仿真计算验证了该策略能够实现拒止环境下长机-僚机系统通信受到干扰时僚机对长机的护航作用,具有良好的工程应用意义。
参考文献
[1] | REN W. Consensus strategies for cooperative control of vehicle formations[J]. IET Control Theory and Applications, 2007, 1(2): 505-512. DOI:10.1049/iet-cta:20050401 |
[2] | DONG X W, HU G Q. Time-varying formation control for general linear multi-agent systems with switching directed topologies[J]. Automatica, 2016, 73: 47-55. DOI:10.1016/j.automatica.2016.06.024 |
[3] | HE Y L, ZHANG J Q, HOU Y Q, et al. Time-varying formation control for second-order discrete-time multi-agent systems with directed topologies and nonuniform communication delays[J]. IEEE Access, 2019, 7: 33517-33527. DOI:10.1109/ACCESS.2019.2904663 |
[4] | WANG R, DONG X W, LI Q D, et al. Distributed adaptive formation control for linear swarm systems with time-varying formation and switching topologies[J]. IEEE Access, 2016, 4: 8995-9004. DOI:10.1109/ACCESS.2016.2646399 |
[5] | HUA Y Z, DONG X W, LI Q D, et al.Robust adaptive time-varying formation control for high-order linear uncertain multi-agent systems[C]//201736th Chinese Control Conference (CCC), 2017: 8349-8354. |
[6] | DONG X W, ZHOU Y, REN Z, et al. Time-varying formation tracking for second-order multi-agent systems subjected to switching topologies with application to quadrotor formation flying[J]. IEEE Transactions on Industrial Electronics, 2017, 64(6): 5014-5024. DOI:10.1109/TIE.2016.2593656 |
[7] | YU J L, DONG X W, LI Q D, et al. Practical time-varying formation tracking for multiple non-holonomic mobile robot systems based on the distributed extended state observers[J]. IET Control Theory and Applications, 2018, 12(12): 1737-1747. DOI:10.1049/iet-cta.2017.1397 |
[8] | DONG X W, TAN Q K, LI Q D, et al. Necessary and sufficient conditions for average formation tracking of second-order multi-agent systems with multiple leaders[J]. Journal of the Franklin Institute, 2017, 354(2): 611-626. DOI:10.1016/j.jfranklin.2016.10.030 |
[9] | YU J L, DONG X W, LI Q D, et al. Practical time-varying formation tracking for second-order nonlinear multiagent systems with multiple leaders using adaptive neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(12): 6015-6025. DOI:10.1109/TNNLS.2018.2817880 |
[10] | SU H S, ZHANG J X, CHEN X. A stochastic sampling mechanism for time-varying formation of multiagent systems with multiple leaders and communication delays[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(12): 3699-3707. DOI:10.1109/TNNLS.2019.2891259 |
[11] | HUA Y Z, DONG X W, WANG J B, at el. Time-varying output formation tracking for heterogeneous linear multi-agent systems with multiple leaders and switching topologies[J]. Journal of the Franklin Institute, 2019, 356(1): 539-560. DOI:10.1016/j.jfranklin.2018.11.006 |
[12] | HUA Y Z, DONG X W, HU G Q, at el. Distributed time-varying output formation tracking for heterogeneous linear multi-agent systems with a nonautonomous leader of un-known input[J]. IEEE Transactions on Automatic Control, 2019, 64(10): 4292-4299. DOI:10.1109/TAC.2019.2893978 |
[13] | HUA Y Z, DONG X W, HAN L, at el. Finite-time time-varying formation tracking for high-order multiagent systems with mismatched disturbances[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2020, 50(10): 3795-3803. |
[14] | DUAN J, ZHANG H G, CAI Y L, at el. Finite-time time-varying output formation-tracking of heterogeneous linear multi-agent systems[J]. Journal of the Franklin Institute, 2020, 357(2): 926-941. DOI:10.1016/j.jfranklin.2019.10.012 |
[15] | 田磊, 王蒙一, 赵启伦, 等. 拓扑切换的集群系统分布式分组时变编队跟踪控制[J]. 中国科学:信息科学, 2020, 50(3): 408-423. TIAN L, WANG M Y, ZHAO Q L, et al. Distributed time-varying group formation tracking for cluster systems with switching interaction topologies[J]. Scientia Sinica Informations, 2020, 50(3): 408-423. (in Chinese) |
[16] | WANG X J, WANG S P, YANG Z W, at el. Active fault-tolerant control strategy of large civil aircraft under elevator failures[J]. Chinese Journal of Aeronautics, 2015, 28(6): 1658-1666. DOI:10.1016/j.cja.2015.10.001 |
[17] | REN W, BEARD R W. Consensus seeking in multiagent systems under dynamically changing interaction topologies[J]. IEEE Transactions on Automatic Control, 2005, 50(5): 655-661. DOI:10.1109/TAC.2005.846556 |
[18] | LI Z K, DUAN Z S, CHEN G R, at el. Consensus of multiagent systems and synchronization of complex networks:A unified viewpoint[J]. IEEE Transactions on Circuits and Systems I:Regular Papers, 2010, 57(1): 213-224. DOI:10.1109/TCSI.2009.2023937 |