一致性是协同控制的基本问题,随着一致性理论的发展,基于一致性的控制策略被用来解决多智能体协同问题[7-11]。近年来,****们对基于一致性方法的编队跟踪控制开展了大量研究。Dong等[12]针对单领航者的二阶多智能体系统的分布式编队跟踪问题设计了控制协议。Han等[13]研究了二阶多智能体系统的编队跟踪问题,并考虑了时延对控制的影响。Xiong等[14]基于一致性方法提出同时考虑有限时间收敛和切换拓扑的时变编队跟踪控制协议。上述研究为进一步解决多智能体系统的编队跟踪控制问题提供重要理论成果,但均没有考虑外部扰动对控制效果的影响。文献[15]中关于编队跟踪的研究考虑了环境噪声的干扰作用。Niu和Geng[16]针对外部未知恒定扰动设计了一种指数抗干扰控制律,利用该控制律实现对参考轨迹的跟踪。在实际应用中,环境约束复杂,避撞控制是编队控制和编队跟踪控制必须考虑的问题[17-18],上述研究[15-16]均没有讨论编队的避撞问题。同时,现有的研究编队跟踪的文献很少有考虑障碍物对目标跟踪的遮挡作用。
本文研究了在外部扰动作用和障碍物遮挡作用下二阶多智能体系统以编队的形式跟踪运动目标的问题,其中目标的运动轨迹和环境中的障碍物分布信息都不是先验信息。很多运动物体的动力学模型都可以被简化为位置-速度-加速度的二阶模型,因此研究和解决二阶多智能体系统的协同控制问题具有较强的现实意义。本文基于一致性方法设计了时变编队跟踪控制协议和确定控制系数矩阵的算法,并给出了控制协议下系统稳定性分析和证明。基于人工势场法设计了避撞控制器,通过仿真实验检验了所设计控制器的性能。
与现有的相关研究相比,本文主要有如下创新点:①针对多智能体系统受到的外部扰动设计一种自抗扰时变编队跟踪控制器,通过系统的控制输入和输出直接实现对扰动的估计,相比基于模型的抗扰控制更适应于工程应用[19-20]。②同时考虑了多智能体系统对运动目标的时变编队跟踪控制、编队在线避障和智能体之间的避撞控制。③针对障碍物的遮挡作用,采用基于目标跟踪优先级的切换作用拓扑的策略,提高系统对目标的持续跟踪能力。另外,本文还设计了一种包含过渡过程的编队向量生成方法,能够结合智能体的最大速度和加速度和时变编队的期望轨迹生成最速编队指令。
1 模型准备和问题描述 1.1 图论的相关知识 多智能体系统中各智能体及其相互之间的作用拓扑可以用加权的有向图来表示,一个N阶的加权的有向图可以用G={V, E, W}来表示,其中:V={v1, v2, …, vN}表示图G中所有节点的集合,E?{(vi, vj):vi, vj∈V}表示图G中所有边的集合,W=[wij]∈RN×N为图G的邻接加权矩阵。连接节点vi和vj且作用信息由vi流向vj的边表示为eij=(vi, vj),可以看出这条边是有向的,称vi为父节点,vj为子节点。如果eij∈E,说明在图G中边eij=(vi, vj)存在,则边eij=(vi, vj)的权值wij>0,否则wij=0。节点vi的邻居的集合定义为Ni={vj∈V:eji∈E}。定义节点vi的入度为
如果图G的拓扑结构会随时间发生变化,则称其为切换拓扑结构。假设有一个均匀有界不重叠的时间间隔的无限序列[tk, tk+1)(k∈N),t0=0,0 < τ0≤tk+1-tk,τ0为驻留时间。图G的拓扑结构在驻留时间内保持不变,在切换时刻序列tk(k∈N)发生变化。切换信号表示为σ(t):[0, +∞)→{1, 2, …, p},其中p∈N表示拓扑图的编号,σ(t)表示t时刻系统作用拓扑的标号。在标号为σ(t)的拓扑图Gσ(t)中,令wσ(t)ij(i, j∈{1, 2, …, N})表示由节点vj到节点vi的边对应的权值,Nσ(t)i表示节点vi的邻居的集合,Lσ(t)表示Gσ(t)的Laplacian矩阵。
1.2 模型建立 本文研究多个智能体以编队形式跟踪运动目标的问题,认为智能体已具备目标检测、识别和定位能力,即在目标信息可获取的基础上开展研究。目标和其他智能体的区别在于:目标独立于智能体运动,不考虑其控制输入的设计;其他智能体是受控制的,控制量与目标、障碍和其他智能体的状态以及外部扰动有关。
考虑一个由N-1个同构的二阶智能体组成的多智能体系统,在研究其跟踪一个运动目标时,将目标看作系统中的一员,即系统是由N个二阶智能体组成的多智能体系统。不失一般性,将目标编号为1,其他智能体依次编号为2~N,令F={2, 3, …, N}表示这些智能体的编号集合。由于目标不接收其他智能体的状态信息,而其他智能体需要跟踪目标的运动,故目标为领航者,其他智能体为跟随者。
目标的动力学模型可以表示为
(1a) |
式中:x1(t)∈Rn和v1(t)∈Rn分别表示目标的位置和速度,n为空间维度;αx和αv为阻尼系数。在后面的分析和推导过程中,为便于描述,若没有特别强调,令空间维度n=1。令n=1时得出的结论通过Kronecker积运算可扩展至高维空间。故目标位置和速度可表示为:x1(t)∈R,v1(t)∈R。
智能体i(i∈F)的动力学模型表示为
(1b) |
式中:xi(t)∈R,vi(t)∈R,ui(t)∈R和di(t)∈R分别表示智能体i的位置、速度、控制输入和受到的外部扰动。分系统(1a)、(1b)组成系统(1),系统(1)为一个领航-跟随结构的多智能体系统。系统(1)中智能体k的状态向量用ηi(t)=[xi(t), vi(t)]T(i∈{1, 2, …, N})表示。对于任何控制系统,其受到的扰动输入应当是有界的。
跟随者在跟踪领航者的同时需要形成特定的队形,因此需要施加期望的编队指令,令fF(t)=[f2T(t), f3T(t), …, fNT(t)]T表示跟随者的编队向量,其中,fi(t)=[fix(t), fiv(t)]T。
实际的多智能体系统的编队运动任务中,障碍物是广泛存在的,其会阻碍智能体运动、威胁智能体安全或干扰智能体执行任务。结合实际,本文把智能体分为实体类障碍物和区域类障碍物,实体类障碍物会阻碍智能体运动,并会遮挡障碍物对目标的跟踪,且通常遮挡半径略大于安全半径;区域类障碍物表示一类特殊的区域,如军事背景下的敌方无线探测或干扰区域,该类区域本身不易被探测且不阻碍智能体运动。因此本文不考虑对区域类障碍物的避撞控制,但其存在的电磁场等会严重干扰智能体对目标的跟踪。本文把实体类障碍物和区域类障碍物对智能体跟踪目标的干扰作用统称为障碍物的遮挡作用。
实际的应用场景中,障碍物都有一定形状和体积。本文中,障碍物k的三维空间位置用Ok(t)表示,其遮挡作用范围的半径用rOk表示,智能体进入该范围时会丢失目标。用dksco1表示智能体对实体类障碍物k的感知距离,dksafe1表示障碍物k的安全距离,即当智能体与实体类障碍物的距离小于dksco1时会产生避障控制力,并认为距离等于或小于dksafe1时智能体会与障碍物碰撞。障碍物的模型如图 1所示,实体类障碍物建模见图 1(a)和图 1(b),区域类障碍物建模见图 1(a)。
图 1 障碍物模型 Fig. 1 Models of obstacles |
图选项 |
1.3 编队跟踪的定义 多智能体编队实现目标跟踪是指:多智能体系统中每个个体按照编队指令相互之间形成和保持期望的相对位置关系,同时编队整体跟踪目标的运动。如果把多智能体编队和目标看作整体,则编队实现目标跟踪即该整体实现编队跟踪。基于一致性理论,给出多智能体系统(1)的编队跟踪的定义如下:
定义1 ?对于多智能体系统(1),如果对任意有限的初始状态,有
(2) |
则称系统(1)可实现时变编队跟踪。
可以看出,多智能体系统(1)实现编队跟踪控制是指系统中跟随者与目标之间的相对状态收敛至期望值,该期望值通过编队向量给出,从而使得系统中各跟随者之间形成和保持期望的相对状态,同时跟随者形成的编队整体跟踪目标状态。
2 切换拓扑条件下的自抗扰时变编队跟踪控制 本节研究扰动作用下多智能体系统对运动目标的时变编队跟踪控制。后文针对障碍物遮挡作用下系统丢失目标提出切换拓扑的控制策略。考虑到该策略会影响编队跟踪控制,因此这里需要研究切换拓扑下自抗扰时变编队跟踪控制问题。
2.1 控制协议设计 构造如下时变编队跟踪控制协议:
(3) |
式中:wσ(t)ij表示标号为σ(t)的拓扑图中智能体i与智能体j的作用权重;系数矩阵α=[αx, αv]由系统动力学模型可以确定;K=[k11, k12]为常系数矩阵,需要设计算法进一步确定;zi(t)为对智能体i受到的外部扰动的补偿量,设计如下一阶扩张状态观测器确定扰动补偿量zi(t):
$$ | (4) |
式中:zi0(t)为中间量;βi1和βi2为观测器的参数。在许多实际应用中,通常取βi1=2ωi0和βi2=ωi02,其中ωi0为状态观测器的采样频率,为保证估计结果的精度,通常要求采样频率ωi0不小于系统外部扰动变化的频率ωid。
时变编队向量fF(t)描述了智能体之间的队形分布、变换和运动信息,设计和给出编队向量是独立于编队跟踪控制协议的另一项重要工作。本文通过设计如下的跟踪微分器给出一种编队指令的设计方法:
(5) |
式中:H为期望位置与初始位置之间沿期望轨迹的距离;amax为智能体的最大加速度;Vmax为智能体最大速度;xi*(t)为智能体i在t时刻期望的位置;vi*(t)为智能体i在t时刻期望的速度;函数sgn(·)为符号函数;函数Limit(y, a, b)定义为
上面设计的跟踪微分器(5)实际上是编队指令生成器,通过其设计的编队向量具有以下特点:
1) 面向实际应用。实际编队任务中系统的期望轨迹是已知的,同时实际的多智能体的动力学性能是有上界的,包括速度和加速度。跟踪微分器(5)的设计充分考虑了上述实际约束。
2) 速度最优性。跟踪微分器(5)实际上描述了一种直线运动最速过程,根据H的大小可分为以下2种情况:①H≤Vmax2/amax时,被控运动物体先以amax加速运动至速度v(v≤Vmax),再以-amax减速运动至静止状态;②H>Vmax2/amax时,被控运动物体先以amax加速运动,达到Vmax后匀速运动一段时间,再以-amax减速运动至静止状态。这种运动控制策略使得物体能以最短时间由起始点运动至目标点,且保证物体在初始时刻和终止时刻都是静止状态。
3) 包含过渡过程。通过跟踪微分器给控制输入提供过渡过程,从控制的角度看,其给系统提供的编队指令速度信号是斜坡信号而非阶跃信号,使系统的控制输入由零平滑增大,系统能基本无超调跟踪输入指令[21],有利于系统的稳定。
需要注意的是,如果要通过编队指令使多智能体系统保持期望队形沿直线运动,则可以直接通过跟踪微分器(5)给出编队指令,即fix(t)=xi*(t),fiv(t)=vi*(t)。对于曲线运动编队指令,需要做进一步的变换。以绕圆编队指令为例,需要先计算绕圆轨迹的长度L,即圆周长和绕圆圈数的乘积。根据跟踪微分器(5)得到xi*(t)和vi*(t),再通过坐标转换得到圆周运动控制指令,该设计过程在仿真部分进一步给出。
2.2 稳定性分析与证明 系统(1)是一个领航-跟随结构的系统,其作用拓扑的Laplacian矩阵具有如下形式:
式中:lσ(t)lf∈R(N-1)×1表示跟随者与领航者之间的作用关系;Lσ(t)ff∈R(N-1)×(N-1)表示跟随者之间的作用关系;0表示任意行数和列数的零矩阵,其行数和列数根据具体使用来确定。令ηF(t)=[η2T(t), η3T(t), …, ηNT(t)]T,dF(t)=[d2T(t), d3T(t), …, dNT(t)],zF(t)=[z2T(t), z3T(t), …, zNT(t)]T…, zNT(t)]T,B1=[1,0]T,B2=[0, 1]T。在控制协议(3)的作用下,系统(1)的动力学模型可表示为
(6) |
式中:IN表示N阶单位矩阵;?表示矩阵之间的Kronecker积运算。
假设1?在标号为σ(t)的作用拓扑Gσ(t)中,对于每一个跟随者,至少存在一条由领航者通往该跟随者的路径。
如果假设1成立,那么称Gσ(t)包含一个以领航者为根的生成树。
引理1[22] ?如果假设1成立,则Laplacian矩阵Lσ(t)有且仅有一个零特征值,对应的特征向量为1N(1N表示元素均为1的N维列向量),其他N-1个特征值的实部和矩阵块Lσ(t)ff的特征值实部一样,均大于零。
引理2[23]?对任何正定矩阵Φ1∈Rn×n和对称矩阵Φ2∈Rn×n,存在矩阵ξ(t)使得如下不等式成立:
(7) |
令λi(Lσ(t)ff)(i=1, 2, …, N-1)表示Lσ(t)ff的特征值,令γσ(t)min=min{Re(λi(Lσ(t)ff))}。如果假设1成立,则γσ(t)min>0。根据文献[24]中的引理3可知,对任意的γσ(t)∈(0, γσ(t)min),存在一个对称正定矩阵Γσ(t)∈R(N-1)×(N-1),该矩阵满足:
(8) |
令η(t)=[η1T(t), ηFT(t)]T,则式(6)可以表示为
(9) |
定义ψi(t)=ηi(t)-fi(t)(i∈F),令ψF(t)=[ψ2T(t), ψ3T(t), …, ψNT(t)]T,ψ(t)=[η1T(t), ψFT(t)]T。在此基础上,有
(10) |
将式(10)代入式(9),可得
(11) |
根据Laplacian矩阵Lσ(t)的结构,可得
(12) |
由B1=[1,0]T,B2=[0, 1]T可得
(13) |
将式(12)和式(13)代入式(11),得
(14) |
由引理1可得Lσ(t)1N=0,即
(15) |
令T=
定义?(t)=(IN-1?I2)ψF(t)-(1N-1?I2)·η1(t)和ζ(t)=[η1T(t), ?T(t)]T。可得ζ(t)=(T-1?I2)ψ(t),即
(16) |
将式(16)代入式(14),再在等式两边同时左乘T-1?I2,可得
由ζ(t)=[η1T(t), ?T(t)]T,可得
(17) |
(18) |
完成控制协议(3)的设计还需要确定系数矩阵K。在给出定理1前先给出相应的算法流程。
算法1 ?切换拓扑条件下自抗扰时变编队跟踪控制协议系数矩阵设计算法。
步骤1 ?判断系统中跟随者的编队指令fF(t)是否满足如下编队可行条件:
(19) |
步骤2?对给定的参数ε>0,求解不等式(B1B2T+B2α)P+P(B1B2T+B2α)T-B2B2T+εP < 0,得到对称正定矩阵P。
步骤3?选择一个参数δ,要求δ>1/(2γ),其中γ=min{γσ(t), σ(t)∈{1, 2, …, p}}。
步骤4 ?令K=-δB2TP-1。
定理1 ?若假设1成立,在控制协议(3)的作用下,如果编队可行条件(19)满足,系统初始状态和扰动均有界,切换拓扑的驻留时间τ0>ln μ/ε,其中,
则系统(1)可实现切换拓扑下自抗扰时变编队跟踪。
证明?令
(20) |
(21) |
令[η1T(t), 0]T=e1?η1(t),其中单位矩阵e1∈RN的第1个元素为1,其他元素为0。则由式(20)可得
(22) |
联立式(17)、式(20)和式(21),可得
(23) |
式中:ψT(t)和ψT(t)线性独立。由式(22)和式(23)可得
如果
如果编队可行条件(19)成立,那么
即
下面,首先考虑在切换拓扑下的如下系统的稳定性问题。
(24) |
构造如下的分段Lyapunov函数:
(25) |
式中:Γσ(t)由不等式(8)限定;P通过算法1确定。由于系统(1)的作用拓扑在所有时间间隔[tk, tk+1)(k∈N)上是不变的,故函数V(t)是分段连续的,即可在[tk, tk+1)上对V(t)求导,即
(26) |
其中:ΩB=(B1B2T+B2α)TP-1+P-1(B1B2T+B2α);ΩL=(Lσ(t)ff)TΓσ(t)?(B2K)TP-1+Γσ(t)·Lσ(t)ff?P-1B2K。将K=-δB2TP-1代入式(26),得
其中:
令
(27) |
式中:
因为δ>1/(2γ)且=min{γσ(t), σ(t)∈{1, 2, …, p}},故
(28) |
由
即
已知系统的作用拓扑在任一时间间隔t∈[tk, tk+1)上是固定不变的,因此,有
(29) |
由于?(t)是连续的,即?(tk)=?(tk-)。由式(7)和式(25)可得
(30) |
由式(29)和式(30)可得
(31) |
因为V(tk-) < e-ε(tk-tk-1)V(tk-1),结合式(31)可得
同理,可得
(32) |
因为0 < τ0≤tk+1-tk,所以
(33) |
因为
如果驻留时间τ0>ln μ/ε,则limt→∞V(t)=0,即系统(24)是渐近稳定的。令CN-1=IN-1?(B1B2T+B2α)+(Lσ(t)ff?B2K)。
接下来考虑如下系统的稳定性问题:
(34) |
对式(4)和
(35) |
由式(35)可得
(36) |
式中:Gi(s)=βi2/(s2+βi1s+βi2)。取βi1=2ωi0和βi2=ωi02,则
(37) |
由式(37)可得
(38) |
给出1-范数和H∞范数的定义分别为
式中:
表示一个n行m列的函数矩阵;
表示一个n维函数向量。
定义
(39) |
由式(34)、式(36)、式(38)和式(39)可得
(40) |
若外部扰动有界,则存在正实数α?i和δd?i使得
(41) |
在式(41)的基础上,存在正实数α?和δd?,满足:
(42) |
根据式(3)、式(4)、式(18)和式(38),存在正实数δu?1、δu?2和δu?3,使得
(43) |
将式(43)代入式(42),则存在实数χ?和χf使得
(44) |
如果ωi0充分大,且||BN-1||1有界,则式(39)的γ足够小。进一步地,由式(40)和式(44)可得
(45) |
由式(45)可知存在正实数χmd和χm?使得
(46) |
由式(34)、式(39)和式(46)可得
式中:cN-1, i表示一个维数为N-1且第i行元素为1,其他行为0的列向量。由上述分析可知,如果系统(24)渐近稳定,外部扰动和初始状态?(0)有界,则系统(34)渐近稳定。
综上,对于式(17)和式(18),若假设1成立,在控制协议(3)的作用下,如果编队可行条件(19)满足,外部扰动和系统初始状态有界,且切换拓扑的驻留时间τ0>ln μ/ε,则可得
证毕
3 障碍物遮挡下的自抗扰时变编队跟踪与避撞控制 3.1 基于目标跟踪优先级的切换拓扑控制策略 在很多实际应用中,多智能体系统以编队的形式跟踪目标的同时会执行其他重要任务,例如,无人机编队跟踪敌方地面运动目标,通常会携带打击设备或环境感知设备以执行火力打击任务和情报搜集任务。即对目标的跟踪通常是为其他重要任务保障的,在实现目标跟踪的前提下,要求将更多资源分配在其他任务中。本文将编队中直接对目标进行识别和跟踪的智能体称为跟踪主体,为了给其他特定任务节省资源,要求在任意时刻编队中只存在一个跟踪主体。而根据前面建立的障碍物模型,进入障碍物遮挡作用范围时,跟踪主体会丢失目标。由于同一时刻只存在一个跟踪主体,一旦跟踪主体丢失,编队整体就会丢失目标。针对该问题,本文提出如下的控制策略:当跟踪主体进入障碍物作用范围时,按预先设定的规则会有另一个智能体接替其作为跟踪主体。该策略既解决了目标丢失问题,又能保证同一时刻只有一个跟踪主体。该策略具体设计如下:
以系统(1)为研究对象,假设2号智能体为初始的跟踪主体,当2号智能体进入障碍物作用范围时,需根据某种规则确定另一个智能体作为跟踪主体,为此本文提出一种划分目标跟踪优先级的方法。
为N-1个编队成员划分优先级,不失一般性,假设从2号到N号智能体优先级依次降低。优先级高的智能体进入障碍物遮挡范围时,如果下一优先级智能体未进入障碍物遮挡范围,则下一优先级智能体替代其成为跟踪主体;若下一优先级智能体也进入了障碍物遮挡范围,则继续按照由高到低的优先级重复上述过程。一旦优先级高的智能体离开障碍物遮挡范围,则立即重新成为跟踪主体。
在上述控制策略的基础上,多智能体系统在障碍物遮挡环境中的编队的目标跟踪问题就转换为一种切换拓扑下的编队的目标跟踪问题,而拓扑切换过程由障碍物的分布、编队运动以及目标跟踪优先级划分标准等共同决定。
3.2 编队避撞控制 多智能体系统的避撞问题包括智能体之间的避撞和避障问题。在环境信息预先未知的情况下,全局路径规划算法无法应用于编队避障控制和智能体之间的避撞控制,需要使用动态路径规划算法[3, 25]。人工势场法是一种经典的在线路径规划算法,具有良好的动态规划性能。下面以系统(1)为研究对象,基于势场法设计编队避撞控制器。
经典的人工势场法的基本思想是:认为实体类障碍物和邻近智能体对进入其作用范围的受控智能体存在斥力场作用,目标点对受控智能体存在引力场作用,引力场与斥力场的合力场作用于受控智能体,控制其运动。在编队跟踪问题中,编队整体对目标的跟踪是通过编队跟踪控制协议(3)实现的,因此只需要考虑斥力场作用。需要注意的下,下面考虑三维空间中的编队跟踪与避撞,即n=3。
3.2.1 障碍物对智能体的斥力 实体类障碍物k对智能体i产生的斥力场U1i, k(t)构造如下:
(47) |
式中:ρ1为避障增益系数;Δdik(t)=dik(t)-dksafe1;Δd1=dksco1-dksafe1;dik(t)为障碍物k和智能体i之间的距离。根据式(47)可以得到障碍物k对智能体i产生的斥力表达式为
(48) |
其中:nik(t)为由障碍物k指向智能体i的单位向量。假设障碍物的数量为M,则智能体i受到所有障碍物的斥力的合力为
(49) |
3.2.2 编队成员之间的斥力 考虑多智能体系统编队成员之间的避撞时,对于受控智能体,其他智能体相当于移动的障碍物。考虑实际上智能体的尺寸和惯性问题,与障碍物模型类似,用djsco2表示智能体j的斥力场作用范围,djsafe2表示智能体j的安全距离,即当其他智能体与智能体j的距离小于djsco2时会受到斥力作用,距离等于djsafe2时斥力大小为∞并认为小于djsafe2时两智能体会碰撞。智能体j对智能体i的斥力场作用会使得智能体i受到由智能体j指向智能体i的斥力。智能体j对智能体i产生的斥力场U2i, j(t)构造如下:
(50) |
式中:ρ2为编队成员之间的避撞增益系数;Δdij*(t)=dij(t)-djsafe2;Δd2=djsco2-djsafe2;dij(t)为智能体i与智能体j之间的距离。智能体j对智能体i产生的斥力表达式为
(51) |
其中:nij(t)为由智能体j指向智能体i的单位向量。
智能体i受到的其他智能体的斥力的合力为
(52) |
3.3 时变编队跟踪与避撞控制 在障碍物位置分布预先未知的情况下,考虑外部环境的扰动和障碍物对跟踪主体对目标跟踪的遮挡作用,研究多智能体系统对运动目标的编队跟踪和避撞控制问题。在第2节控制器设计研究的基础上,提出如下障碍物遮挡环境中自抗扰时变编队跟踪与避撞控制协议,即
(53) |
式中:F1i(t)和F2i(t)分别由式(49)和式(52)确定;ui*(t)由控制协议(3)扩展至三维空间得到。
控制协议(49)由编队跟踪控制项和避撞控制项组成,当避撞控制项不为零时,ui(t)≠ui*(t),即在避撞过程中编队跟踪控制的效果是得不到保证的。实际由于障碍物分布情况复杂多样,强调始终保持固定队形与实时、灵活避撞相冲突,即避撞过程中编队服从避撞需要而临时偏离编队队形是合理的。综上,多智能体系统完成编队跟踪和避撞任务需要满足两点要求:一是智能体之间、智能体与实体障碍物之间距离必须时刻大于对应的安全距离,即避撞能够实现; 二是避撞过程中不严格要求队形控制效果,但避撞结束后应能够满足编队跟踪控制要求。
在系统(1)避撞过程结束后,ui(t)=ui*(t)成立,智能体在后续运动过程中无需考虑与实体类障碍物的避撞问题,但仍可能存在区域类障碍物的遮挡作用。这里给出如下假设。
假设2 ?系统(1)避撞过程结束后,在后续运动过程中如下两种情况之一成立:
1) 系统(1)不会受到障碍物遮挡作用。
2) 系统(1)会受到区域障类碍物遮挡作用,但障碍物的分布使得系统在该作用下系统切换拓扑的驻留时间τ0>ln μ/ε。
定理2?如果假设1和假设2成立,在控制协议(53)作用下,如果编队可行条件(19)满足,外部扰动和系统初始状态有界,那么系统(1)能够实现避撞, 且在避撞结束后能够实现编队跟踪控制。
证明?首先考虑避撞问题,基于势场理论,用能量守恒的方法分析系统的避撞控制。
将系统(1)中所有跟踪目标的多智能体看作一个子系统,记为系统(a)。根据控制协议(53),扰动可补偿的情况下,认为系统(a)只受3种外力:目标的引力、实体障碍物的斥力和队形控制力,系统(a)的内力为智能体之间的斥力,由协议(51)确定。根据势场理论,进入实体障碍物斥力作用范围的智能体会具备对应的势能。
设初始时刻,系统(a)不在实体障碍物作用范围,智能体i的速度为vi(t0),则系统(a)的总动能为
(54) |
式中:WFsum为在t0~t1这段时间内所有智能体目标牵引力和队形控制力做的总功。对于任何实际系统,FTi(t)和FFi(t)必然有界,故WFsum为有界常量。由式(54)可知,势能Eq(t1)有界,即智能体i的势能有界,即
(55) |
式中:D为一个有界正数。由式(48)、式(49)和式(55)可得,Δdik(t1) < Δd1且Δdik(t1)>0,即dik(t1)>dksafe1,即智能体i在任意有限时刻t1不会与实体障碍物k碰撞。
类比上面分析过程简要下面分析智能体之间的避撞。智能体i受到的外力除了F1i(t)、FTi(t)和FFi(t),还有其他智能体斥力F2i(t)。智能体i的动能用Evi(t)表示,根据势场理论,认为当它进入其他智能体斥力作用范围时,就具备对应的势能Eq1i(t)。在任意有限时刻t2(t2≥t0),根据能量守恒定律,有
(56) |
式中:WFsum1i为智能体i受到的外力做的总功,通过前面的分析,可知WFsum1i有界。同理,由式(50)、式(51)和式(56)可得dij(t2)>djsafe2,即智能体i在任意有限时刻t2不会与智能体j碰撞。
避撞过程结束后,ui(t)=ui*(t),由定理1,如果假设1和假设2成立,在控制协议(53)作用下,若编队可行条件(19)满足,外部扰动和系统初始状态有界,则系统(1)可实现时变编队跟踪。
证毕
4 仿真实验 本节拟设计两组仿真实验检验所设计的控制器的性能。仿真实验1的目的是检验自抗扰编队跟踪控制器的编队跟踪效果和抗扰动效果,仿真实验2的目的是检验基于目标跟踪优先级的切换拓扑策略对于目标跟踪控制的改善效果。
考虑一个由3架四旋翼无人机组成的机群系统,要求该机群在三维空间内以期望的时变编队队形跟踪一个运动目标,其经过区域散布有3个实体类障碍物和3个区域类障碍物,依次编号为1~6。规定XOY平面表示水平面,OZ方向表示高度方向,长度单位默认为m。将机群系统和目标看作一个多智能体系统,其动力学模型可用系统模型(1)表示。目标为领航者,3架无人机为跟随者,依次编号为1~4。初始状态下,2号无人机为跟踪主体,系统通信拓扑如图 2所示。
图 2 系统初始作用拓扑 Fig. 2 Initial interaction topology of system |
图选项 |
假设目标和各无人机的初始状态向量如表 1所示,障碍物的分布如表 2所示。
表 1 目标和无人机的初始状态向量 Table 1 Initial state vectors of target and UAVs
智能体 | 位置向量/m | 速度向量/(m·s-1) |
目标 | (0, 0, 0) | (0, 0, 0.1) |
2号无人机 | (0, 6, 0) | (0, 0, 0) |
3号无人机 | (0, 0, 0) | |
4号无人机 | (0, 0, 0) |
表选项
表 2 障碍物位置向量 Table 2 Position vectors of obstacles
实体类障碍物 | 位置向量/m |
1号障碍物 | (0, -6, 1) |
2号障碍物 | |
3号障碍物 | |
4号障碍物 | (0, -6, 11) |
5号障碍物 | |
6号障碍物 |
表选项
考虑编队指令为绕圆编队,下面根据跟踪微分器(5)设计该指令,要求3架无人机在水平面XOY内围绕初始圆心做半径为6的圆周运动。实际应用中目标的运动轨迹和速度等信息预先未知,因此机群飞行的时长未知。通过前面对跟踪微分器(5)的描述可知,所设计的绕圆指令的特点是:机群由静止状态以amax沿预期圆形轨迹加速至v,若机群编队飞行的时长足够大,则无人机加速至Vmax后匀速运动,最后减速至静止状态。在仿真中为保证无人机由静止加速到最大绕圆速度后保持该速度跟踪目标,将绕圆圈数设置为足够大的数值50,使得在仿真时长较短时无人机不会出现减速状态。无人机i的编队向量设计如下:
(57) |
式中:MC=50为绕圆圈数;r=6 m为半径;VmaxXY=2 m/s为XOY平面内无人机合速度最大值;amaxXY=10 m/s2为XOY平面内无人机合加速度最大值。αx和αv的取值会直接影响目标的运动,这里取αx=0.01 m/s2,αv=-0.1 m/s2,在此条件下,目标会沿高度方向做变速直线运动,目标的高度差随时间变化曲线如图 3所示。此外,通过式(57)不难得出
图 3 目标高度变化曲线 Fig. 3 Altitude curve of target |
图选项 |
避障控制参数选取情况如下:ρ1=5,dsafe1=0.35,dsco1=5,无人机之间避撞参数选取情况如下:ρ2=1,dsafe2=0.45,dsco2=5。实体类障碍物遮挡半径为0.6,区域类障碍物遮挡半径为4。扩张状态观测器参数βi1=40,βi2=400。假设无人机受到的外部扰动输入包含线性项和非线性项,三维空间中无人机i扰动输入如下:
(58) |
根据算法1,取ε=0.1,δ=20,求得
4.1 仿真实验1 仿真实验1侧重于检验自抗扰时变编队跟踪控制器的编队跟踪效果和抗扰动效果,暂不研究切换拓扑对目标跟踪的影响。基于控制变量的思想,人为忽略障碍物对目标跟踪的遮挡作用。在这种情况下,编队的跟踪主体一直是2号无人机。设置两组对比实验1-1和1-2,区别在于实验1-2中无人机控制协议中不包含扰动补偿项,而实验1-1控制协议中包含扰动补偿项。仿真时长均为70 s,实验结果如图 4~图 11所示。
图 4 实验1-1中无人机与目标位置轨迹 Fig. 4 Position trajectories of UAVs and target in experiment 1-1 |
图选项 |
图 5 实验1-1中无人机与目标高度差曲线 Fig. 5 Curves of altitude difference between UAVs and target in experiment 1-1 |
图选项 |
图 6 实验1-1中无人机与障碍物距离曲线 Fig. 6 Curves of distance between UAVs and obstacles in experiment 1-1 |
图选项 |
图 7 实验1-1中无人机之间距离曲线 Fig. 7 Curves of distance between UAVs in experiment 1-1 |
图选项 |
图 8 实验1-2中无人机与目标位置轨迹 Fig. 8 Position trajectories of UAVs and target in experiment 1-2 |
图选项 |
图 9 实验1-2中无人机与目标高度差曲线 Fig. 9 Curves of altitude difference between UAVs and target in experiment 1-2 |
图选项 |
图 10 实验1-2中无人机与障碍物距离曲线 Fig. 10 Curves of distance between UAVs and obstacles in experiment 1-2 |
图选项 |
图 11 实验1-2中无人机之间距离曲线 Fig. 11 Curves of distance between UAVs in experiment 1-2 |
图选项 |
图 4和图 8分别为实验1-1和实验1-2中无人机与目标位置轨迹,图中曲线颜色和无人机编号的对应关系和图 2统一,即黑色、红色、绿色和蓝色分别对应1、2、3和4号无人机,图 5、图 9、图 13、图 14、图 18和图 19均采用这种对应关系。由图 8(c)可以看出,在外部扰动(58)作用下,3架跟随者无人机的轨迹明显不重合并且与编队指令描述的同心圆轨迹相差较大;对比之下,图 4(c)中机群的轨迹重合度较好且贴近于编队指令描述的轨迹,说明在扰动作用下机群的编队控制会受到影响,但通过所设计的抗扰控制器可以有效抑制这种影响。
图 13 实验2-1中无人机与目标位置轨迹 Fig. 13 Position trajectories of UAVs and target in experiment 2-1 |
图选项 |
图 14 实验2-1中无人机与目标高度差曲线 Fig. 14 Curves of altitude difference between UAVs and target in experiment 2-1 |
图选项 |
图 18 实验2-2中无人机与目标位置轨迹 Fig. 18 Position trajectories of UAVs and target in experiment 2-2 |
图选项 |
图 19 实验2-2中无人机与目标高度差曲线 Fig. 19 Curves of altitude difference between UAVs and the target in experiment 2-2 |
图选项 |
通过图 4(b)和图 8(b),可初步看出实验1-1中跟随者无人机对目标的跟踪效果优于实验1-2中的跟踪效果,而图 5和图 9进一步描述了机群编队跟踪控制效果。图 9中曲线全程处于明显的振荡状态,并且振荡曲线的中值明显不为零,即无人机在扰动作用下无法正常跟踪目标。对比之下,图 5中曲线在部分时间段内有比较明显的振荡,这是由避撞导致的正常现象,但在避撞结束(约50 s)后,无人机与目标高度差保持在很小的范围,说明无人机编队对目标跟踪效果良好。
图 6和图 10分别为实验1-1和实验1-2中无人机与障碍物距离实时图,可以看出整个过程中无人机与实体类障碍物的距离始终大于安全距离。图 7和图 11分别为实验1-1和实验1-2中无人机之间距离实时图,可以看出机间距离明显大于机间安全距离。两组对比结果检验了所设计的控制协议中避撞部分的有效性。
通过上述对实验1-1和实验1-2结果的对比分析,在不考虑障碍物对目标跟踪的遮挡作用的情况下,所设计的控制器体现出良好的编队跟踪控制、避撞控制和抗扰动控制效果。
4.2 仿真实验2 考虑障碍物对无人机跟踪目标的遮挡作用,采取基于目标跟踪优先级的切换拓扑策略使得机群能够持续跟踪目标。首先针对本文仿真实验中的多智能体系统确定如下目标跟踪优先级:2号~4号无人机的优先级依次下降。根据该优先级,多智能体系统切换拓扑规则如表 3所示,对应拓扑如图 12(a)~(c)所示。
表 3 作用拓扑的切换规则 Table 3 Switching rule of interaction topologies
障碍物对无人机的遮挡情况 | 通信拓扑 |
2号无人机未被遮挡,其他无人机被遮挡或未被遮挡 | A |
2号无人机被遮挡,3号无人机未被遮挡,4号无人机被遮挡或未被遮挡 | B |
2号和3号无人机均被遮挡,4号无人机未被遮挡 | C |
表选项
图 12 作用拓扑的集合 Fig. 12 Set of interaction topologies |
图选项 |
设计一组对比实验2-1和2-2。实验2-1采用上述切换拓扑控制策略;实验2-2不采用该策略,即当2号无人机被遮挡后,其他无人机不会替代其成为跟踪主体,此时系统的拓扑图如图 12(d)所示,只有当2号无人机脱离遮挡范围后,编队整体才有可能恢复对目标的跟踪。实验2-1和2-2中无人机受到外部扰动(58)的作用,控制协议中包含扰动补偿项。仿真时长均为70 s,实验结果如图 13~图 22所示。
图 15 实验2-1中无人机与障碍物距离曲线 Fig. 15 Curves of distance between UAVs and obstacles in experiment 2-1 |
图选项 |
图 16 实验2-1中无人机之间距离曲线 Fig. 16 Curves of distance between UAVs in experiment 2-1 |
图选项 |
图 17 实验2-1中作用拓扑切换过程 Fig. 17 Switching process of interaction topologies in experiment 2-1 |
图选项 |
图 20 实验2-2中无人机与障碍物距离曲线 Fig. 20 Curves of distance between UAVs and obstacles in experiment 2-2 |
图选项 |
图 21 实验2-2中无人机之间距离曲线 Fig. 21 Curves of distance between UAVs in experiment 2-2 |
图选项 |
图 22 实验2-2中作用拓扑切换过程 Fig. 22 Switching process of interaction topologies in experiment 2-2 |
图选项 |
图 13和图 18分别为实验2-1和实验2-2中无人机与目标位置轨迹。由图 18可以看出,如果跟随者无人机对1号无人机的跟踪受障碍物遮挡,机群的编队控制效果同样受到间接影响而变差;对比图 13和图 18可以看出,通过采用切换拓扑策略,这种影响会得到抑制;实际上对比图 4和图 13可发现,后者的编队控制效果与前者很接近。
图 14和图 19分别为实验2-1和实验2-2中无人机与目标高度差实时图,图 14与图 5类似,避撞过程会引起目标跟踪效果变差,但避撞结束后跟踪效果较好。实验2-2中,在机群避撞结束后,2号无人机进入区域障碍物遮挡范围就会丢失目标,导致编队整体也丢失了目标,从图 19可以看出,50 s后的编队跟踪目标的效果相对图 14明显变差。
通过图 15和图 20、图 16和图 21可以看出,在两组实验中避撞控制效果均比较理想,机间距离以及无人机与障碍物距离均大于安全值。
图 17和图 22分别展示了实验2-1和实验2-2中系统的通信拓扑切换情况。通过上述结果对比分析可知,障碍物的遮挡作用会使编队跟踪控制效果变差,尤其会对目标跟踪产生显著影响。通过采取基于目标跟踪优先级的切换拓扑控制策略可以抑制上述影响,所设计的控制器体现出良好的编队跟踪控制、避撞控制和抗扰动效果。
5 结论 本文研究了障碍物遮挡环境中存在外部扰动时多智能体系统对运动目标的自抗扰时变编队跟踪与避撞控制。在设计控制器时,分别利用自抗扰理论和基于目标跟踪优先级的切换拓扑策略削弱外部扰动影响和障碍物遮挡的影响。对运动目标的编队跟踪在军民领域应用广泛,而本文考虑的外部扰动作用和障碍物遮挡作用在实际编队任务中十分常见,因此研究成果具有较强的理论意义和应用价值。仿真结果表明,本文设计的控制器具有良好的控制性能。
本文针对相关问题进行了理论方面的初步探索,实际的多智能体系统编队成员间的通信数据和对目标、障碍的探测数据均为离散量,因此将本文形成的理论成果应用到工程当中还需要做离散化处理,并结合应用要求和硬件特点进一步改进算法。同时,在后续理论研究中需要进一步考虑系统的时延、丢包等通信问题对控制效果的影响,使研究成果更好地面向实际应用。
参考文献
[1] | ZHANG X Y, DUAN H B. An improved constrained differential evolution algorithm for unmanned aerial vehicle global route planning[J]. Applied Soft Computing, 2015, 26: 270-284. DOI:10.1016/j.asoc.2014.09.046 |
[2] | 罗京, 刘成林, 刘飞. 多移动机器人的领航-跟随编队避障控制[J]. 智能系统学报, 2017, 12(2): 202-212. LUO J, LIU C L, LIU F. Piloting-following formation and obstacle avoidance control of multiple mobile robots[J]. CAAI Tran-sactions on Intelligent Systems, 2017, 12(2): 202-212. (in Chinese) |
[3] | 刘洋, 章卫国, 李广文, 等. 动态环境中的无人机路径规划方法[J]. 北京航空航天大学学报, 2014, 40(2): 252-256. LIU Y, ZHANG W G, LI G W, et al. Path planning of UAV in dynamic environment[J]. Journal of Beijing University of Aeronautics and Astronautics, 2014, 40(2): 252-256. (in Chinese) |
[4] | GAZI V, FIDAN B.Adaptive formation control and target tracking in a class of multi-agent systems: Formation maneuvers[C]//2013 13th International Conference on Control, Automation and Systems.Piscataway: IEEE Press, 2013: 78-85. |
[5] | LEE Y H, KIM S G, KUC T Y, et al. Virtual target tracking of mobile robot and its application to formation control[J]. Inter-national Journal of Control, Automation and Systems, 2014, 12(2): 390-398. DOI:10.1007/s12555-012-0461-y |
[6] | DONG X W, XIANG J, HAN L, et al. Distributed time-varying formation tracking analysis and design for second-order multi-agent systems[J]. Journal of Intelligent & Robotic Systems, 2017, 86(2): 277-289. |
[7] | 连克非, 董云峰. 电磁航天器编队位置跟踪自适应协同控制[J]. 北京航空航天大学学报, 2017, 43(10): 2154-2162. LIAN K F, DONG Y F. Adaptive cooperative control for electro-magnetic spacecraft formation flight position tracking[J]. Journal of Beijing University of Aeronautics and Astronautics, 2017, 43(10): 2154-2162. (in Chinese) |
[8] | TAN Z Y, CAI N, ZHOU J, et al. On performance of peer review for academic journals:Analysis based on distributed parallel system[J]. IEEE Access, 2019, 7: 19024-19032. DOI:10.1109/ACCESS.2019.2896978 |
[9] | CAI N, DENG C L, WU Q X. On non-consensus motions of dynamical linear multiagent systems[J]. Pramana, 2017, 91(2): 16. |
[10] | XI J, YANG J, LIU H, et al. Adaptive guaranteed-performance consensus design for high-order multiagent systems[J]. Infor-mation Sciences, 2018, 467: 1-14. DOI:10.1016/j.ins.2018.07.069 |
[11] | JI Z J, YU H S. A new perspective to graphical characterization of multi-agent controllability[J]. IEEE Transactions on Cybernetics, 2017, 47(6): 1471-1483. DOI:10.1109/TCYB.2016.2549034 |
[12] | DONG X W, HAN L, LI Q D, et al.Time-varying formation tracking for second-order multi-agent systems with one leader[C]//2015 Chinese Automation Congress.Piscataway: IEEE Press, 2015: 1046-1051. |
[13] | HAN L, DONG X W, LI Q D, et al.Formation tracking control for second-order multi-agent systems with time-varying delays[C]//2016 35th Chinese Control Conference.Piscataway: IEEE Press, 2016: 7902-7907. |
[14] | XIONG T, PU Z, YI J, et al. Time-varying formation finite-time tracking control for multi-UAV systems under jointly connected topologies[J]. International Journal of Intelligent Computing and Cybernetics, 2017, 10(4): 478-490. DOI:10.1108/IJICC-02-2017-0015 |
[15] | LAI J G, CHEN S H, LU X Q, et al. Formation tracking for non-linear multi-agent systems with delays and noise disturbance[J]. Asian Journal of Control, 2015, 17(3): 879-891. DOI:10.1002/asjc.937 |
[16] | NIU H, GENG Z Y. Almost-global formation tracking control for multiple vehicles with disturbance rejecttion[J]. IEEE Access, 2018, 6: 25632-25645. DOI:10.1109/ACCESS.2018.2820718 |
[17] | 邵壮, 祝小平, 周洲, 等. 三维动态环境下多无人机编队分布式保持控制[J]. 控制与决策, 2016, 31(6): 1065-1072. SHAO Z, ZHU X P, ZHOU Z, et al. Distributed formation keeping control of UAVs in 3-D dynamic environment[J]. Control and Decision, 2016, 31(6): 1065-1072. (in Chinese) |
[18] | 胡春鹤, 王健豪. 多运动体分布式最优编队构型形成算法[J]. 控制与决策, 2018, 33(11): 87-91. HU C H, WANG J H. Distributed optimal formation shaping algorithm for multi-agent[J]. Control and Decision, 2018, 33(11): 87-91. (in Chinese) |
[19] | CHEN M, SHI P, LIM C. Robust constrained control for MIMO nonlinear systems based on disturbance observer[J]. IEEE Transactions on Automatic Control, 2015, 60(12): 3281-3286. DOI:10.1109/TAC.2015.2450891 |
[20] | XIONG Y, SAIF M. Sliding mode observer for nonlinear system:Theory and application[J]. Nonlinear Dynamics, 2001, 46(12): 2012-2017. |
[21] | 韩京清. 自抗扰控制技术——估计补偿不确定因素的控制技术[M]. 北京: 国防工业出版社, 2008: 56-75. HAN J Q. Active disturbance rejection control technique-the Technique for estimating and compensating the uncertainties[M]. Beijing: National Defense Industry Press, 2008: 56-75. (in Chinese) |
[22] | REN W, BEARD R W. Consensus seeking in multiagent systems under dynamically changing interaction topologies[J]. IEEE Transactions on Automatic Control, 2005, 50(5): 665-671. |
[23] | 黄琳. 系统与控制理论中的线性代数[M]. 北京: 科学出版社, 1984: 92-101. HUANG L. Linear algebra in system and control theory[M]. Beijing: Science Press, 1984: 92-101. (in Chinese) |
[24] | SABOORI I, KHORASANI K. H∞ consensus achievement of multi-agent systems with directed and switching topology net-works[J]. IEEE Transactions on Automatic Control, 2014, 59(11): 3104-3109. DOI:10.1109/TAC.2014.2358071 |
[25] | 朱大奇, 颜明重. 移动机器人路径规划技术综述[J]. 控制与决策, 2010, 25(7): 961-967. ZHU D Q, YAN M Z. Survey on technology of mobile robot path planning[J]. Control and Decision, 2010, 25(7): 961-967. (in Chinese) |