一种通信受限的多智能体系统二分实用一致性控制方法

文档序号:25869631发布日期:2021-07-13 16:31阅读:539来源:国知局

本发明涉及一种通信受限的多智能体系统二分实用一致性控制方法,属多智能体技术领域。



背景技术:

多智能体系统控制在近些年发展迅速,广泛应用于无人机编队、传感器网络、机械臂装配、多导弹联合攻击等领域。一致性作为协同控制的基础,成为多智能体系统研究中的核心问题。近年来,学者们针对多智能体系统不同类型的一致性问题进行了大量研究,如完全一致性、领导-跟随一致性、群体一致性、比例一致性等。以上一致性成果主要集中在设计控制器使智能体状态误差最终趋于零。但是在实际系统中,由于执行器偏差、计算误差和恶劣环境,智能体系统会存在通信约束(如通信时滞、数据量化等)、外部干扰、未知耦合等情况,若仍要求每个智能体的真实运动状态之间的偏差趋于零,这在有限条件下往往难以实现。因此,dongxw,xijx,shizy,zhongys(practicalconsensusforhigh-orderlineartime-invariantswarmsystemswithinteractionuncertainties,time-varyingdelaysangexternaldisturbances.internationaljournalofsystemsscience,2013)提出使智能体状态偏差函数在某一确定有界区间内波动的实用一致性概念,可适用于更为复杂的实际系统中。

为解决不同非理想网络环境中的一致性问题,学者们对基于实用一致性概念的多智能体控制算法进行了深度研究。dongxw,xijx,shizy,zhongys(practicalconsensusforhigh-orderlineartime-invariantswarmsystemswithinteractionuncertainties,time-varyingdelaysangexternaldisturbances.internationaljournalofsystemsscience,2013)研究了有向通信拓扑下具有外部扰动、相互作用不确定和时变时滞的一般高阶线性时不变群系统实用一致性问题。在实际系统中,当采样周期变大时,若要使智能体状态误差趋于零,初始状态就须非常接近,显然限制了系统的有效性。bernuaue,moulaye,coiraultp,lsfoulaf(practicalconsensusofhomogeneoussampled-datamultiagentsystems.ieeetransactionsonautomaticcontrol,2019)进一步探讨了二阶多智能体系统齐次采样下的实用一致性。为解决初始控制输入量过大,出现输入饱和而导致削弱系统性能的问题,ningb,hanql,zuozy(practicalfixed-timeconsensusforintegrator-typemulti-agentsystems:atimebasegeneratorapproach.automatica,2019)利用时基发生器,提出多智能体系统的固定时间实用一致性框架。具有振荡器的系统,也难以实现智能体状态误差最终趋于零,因此panteleye,loriaa,elatia.(practicaldynamicconsensusofstuart–landauoscillatorsoverheterogeneousnetworks.internationaljournalofcontrol,2020)研究了异质网络上非线性非均匀振子stuart-landa的实用动态一致性。zhangw,mazj,wangy.(practicalconsensusofleader-followingmulti-agentsystemwithunknowncouplingweights.actaautomaticasinica,2018)研究了带未知耦合权重的领导-跟随多智能体系统的实用一致性。zhaisd,liup,gaoh(boundedbipartitesynchronizationforcoupleddiscretesystemsunderantagonistic.actaautomaticasinica,2020)针对含有对抗关系和时变拓扑的耦合离散系统,考虑了拓扑切换后出现结构不平衡或结构平衡的两个子系统成员随时间变化的情况,实现了有界双向同步.以上已有的实用一致性研究只考虑非理想网络环境中智能体之间的合作关系,即用非负权重的通信拓扑来表示。而在实际系统中,合作与竞争关系同时存在的通信拓扑结构更为普遍。

altafinic.(consensusproblemsonnetworkswithantagonisticinteractions.ieeetransactionsonautomaticcontrol,2013)率先设通信拓扑权重为负以表示智能体间的竞争关系,提出结构平衡图假设,利用拉普拉斯算子证明了智能体系统能实现二分一致,即智能体收敛至模相同但符号不同的值。mengzy,shigd,johanssonkh,caom,hongyg.(behaviorsofnetworkswithantagonisticinteractionsandswitchingtopologies.automatica,2016)讨论智能体系统分别在单向通信和双向通信情况下实现二分一致的充要条件。mengdy,mengzy,hongyg.(uniformconvergenceforsignednetworksunderdirectedswitchingtopologies.automatica,2018)建立智能体稳态与有向切换符号图拉普拉斯矩阵间的联系。随后,又有学者将竞争与合作关系引入至矩阵加权网络。panl,shaoh,mesbahim,lid(bipartiteconsensusonmatrix-valuedweightednetworks.ieeetransactionsoncircuitsandsystemsii:expressbriefs,2018)引入正负生成树概念,得出矩阵加权网络实现二分一致的充要条件,但只适用于结构平衡图。suhs,chenjh,yangyc(thebipartiteconsensusformulti-agentsystemswithmatrix-weight-basedsignednetwork.ieeetransactionsoncircuitsandsystemsii:expressbriefs,2019)研究了结构不平衡拓扑图下的矩阵加权网络的二分一致性,通过矩阵耦合,得出实现二分一致的代数条件。上述二分一致性的研究大部分考虑智能体间的误差最终能趋于零,但这在非理想通信环境有限条件下往往难以实现。

量化一致性概念最早由akshayk,tamerb,r(srikant.quantizedconsensus.automatic,2007)提出,随后dimarogonasadv,johanssonkh(stabilityanalysisformulti-agentsystemsusingtheincidencemartrix:quantizedcommunicationandformationcontrol.automatic,2010)基于矩阵谱理论分别研究了通讯信息在一致量化和对数量化下多智能体系统的一致性问题。ceragiolif,claudiodp,paolof(discontinuitiesandhysteresisinquantizedaverageconsensus.automatic,2011)构建了基于磁滞效应量化的多智能体网络的混杂系统模型,该混杂系统能够有效避免震颤现象,并进一步分析了系统解的有限时间收敛性。zhuyr,lisl,majy,zhengys(bipartiteconsensusinnetworksofagentswithantagonisticinteractionsandquantization.ieeetransactionsoncircuitsandsystems-expressbriefs,2018)考虑竞争关系和通信量化下多智能体系统的二分一致性,分别考虑了拓扑结构平衡与拓扑结构不平衡两种情况。wuj,dengq,hant,yanhc(distributedbipartitetrackingconsensusofnonlinearmulti-agentsystemswithquantizedcommunication.neurocomputing,2020)进一步考虑非线性系统,研究了具有量化通信约束的非线性多智能体系统分布式二分一致性问题。以上论文对通信量化做了大量研究,但均未考虑通信时滞,而时滞也是影响多智能体系统一致性的重要因素。



技术实现要素:

本发明的目的是,为了实现智能体位置状态收敛至模相同但符号不同的可控区间,提供一种通信受限的多智能体系统二分实用一致性控制方法。

本发明实现的技术方案如下,一种通信受限的多智能体系统二分实用一致性控制方法,包括以下步骤:(1)基于多智能体系统结构平衡拓扑假设,通过一类正交矩阵进行规范变换,使具有竞争关系的多智能体系统转变为具有非负连接权重系统,使得二分实用一致性问题转变为一般实用一致性问题;

(2)设计量化函数获得菲利波夫解;利用微分包含理论和菲利波夫解的框架,通过智能体i的动力学方程,得出控制器在右端不连续情况下多智能体系统存在全局解;

(3)基于量化器构建李雅普诺夫函数,利用李雅普诺夫稳定性理论和代数图论推导多智能体系统的稳定性条件,导出与任何全局信息和初始值无关的误差收敛上界值;

(4)设计一种基于融合时滞项、取整函数的量化器的右端不连续控制协议,使得各智能体位置状态收敛至模相同,但符号不同的可控区间;从而实现通信受限的多智能体系统实现二分实用一致性。

所述多智能体系统的通信拓扑图由有向图g=(v,e,a)描述,其中v={1,2,…,n}为点集,为边集,有向边eij=(i,j)∈e表示智能体i向智能体j传输信息;a=[aij]∈rn×n为通信权重矩阵,其对角线元素aii=0;若aij≠0,则称智能体j为智能体i的邻居;对任意i,j均有aij≥0,则称图g为非负图,否则为符号图;度矩阵d∈rn×n定义为d=diag{di},其中拉普拉斯矩阵l∈rn×n定义为l=d-a,其中若图中任意两个节点,均存在一条有向路径,则称图g为有向强连通图。

所述智能体i的动力学方程为:

xi(t)∈r表示智能体i的位置状态变量;ui(t)∈r表示智能体i的控制输入;

设计量化函数γ为量化水平参数,η∈(0,1]为量化器精度,τ为智能体j向智能体i通信传输时发生的通信延迟,为向下取整函数;系统在[0,t)上存在局部解,依据泛函微分方程理论,通过反证法获得局部解的有界性,进一步获得系统存在全局解。

所述正交矩阵为:c={c=diag(σ),σ=[σ1,σ2,…,σn],σi={-1,1}};c满足ctc=cct=i,且c-1=c;对于固定无向网络拓扑和零通信时延的多智能体系统,常采用控制协议对其规范变换:

令z=cx,c∈c,由c-1=c,x=cz,则

其中ld=clc=d-cac为规范变换后拉普拉斯矩阵;

ld,ij表示规范变换后的拉普拉斯矩阵ld中第i行、第j列的元素,ld指矩阵ld中的元素,i、j表示第i行、第j列的元素;

c为正交矩阵;d为度矩阵;i为单位矩阵;σ为正交矩阵c中的对角线元素;l为拉普拉斯矩阵;x为智能体的状态矩阵x=[x1x2lxn];z为过渡变换矩阵z=cx。

所述设计量化函数获得菲利波夫解,得出控制器在右端不连续情况下多智能体系统存在全局解:

当函数x(t):[-τ,t)→rn满足:

(1)x(t)在[-τ,t)连续,在[0,t)绝对连续;

(2)存在可测向量函数w(t)=[w1(t),w2(t),…,wn(t)]、

w′(t)=[w′1(t),w′2(t),…,w′n(t)]:[-τ,t)→rn,使得x(t)在t∈[0,t)有:

其中wi(t)∈k[sign(aij)q(xi(t))]、w′i(t)∈k[q(xi(t))]是关于解x(t)的输出函数,则x(t)为系统在[0,t)上的菲利波夫解;

给定连续向量函数φ(t):[-τ,0]→rn与可测向量函数ψ(t)∈k[q(φ(t))]:[-τ,0]→rn、ψ′(t)∈k[sign(aij)q(φ(t))]:[-τ,0]→rn,如果使得在[0,t)上x(t)为系统的解,且满足:

则,[x(t),w(t),w′(t)]:[-τ,t)→rn×rn为系统满足初始条件(φ(t),ψ(t),ψ′(t))的解;

容易得到系统在[0,t)上存在局部解;依据泛函微分方程理论,通过反证法获得局部解的有界性,进一步获得系统存在全局解。

所述李雅普诺夫函数构建如下:

令a1=max1≤i≤j≤ncij,使得ρ∈[0,τ];

从而有:

可得:

系统中所有智能体都能在t″收敛至集合e,

e={|x(t+λ)|∈c([-τ,0);rn):(wi(t)-w′j(t-τ))2+(w′j(t)-wi(t-τ))2≤(γ/n+1)2},又由可得:

其中θ1∈z;

任意智能体i到其邻居智能体i′、i*有不超过n-1条路径,结合上述分析,可得:

因此,对使得任意一个智能体i的状态xi(t″)∈[(θ-0.5)γη,(θ+0.5)γη];

有:

dist(xi(t),[(θ-0.5)γη,(θ+0.5)γη])≤ε

由此可得,对任意一个智能体i的状态xi(t)都能收敛到集合[(θ-0.5)γη,(θ+0.5)γη]中;

由此得到误差收敛上界:

上述式中,v为李雅普诺夫函数;v1为v中的一个子函数;v2为v中的另一个子函数;q(t)为量化函数;cij为正交矩阵c中的第i行第j列元素;t0为大于零的常量;ρ∈[0,τ];τ为智能体j向智能体i通信传输时发生的通信延迟;ε为任意一个大于零的数,e为收敛集合;λ为大于零的常量;γ为量化水平参数;η为量化器精度;n为智能体的个数;a1=max1≤i≤j≤ncij;θ为一个正整数。

所述基于融合时滞项、取整函数的量化器的右端不连续控制协议如下:

q(x)为量化函数,定义其中i=1,2,…,n,γ为量化水平参数,η∈(0,1]为量化器精度,τ为智能体j向智能体i通信传输时发生的通信延迟,为向下取整函数,sign(·)为符号函数。

本发明的有益效果是,本发明充分应用图论与集合知识,形象直观的表达出了通信受限的多智能体系统个体之间形成的网络拓扑与控制作用关系。本发明所研究的多智能体系统中考虑了通信时滞、量化数据等通信约束的影响,更加符合一般实际应用,所研究的多智能体系统中同时存在合作与竞争关系,更加符合一般现实要求;实现带扰动合作与竞争关系同时存在的智能体系统的一致性控制具有创新意义;本发明提出的通信受限多智能体系统实现二分实用一致性的充分条件,为该类系统实现一致性提供判断标准。本发明多智能体系统的渐近一致性推广至实用一致性,实现了通信受限情况下,系统误差收敛于可控区间,且收敛上界值与任何全局信息和初始值无关,仅与量化器参数有关。

附图说明

图1是示例网络拓扑结构图;

图2表示γ=3,η=1通信受限的多智能体系统的位置一致性;

图3表示γ=1,η=1通信受限的多智能体系统的位置一致性;

图4表示γ=0.1,η=1通信受限的多智能体系统的位置一致性;

图5是本发明方法的步骤框图。

具体实施方式

图5所示为本发明方法的步骤流程图。

本实施例一种通信受限的多智能体系统二分实用一致性控制方法,步骤如下:

(1)基于多智能体系统结构平衡拓扑假设,通过一类正交矩阵进行规范变换,使具有竞争关系的多智能体系统转变为具有非负连接权重系统,使得二分实用一致性问题转变为一般实用一致性问题。

(2)设计量化函数获得菲利波夫解;利用微分包含理论和菲利波夫解的框架,通过智能体i的动力学方程,得出控制器在右端不连续情况下多智能体系统存在全局解。

(3)基于量化器构建李雅普诺夫函数,利用李雅普诺夫稳定性理论和代数图论推导多智能体系统的稳定性条件,导出与任何全局信息和初始值无关的误差收敛上界值。

(4)设计一种基于融合时滞项、取整函数的量化器的右端不连续控制协议,使得各智能体位置状态收敛至模相同,但符号不同的可控区间;从而实现通信受限的多智能体系统实现二分实用一致性。

图1以一个有向网络为例描述了通信受限的多智能体系统中智能体之间的网络连接与通信关系。该拓扑图满足结构平衡,图中两个子群分别为v1={1,2,3}和v2={4,5,6},子群之间为竞争关系,子群内部为合作关系。对邻接矩阵a规范变换,取转换矩阵为,c={c=diag(σ),σ=[111-1-1-1]}。

图2为系统在控制器(11)的作用下各智能体位置状态变化曲线,由图可知各智能体位置状态绝对值的误差收敛于可控区间[0,3],存在竞争关系的两个子群最终能实现收敛,即通信受限的多智能体系统能实现二分实用一致。

图3、图4为在相同初始值状态下分别取γ=1、γ=0.1时的各智能体位置状态曲线,表明通过改变γ值可以控制智能体位置状态绝对值误差的波动区间,所设计的γ值越小,智能体位置状态绝对值的误差波动区间也越小。

在本发明的构思基础上可以进行的各种替换、变化和修改,这些替换、变化和修改不应排除在发明的保护范围之外。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!