仿狼群合作狩猎机制的无人机集群动态任务分配方法与流程

文档序号:22400220发布日期:2020-09-29 18:12阅读:304来源:国知局
仿狼群合作狩猎机制的无人机集群动态任务分配方法与流程

本发明是一种仿狼群合作狩猎机制的无人机集群动态任务分配方法,属于无人机自主控制领域。



背景技术:

察打一体化无人机是未来无人机发展的一个重要方向,可以广泛应用于边境巡逻、通讯中继、战区侦察、战效评估和反恐作战等军用和民用任务。美国“捕食者”系列无人机因其察打一体化设计缩短了从发现目标到精确打击之间的时间,提高了侦察信息的时效性和目标攻击的准确性,取得了多次“定点清除”的重大战果。然而,在日趋复杂的战场环境下,依靠单架无人机执行侦察-打击全包线任务会显著提高设计成本,降低任务执行的鲁棒性。本发明旨在利用无人机集群的协同作业模式克服单架无人机察打一体化任务分配的技术瓶颈,提出一种鲁棒高效的动态协同任务分配方法,实现无人机集群面向察打一体化作战任务的高效智能决策。

目前,无人机集群自主协同任务分配方法主要侧重于集中式算法和启发式分布式算法。集中式算法包括整数线性规划、混合整数线性规划、蚁群算法、遗传算法等。然而,这类算法存在两个显著缺陷,即对中心规划节点的依赖性和高昂的计算量消耗。当集群规模较大且规划约束较多时,集中式规划算法便无法正常工作,降低系统鲁棒性。启发式分布式算法如拍卖算法、一致性拍卖算法、响应阈值模型等能够克服传统集中式算法的缺陷,通过每架无人机的自主决策避免对中心节点的依赖。尽管无法提供如集中式算法一样的最优分配结果,启发式分布式算法依旧能够在有限时间内提供较为满意的决策能力。

打击资源的合理分配是维持己方战场战术执行能力的关键问题,均衡打击资源能够保障无人机集群在后期有充足的打击能力应对突发突现目标。然而,现有大多数研究未考虑打击资源在无人机集群中的均衡分配,致使不同无人机之间存在严重资源失衡,从而极易造成后续任务的效能低下。此外,自主性较强的无人机集群在与环境的交互过程中理应进化出个体在不同任务选择上的倾向性,从而逐渐建立一种合作分工机制以提高集群的任务执行匹配效率。狼群是一种环境适应性强、合作分工明确的生物群体,其合作狩猎方式不仅有利于围捕和共享猎物,保障狼群日常活动的正常运转,而且其捕猎过程中所演化出的职责分工也有助于围捕大型猎物,进而获取更为丰富的能量摄入。本发明借鉴狼群合作狩猎的能量均衡与分工演化机制,提出一种面向察打一体化作战的无人机集群动态任务分配方法,旨在解决无人机集群在不确定环境下的资源均衡与高效决策问题。



技术实现要素:

本发明目的是提供一种仿狼群合作狩猎机制的无人机集群动态任务分配方法,旨在解决无人机集群在不确定环境下面向察打一体化作战的资源均衡与高效决策问题,在降低设计成本、提高长时鲁棒决策能力的基础上,进一步提升无人机集群的任务执行效能与自主能力水平。

本发明是一种仿狼群合作狩猎机制的无人机集群动态任务分配方法,具体实现步骤如下:

步骤一:初始化战场环境设置

s11、初始化无人机运动控制模型

其中,nu为作战无人机数量,{xi,yi,zi}为第i架无人机的三维位置,{vi,χi,γi}为第i架无人机的空速、偏航角与航迹倾斜角,为第i架无人机的空速、偏航与航迹角指令,{vmin,vmax,nmin,nmax,γmin,γmax}分别为无人机空速、横向过载与航迹倾角飞行限制,g为重力加速度,{τv,τχ,τγ}分别为空速响应时间、偏航响应时间、航迹响应时间。设定运动更新步长ts及路径跟踪步长ts满足ts>>ts,则每架无人机采用以下反馈控制器对三维路径规划指令进行跟踪。

其中,分别为第i架无人机的航点跟踪飞行空速、航向角与航迹倾斜角,其满足以下关系:

上式中,表示三维期望跟踪速度误差,{kv,kχ,kγ}为空速、偏航与航迹角跟踪控制增益,{kx,ky,kz}为路径跟踪控制增益。γ:表示虚拟航迹状态集,作为无人机路径跟踪的虚拟导引点,其满足以下关系。

其中,vir根据任务状态指定,满足下列关系,经过(4)式积分得到。

s12、初始化战场空间

将战场空间划分为∑=x×y×z个同等大小的三维网格,构成如图1所示的网格地图g={gc|c=1,...,σ}且表示网格c的三维位置边界。nt个目标随机分布于三维网格之内,在每一路径跟踪时刻目标可选择转移到与其相邻的网格中心或停留在原属网格中心,选择方式满足马尔科夫随机过程。无人机初始位置同样随机分布于三维网格中心,且互不重叠。设定无人机通信范围为整个战场空间,侦察探测范围为其所属网格区域。目标具有一定攻击价值r且满足

其中,rk为第k个目标在当前时刻t下的攻击价值,为其初始时刻攻击价值,η为价值折扣因子。

s13、初始化侦察与打击任务设置

给定mt种目标类型和mu种无人机类型,建立以下无人机-目标侦察概率矩阵打击概率矩阵和打击资源消耗矩阵

其中,pr(p,q)表示第p种类型无人机对第q种类型目标的侦察概率,pa(p,q)表示第p种类型无人机对第q种类型目标的打击概率,ja(p,q)表示第p种类型无人机攻击一次第q种类型目标需要消耗的资源量。每架无人机、每个目标可随机选择其所属类型。给定侦察参考空速vr,攻击参考空速va,以及第i架无人机的初始时刻资源量ji,则对于第i架无人机,在起始时刻将其任务状态sti设定为侦察状态s1,后续随着目标发现会转换任务状态,任务状态共分为三类,分别为侦察(探狼)状态s1、攻击(猛狼)状态s2和引领(头狼)状态s3。

步骤二:执行侦察/打击/引领任务

s21、执行探狼任务

若sti=s1,即第i架无人机处于侦察状态,按照下式判断是否侦察到目标。

其中,表示第i架无人机对第k个目标的二进制探测函数,1表示探测成功,0则表示未成功。c(i)、c(k)分别表示第i架无人机和第k个目标所处的三维网格编号,rand为[0,1]内的随机数,p(i)、q(k)分别为第i架无人机和第k个目标所属类型。若则第i架无人机向任务区域内其他无人机广播探测成功信息,并转步骤三;否则,转步骤五。

s22、执行猛狼任务

若sti=s2,即第i架无人机处于攻击状态,则首先获取预定攻击目标编号k,并判断当前时刻t是否已到目标k的预定攻击时刻若是,则按照下式执行目标攻击。

其中,表示第i架无人机攻击第k个目标所用的资源消耗量。表示攻击编队对第k个目标的二进制打击函数,1表示打击成功,0则表示未成功。ck表示针对第k个目标所构成的打击编队集合且i∈ck。若则记录当前时刻的目标价值rk,令sti=s1,并转步骤五;否则,判断资源量ji是否低于资源阈值jmin。若低于资源阈值,则将目标k暂时搁置,清除探测标志令sti=s1,并转步骤五;否则,转步骤七。

s23、执行头狼任务

若sti=s3,即第i架无人机处于引领状态,则首先获取引领攻击目标编号k,并判断当前时刻t是否已到目标k的预定攻击时刻若是,令sti=s1,并转步骤五;否则,转步骤七。

步骤三:基于狩猎应激机制的攻击编队预分配

s31、判断有效打击资源量

处于探狼状态的第j(j≠i)架无人机在接收到第i架无人机关于目标k的探测成功信息后,若其未探测到其他目标信息,判断是否jj≥αjmin,α>1为余量系数。若是,则第j架无人机执行下一步s32;否则,转步骤五。

s32、计算狩猎应激阈值模型

第j架无人机按下式计算其狩猎应激响应阈值

其中,为第j架无人机选择攻击目标k的狩猎应激阈值,a1、a2分别为正常数,δjk表示第j架无人机面对目标k的打击能力,pa,min为允许的最小打击概率。目标k的打击激励函数为则第j架无人机选择攻击目标k的应激概率由下式表示

其中,b为正常数,δτjk表示第j架无人机到达目标k所处位置的预计飞行时间,可表示为

其中,xk,yk,zk分别为目标k的三维位置,δdjk表示第j架无人机与目标k的相对距离,表示向上取整。第j架无人机依据应激概率选择是否攻击目标k。若是,向第i架无人机返回应答信息及其有效资源量jj、无人机类型p(j);否则,转步骤五。

s33、生成攻击预分配队列

第i架无人机在ts时间内接收来自其他无人机的应答信息,得到应答无人机序列li。以此为基础构建针对目标k的攻击编队预分配队列并转步骤四。

步骤四:基于狩猎能量均衡模型的头狼/猛狼任务分配

s41、基于狩猎总能量筛选有效编队组合

基于预分配队列根据组合关系生成幂集对于θk中的第n个子集定义为其狩猎总能量,为其能量需求,其分别满足以下关系。

若满足符合总能量关系,将其加入有效编队组合ξk。对θk进行轮询,判断ξk是否为空。若是,则第i架无人机将目标k暂时搁置,清除探测标志令sti=s1,并向中的其他无人机发送分配无效信息,转步骤五;否则,执行下一步s42。

s42、计算均衡资源消耗量

对于ξk中的第n个子集按下式计算其内部每架无人机在均衡条件下对目标k的攻击资源消耗量。

上式中,即第j架无人机属于子集表示中的可用猛狼(攻击)无人机集合,其满足

s43、计算狩猎能量均衡指标

首先,对于ξk中的第n个子集按下式计算其狩猎能量摄入值

其中,βin为能量摄入平衡系数,其取值范围满足0<βin≤||ja||2。r(j)表示第j架无人机在扣除均衡资源消耗量后的剩余资源量,其由下式给出

其次,按下式计算子集的狩猎能量消耗值

其中,βout为能量消耗平衡系数,其取值范围受三维网格位置边界影响。由此获得子集的狩猎能量均衡指标

s44、生成头狼/猛狼攻击编队

第i架无人机对有效编队组合ξk中的每个子集计算其狩猎能量均衡指标,选取指标最高的子集作为目标k的打击编队ck。同时,按下式计算打击编队ck关于目标k的预定攻击时刻

随后,第i架无人机向ck中其他无人机发送分配有效信息、预定攻击时刻以及对应的均衡资源消耗量,而向未被选择作为打击编队的无人机发送分配无效信息。对于任意的无人机j∈ck,将其任务状态转为猛狼状态,即stj=s2;若则第i架无人机转为头狼状态,即sti=s3。对于任意处于头狼或猛狼状态的无人机,转步骤七;否则,转步骤五。

步骤五:更新侦察环境地图

s51、更新概率地图

环境地图由概率地图和确定性地图组成,作为无人机集群网络实时共享信息,对于网络中所有无人机保持透明,即无人机集群共享同一个环境地图。概率地图在一个路径跟踪周期ts内完成一次更新,其更新策略如下:

其中,q(c,k,t)表示当前时刻下目标k出现在网格c处的概率,表示与网格c相邻的网格集合,λmc表示从网格m到网格c的转移概率,取值为ψ(m,t)表示当前时刻无人机位置对概率地图网格q(m,k,t)的概率影响函数,其由下式确定

其中,ψi(m,t)表示第i架无人机所处位置对q(m,k,t)的概率影响函数。

s52、更新确定性地图

确定性地图同样在一个路径跟踪周期ts内完成一次更新,其更新策略如下:

其中,h(c,t)表示当前时刻网格c的确定性概率,ε∈(0,1)为折扣因子表示网格c未被检测而使其不确定性增加的程度。

步骤六:基于环境应激机制的探狼任务分配

s61、计算环境应激阈值模型

设sti=s1,则第i架无人机按下式计算其环境应激响应阈值

其中,表示第i架无人机向网格c移动的响应阈值。令表示第i架无人机所在网格的相邻网格集,则即第i架无人机选择向其所在网格的相邻网格移动(如图2所示)。θmax为阈值上界,ω>0为收敛系数。网格c的环境激励函数为则第i架无人机选择向网格c移动的应激概率可表示为

将其归一化得到第i架无人机与网格c之间的环境应激阈值模型:

其中,为第i架无人机选择向网格c移动的归一化应激概率。

s62、侦察网格目标分配

第i架无人机采用轮盘赌形式依据归一化应激概率对其相邻网格集网格筛选,则选取的网格作为下一路径跟踪时刻t+ts的侦察地点,后转步骤七。

步骤七:狼群移动路径规划

s71、探狼与头狼路径规划

若sti=s1,则第i架无人机在下一路径跟踪时刻的侦察网格中心即为其路径规划航点;若sti=s3,设目标k为第i架无人机的引导目标,则目标k在下一路径跟踪时刻所处的网格中心即为第i架无人机的路径规划航点。

s72、猛狼路径规划

若sti=s2,设目标k为第i架无人机的攻击目标,则判断当前时刻t是否达到预定攻击时刻若是,则目标k在下一路径跟踪时刻所处的网格中心即为第i架无人机的路径规划航点;否则,按下式计算其路径规划航点。

s73、无人机路径跟踪控制

表示第i架无人机的路径规划航点,执行(2)式路径跟踪控制器,使无人机在一个路径规划周期ts内稳定到达wpi。若sti=s2,则令vir=va;否则,令vir=vr。

s74、输出任务分配结果

判断当前时刻t是否达到仿真时间tmax。若是,则输出已获取的目标价值、无人机-目标分配列表和无人机剩余资源分布表;否则,更新时间t=t+ts,并转步骤二。

本发明的仿狼群合作狩猎机制的无人机集群动态任务分配方法,其优点及功效在于:一、本发明提供了一种去中心化的分布式任务分配架构,在降低计算复杂度的同时,提升了任务系统鲁棒性;二、本发明提出了一种动态任务分配方法,支持任务实时重构,具有一定环境适应性;三、本发明可用于不确定环境下的察打一体化作战,具有资源均衡分配优势,可支持无人机集群连续长时间执行作战任务;四、本发明具有角色分化功能,使无人机集群趋于一种稳态任务分布,从而提升无人机的任务分配与执行效率。

附图说明

图1三维网格地图

图2无人机网格移动示意图

图3本发明仿狼群合作狩猎机制的无人机集群动态任务分配方法流程图

图4实例起始时刻三维战场场景图(图中数字代表无人机或目标编号)

图5实例30min时三维战场场景图(图中数字代表无人机或目标编号)

图6实例60min时三维战场场景图(图中数字代表无人机或目标编号)

图7实例90min时三维战场场景图(图中数字代表无人机或目标编号)

图8实例无人机任务分配甘特图(方格内数字代表跟踪或打击的目标编号)

图9实例无人机获取的目标累计价值变化曲线

图10实例无人机打击资源剩余量变化曲线

图中标号及符号说明如下:

c——三维网格索引

gc——网格c的三维位置边界

σ——三维网格总数

wp——路径规划目标网格

l1——无人机网格移动标称路径,即无人机所处网格与路径规划目标网格之间的直线轨迹

l2——无人机网格移动实际路径,即无人机通过路径跟踪控制器到达路径规划目标网格的实际轨迹

具体实施方式

下面通过具体的实例来验证本发明所提动态任务分配方法的有效性。在本实例中,给定nu=5架无人机对20km×20km×500m的未知区域进行察打一体化作战,并在该区域内随机布设nt=10个移动目标。本实例的仿真环境配置为inteli7-4790处理器,3.60ghz主频,4g内存,软件为matlab2010a版本,仿真时间tmax=10min。

仿狼群合作狩猎机制的无人机集群动态任务分配方法,其实现流程如图3所示,该实例的具体实践步骤如下:

步骤一:初始化战场环境设置

(1)初始化无人机六自由度运动控制模型

无人机六自由度运动控制模型设定如下:初始位置{x,y,z}随机分布于作战区域,初始空速和航迹倾角分别为v=60km/h和γ=0,航向角χ在[0,2π]内随机分布;飞行限制分别设定为vmin=30km/h、vmax=350km/h、nmin=-5、nmax=5、γmin=-π/4、γmax=π/4、g=9.8m/s2;响应时间设为τv=2s、τχ=3s、τγ=3s;运动更新步长ts=0.3s,路径跟踪步长ts=1min;反馈控制增益kv=kχ=kγ=4,kx=ky=kz=1。

(2)初始化战场空间

将战场空间划分为∑=10×10×5个同等大小的三维网格,即每个网格大小为2km×2km×100m,目标在每一路径跟踪时刻会随机选择移动到当前网格的相邻网格中心,无人机的侦察范围和打击范围均为单个网格区域,而通信范围为整个战场空间。目标初始价值分别设为100、100、100、100、90、90、90、80、80、80,价值折扣因子设为η=0.03。

(3)初始化侦察与打击任务设置

给定mt=5种目标类型和mu=3种无人机类型,建立以下无人机-目标侦察概率、打击概率和资源消耗矩阵分别如下:

1~5号无人机与其所属类型对应关系为i类、i类、ii类、ii类、iii类,而1~10号目标与其所属类型对应关系为i类、i类、ii类、ii类、iii类、iii类、iv类、iv类、v类、v类。设定侦察飞行空速vr=60km/h,攻击飞行空速va=300km/h,初始化无人机资源量为40、40、50、50、60,则在起始时刻,每架无人机将其任务状态st设定为侦察状态s1。

步骤二:执行侦察/打击/引领任务

(1)执行探狼任务

对于探狼无人机,按照(8)式判断是否侦察到目标。若是,则向任务区域内其他无人机广播探测成功信息,并转步骤三;否则,转步骤五。

(2)执行猛狼任务

对于猛狼无人机,获取预定攻击目标编号k,并判断当前时刻t是否已到目标k的预定攻击时刻若是,则按照(9)式执行目标攻击并判断是否打击成功。若是,则记录当前时刻的目标价值rk,并令st=s1转步骤五;否则,判断资源量是否低于资源阈值jmin=0。若是,则将目标k暂时搁置,清除探测标志并令st=s1转步骤五;否则,转步骤七。

(3)执行头狼任务

对于头狼无人机,获取引领攻击目标编号k,并判断当前时刻t是否已到目标k的预定攻击时刻若是,令st=s1转步骤五;否则,转步骤七。

步骤三:基于狩猎应激机制的攻击编队预分配

(1)判断有效打击资源量

对于集群内处于探狼状态且未探测到目标信息的无人机,在接收到其他无人机关于目标k的探测成功信息后,取余量系数α=1,判断其资源量是否满足j≥αjmin。若是,则执行下一步;否则,转步骤五。

(2)计算狩猎应激阈值模型

按照(10)式计算狩猎应激响应阈值,其中a1=a2=333.33,pa,min=0.7。选择打击激励函数为按照(11)和(12)式分别计算狩猎应激概率和预计飞行时间δτ*k,其中系数b=0.01。依据应激概率选择是否攻击目标k。若是,向广播无人机返回应答信息及其当前时刻有效资源量和无人机类型;否则,转步骤五。

(3)生成攻击预分配队列

广播无人机在一个路径跟踪周期内接收来自其他无人机的应答信息,得到应答无人机序列l,将其与自身编号组合构建针对目标k的攻击预分配队列并转步骤四。

步骤四:基于狩猎能量均衡模型的头狼/猛狼任务分配

(1)基于狩猎总能量筛选有效编队组合

广播无人机基于预分配队列根据组合关系生成幂集对于θk中的每个子集,按照(13)式计算其狩猎总能量和能量需求,判断其是否符合总能量关系。若是,将其加入有效编队组合ξk。对θk进行轮询,判断ξk是否为空。若是,则广播无人机将目标k暂时搁置,清除探测标志中的其他无人机发送分配无效信息,并令st=s1转步骤五;否则,执行下一步。

(2)计算均衡资源消耗量

对于ξk中的每个子集,按照(14)和(15)式计算其内部每架无人机的均衡资源消耗量

(3)计算狩猎能量均衡指标

对于ξk中的每个子集,首先按照(16)和(17)式计算其狩猎能量摄入值,其中能量摄入平衡系数为βin=0.8||ja||2。其次,按照(18)式计算其狩猎能量消耗值,并获得狩猎能量均衡指标,其中能量消耗平衡系数为βout=0.4。

(4)生成头狼/猛狼攻击编队

广播无人机对有效编队组合ξk中的每个子集计算其狩猎能量均衡指标,选取指标最高的子集作为目标k的打击编队ck。同时,按照(19)式计算打击编队ck关于目标k的预定攻击时刻随后,向ck中其他无人机发送分配有效信息、预定攻击时刻以及对应的均衡资源消耗量,而向未被选择作为打击编队的无人机发送分配无效信息。对于ck中的任意无人机,将其任务状态转为猛狼状态,令st=s2;若广播无人机不属于ck,则其转为头狼状态,令st=s3。对于任意处于头狼/猛狼状态的无人机,转步骤七;否则,转步骤五。

步骤五:更新侦察环境地图

(1)更新概率地图

在每个路径跟踪时刻,按照(20)和(21)式更新一次概率地图;在起始时刻,各个目标在每个网格的出现概率服从(0,1)内的均匀分布。

(2)更新确定性地图

在每个路径跟踪时刻,按照(22)式更新一次确定性地图,其中折扣因子ε=0.9;在起始时刻,每个网格的确定性概率为1。

步骤六:基于环境应激机制的探狼任务分配

(1)计算环境应激阈值模型

对于探狼无人机,按照(23)式计算其环境应激响应阈值,其中θmax=100,ω=3。计算其相邻网格c的环境激励函数进而按照(24)和(25)式分别获得无人机向网格c移动的应激概率和归一化应激概率

(2)侦察网格目标分配

采用轮盘赌形式依据归一化应激概率对其相邻网格集网格筛选,则选取的网格作为下一路径跟踪时刻t+ts的侦察地点,后转步骤七。

步骤七:狼群移动路径规划

(1)探狼/头狼路径规划

对于探狼无人机,其在下一路径跟踪时刻的侦察网格中心即为路径规划航点;对于头狼无人机,获取其引导目标编号,则该目标在下一路径跟踪时刻所处的网格中心即为路径规划航点。

(2)猛狼路径规划

对于猛狼无人机,获取其攻击目标编号,判断当前时刻是否达到该目标的预定攻击时刻。若是,则该目标在下一路径跟踪时刻所处的网格中心即为路径规划航点;否则,按照(26)式计算其路径规划航点。

(3)无人机路径跟踪控制

对于探狼/头狼无人机,令vr=vr;对于猛狼无人机,令vr=va。执行(2)式路径跟踪控制器,使无人机在路径规划周期ts内稳定到达路径规划航点。

(4)输出任务分配结果

判断当前时刻是否达到仿真时间tmax。若是,则输出已获目标价值、任务分配列表和剩余资源分布表;否则,更新时间并转步骤二。

图4至图10给出了本实例相关仿真结果,其中图4至图7分别给出了本实例在起始时刻、30min、60min和90min的三维场景图。5架无人机在每时刻根据不同任务类型分别前往相应路径航点和目标网格执行侦察、打击或跟踪任务。目标则在每分钟更新其网格位置,移动策略较为随机,因此不易被侦测。随着无人机搜索深度的增加,目标被逐渐发现。图8以甘特图形式给出了整个仿真过程中无人机集群的任务分配情况,可见在95min左右无人机已完成对所有目标的侦察并毁伤所有目标。图8较为明确的展示了多机协同打击在实例中所发挥的作用,即频繁出现头狼引导-猛狼攻击的协作攻击形式。由于不同无人机对目标的打击概率、剩余资源量存在差距,需要寻找最优的任务分配策略。而图8与图10的仿真结果表明,本发明所用方法在均衡打击资源、优化编队打击能力方面具有显著性优势,即在任务执行后期,随着打击资源的消耗,采用编队形式打击会不仅提高了打击概率,同时均衡打击资源消耗,提升了任务执行效率。此外,图8相关结果也表明本发明所用方法会使个体无人机具有一定的角色和功能分化,随着同一种任务类型的不断执行,个体无人机会对相应任务产生一定倾向性,例如1号无人机更倾向作为猛狼执行攻击任务,而2号无人机则倾向于作为头狼引领协同攻击。角色分化会使无人机集群趋于一种稳态任务分布,从而提升个体无人机的任务分配与执行效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1