一种基于TUU博弈的协同对抗方法与流程

文档序号:37426108发布日期:2024-03-25 19:13阅读:43来源:国知局
一种基于TUU博弈的协同对抗方法与流程

本发明属于无人集群系统领域,尤其涉及一种基于tuu博弈的协同对抗方法。


背景技术:

1、智能无人集群系统是由若干无人系统根据任务分工,在一定时间、空间内协同完成复杂任务的整体系统。在军事领域中,无人装备具有低成本、小型化、功能单一、组网灵活等特性,以群体智能为核心技术的无人集群系统自主协同作战是未来战争重要样式。

2、在网络环境下,由异质、异智系统(智能体)通过彼此之间的信息交互构成的多维异构无人集群系统,称为多智能体系统,即agent系统。在多agent执行任务过程中,可能出现电磁干扰后的区域性agent失联,稀疏agent集群导致的通信网络严重分割,较大agent数量规模引起的数据链广播风暴,严重影响通信网络的信息交互质量,难以保证多agent执行任务过程中数据的可靠交互。然而,现有协同探测和对抗方法主要假设数据链路稳定,通信带宽不受限时的多agent自主交互,当agent数量规模突发性扩张,或在对抗环境下agent数量规模性毁伤时,上述多agent的信息交互方法无法获得理想解。在稀疏/稠密数据链路下,agent发出的消息不能够成功传递,或者数据传输的延时过大,消息丢包率高,尤其是很多关键消息会因网络通信能力不强而丢弃,这大大降低了任务执行的速度。另一方面,现有的协同探测和对抗方法中缺少准确的实时对于探测效能和对抗效能的评估、以及对于网络效能的评估,无法为调整联盟策略提供有力数据支撑。


技术实现思路

1、鉴于上述的分析,本发明旨在提供一种基于tuu博弈的协同对抗方法,保证多agent执行任务过程中的数据链路完整、消息交付率高,并实时反馈执行任务过程中的探测效能、对抗效能和网络效能评估结果对调整策略提供有力支撑,进一步提升任务执行效率。

2、本发明方法具体包括如下:基于协同对抗任务确定探测联盟和/或对抗联盟,所述联盟在任务的迭代过程中动态变化;其中,在一次任务迭代过程中,包括:基于各联盟基础数据判断各联盟当前的链路状态;

3、基于各联盟当前的链路状态使用tuu博弈的数据交互方法激励联盟中agent节点的合作进行数据交互;

4、基于协同探测效能调整探测联盟的数据交互策略和自主探测策略;基于协同对抗效能调整对抗联盟的数据交互策略、编队方式和自主对抗策略;

5、基于所述联盟的网络总体效能调整联盟进入下一次任务迭代或结束任务。

6、进一步的,利用d-s证据理论基于各联盟基础数据判断各联盟链路状态,包括:

7、确定各联盟的通信网络状态识别框架为θ=(通信能力强s,通信能力弱d);

8、基于各联盟基础数据确定d-s理论的证据数;

9、基于证据数利用不确定性计算公式和判决准则判断各联盟链路状态为通信能力强s或通信能力弱d。

10、进一步的,所述基于各联盟链路状态使用tuu博弈的数据交互方法激励联盟中agent节点的合作包括:

11、判定各联盟中断链路状态为通信能力弱d的联盟为稀疏网络,链路状态为通信能力强s的联盟为稠密网络;

12、对于判定为稀疏网络的联盟,在每一轮tuu博弈中,基于该联盟各agent节点的收益和平均连接率激励该联盟中agent节点合作;

13、对于判定为稠密网络的联盟,在每一轮tuu博弈中,基于该联盟各agent节点的效用值设置代理节点激励联盟中agent节点合作。

14、进一步的,所述协同对抗效能包括编队效能和对抗效能;

15、所述编队效能包括编队集结效能、编队保持效能、编队规避效能和动态编队总体效能;

16、所述对抗效能包括软对抗效能、硬对抗效能、多agent生存能力和多agent协同对抗动态效能。

17、进一步的,所述多agent协同对抗评估指标的计算方法为:

18、pdj=λrsspa+λgjpb+λscpp;

19、其中,pa为软对抗效能;pb为硬对抗效能;pp为生存效能,λrss、λgj、λsc为各效能相对应的权重。

20、进一步的,所述软对抗效能的计算方法为:

21、

22、其中,ai为某项软对抗目标功能i效能指标的影响因子;pi为目标本身无软对抗条件下功能的i效能指标;pis为目标在某项软杀伤对抗条件下功能i的效能指标;m表示有效agent节点的数量;表示对m个有效agent节点求和。

23、进一步的,所述硬对抗效能的计算方法为:

24、

25、其中,nload为该联盟当前的agent最大挂载量,nneed为对目标实施硬对抗所需要的agent数量,为单个agent对目标的平均破坏概率;ptp为agent对目标的突破概率;pd为agent对目标的发现概率;表示对目标的平均破坏概率。

26、进一步的,所述多agent生存能力计算方法为:

27、

28、其中,pc表示该联盟的多agent生成能力;e表示该联盟的有效agent个数;n表示该联盟的全体agent个数;ps表示协同生存力,pd表示敏感性,pkss表示易损性。

29、进一步的,所述联盟的网络总体效能包括网络可达性和网络可信性,所述平台基于所述联盟的网络总体效能调整联盟进入下一次任务迭代或结束任务包括:

30、基于所述网络可达性确定是否结束任务:

31、若网络可达性表明系统故障无法工作,则结束任务;

32、否则基于所述网络可信性调整联盟,进入下一轮任务迭代。

33、进一步的,所述网络可达性表示为:

34、a=[a0,a1,a2,a3];

35、其中,a0为联盟在开始执行任务时处于正常工作状态的概率;a1为联盟保障范围在小于正常范围大1/2正常保障范围的概率;a2为联盟保障范围大于1/4正常保障范围小于1/2正常保障范围的概率;a3为联盟无法工作处于故障状态的概率。

36、需要说明的是,所述联盟的网络可达性基于联盟内各agent基础数据由任务规划平台计算得到。当网络可达性为a3时,表明联盟故障,无法工作。

37、所述网络可信性表示为:c1=α1β1+α2β2;

38、β1=γ1ε1+γ2ε2+γ3ε3+γ4ε4;

39、其中,ε1为联盟的网络数据传输正确率;γ1为数据传输正确率在可用性的权重;ε2为联盟的网络数据更新率;γ2为数据更新率在可用性的权重;ε3为联盟的网络数据传输时延;γ3为数据传输时延在可用性的权重;ε4为联盟的网络数据传输精度;γ4为数据传输精度在可用性的权重;

40、β2=δ1θ1+δ2θ2+δ3θ3+δ4θ4;

41、其中,δ1为联盟的网络数据丢失率;θ1为数据丢失率在可达性的权重;δ2为联盟的网络作用距离;θ2为作用距离在可达性的权重;δ3为联盟的网络内部连通性;θ3为联盟内部连通性在可达性的权重;δ4为该联盟的跨联盟连通性;θ4为跨联盟连通性在可达性的权重。

42、进一步的,基于所述网络可信性调整联盟,进入下一轮任务迭代。

43、本发明至少可以实现下述之一的有益效果:

44、通过在多agent自主协同对抗过程中,对于联盟为稀疏网络和稠密网络的情况,使用tuu博弈激励联盟中agent节点的合作进行数据交互,提升多agent执行任务过程中的数据传输的消息交付率,并在每一轮任务迭代过程中,基于联盟的协同探测效能、联盟中多agent的协同对抗效能和联盟的网络效能评估结果调整联盟策略,提升任务执行效率。

45、通过在稀疏网络中,计算各agent节点的收益和平均连接率激励,激励网络中节点的积极合作,增加网络连接的机会,增加消息传递的成功率和数据链的连通性;在稠密网络中,通过设置代理节点作为中间转发节点,控制稠密网络中消息频繁交互的情况,减少网络的冗余包,降低网络负载,提升网络的连通性和性能,避免网络风暴。本发明方法对于需要大量回传图像、视频的探测和对抗任务场景尤其能够提升任务完成效率。

46、通过计算探测效能、对抗效能和网络效能的多个效能指标,准确评估协调联盟的探测和对抗效能,能够及时对联盟调整探测和对抗策略提供有力依据。

47、本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书、权利要求书以及附图中所特别指出的内容中来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1