基于动态贝叶斯网络的威胁估计方法与流程

文档序号:11621044阅读:261来源:国知局
基于动态贝叶斯网络的威胁估计方法与流程

本发明属于态势估计技术领域,特别涉及一种基于动态贝叶斯网络的威胁估计方法,可用于态势估计、指挥控制系统。



背景技术:

当今地区冲突呈现出对象多元化和环境复杂化的特点,面对观测数据量急剧上升的情况,如果仍然依靠人工处理,则时效性和一致性均难以满足实际需求。因此,需要利用计算机的存储和计算优势来处理大量重复出现的有规律态势,从而减轻指挥员的工作负担,使其能够更为快速有效地掌握实时动态。其中,威胁分析是在提取的态势要素基础之上,对环境中存在的蓝方威胁程度进行推理分析,从而为行动方案制定和路径规划提供参考依据。

目前,典型的威胁估计方法主要基于以下理论:直觉模糊逻辑、贝叶斯网络、神经网络、证据网络等。现有方法存在的缺陷主要有:(a)只考虑各因素与威胁的静态关系,未能体现威胁在时间上连续变化特性;(b)针对单个目标间的威胁估计,而实际中目标通常是以编队群目标的形式执行任务,单个目标间的威胁,未考虑目标数量,难以有效反映真实的威胁情况;(c)传统的威胁等级估计,通常是当某一等级的概率大于阈值时,将其作为最终结果。而当各等级的概率较为接近时,这种方法难以设置合理阈值,导致输出不稳定。



技术实现要素:

本发明的目的在于针对上述已有技术中的不足,采用动态贝叶斯网络,综合多种态势要素实现对蓝方群目标威胁的动态评估,提出了一种基于动态贝叶斯网络的威胁估计方法,有效提高威胁估计的可靠性和稳定性。

实现本发明的技术关键是:在威胁估计过程中,首先综合多种态势要素构建动态贝叶斯网络,经训练学习得到网络参数,其次根据马尔可夫性实现快速近似推理,进而将各威胁等级概率融合为连续的威胁指数及离散的威胁等级。其实现步骤包括如下:

(1)初始设置为训练模式;

(2)数据汇集整理,具体包括以下步骤:

(2a)初始化性能参数,包括:蓝方目标攻击范围和蓝方目标速度上限;

(2b)读入当前时刻观测数据,包括:气象、地形、时间、蓝方目标数、红方目标数、蓝方目标实力量化数据、红方目标实力量化数据、红蓝双方实际距离和蓝方目标径向速度;

(2c)结合性能参数和观测数据,得到相对实力连续值、相对距离连续值和相对速度连续值;

(2d)对相对实力连续值、相对距离连续值和相对速度连续值进行离散化,得到相对实力、相对距离和相对速度;

(3)建立动态贝叶斯网络拓扑,具体包括以下步骤:

(3a)建立威胁估计动态贝叶斯网络拓扑,网络节点包括:可观测节点和隐藏节点;所述的可观测节点包括:气象、地形、时间、相对实力、相对距离和相对速度,所述的隐藏节点包括:外部因素和威胁;所述的动态贝叶斯网络包含两层推理结构:将气象、地形和时间融合为外部因素;将外部因素、相对实力、相对距离和相对速度融合为威胁;

(3b)设置各网络节点概率分布,包括气象概率分布、地形概率分布、时间概率分布、相对实力概率分布、相对距离概率分布、相对速度概率分布、外部因素先验概率分布和威胁先验概率分布;

(4)训练模式下对动态贝叶斯网络参数进行学习与设置,具体包括以下步骤:

(4a)判断当前模式是否为训练模式,若是,则执行步骤(4b),否则,执行步骤(5);

(4b)判断是否达到设定的学习次数,若是,则通过对观测数据学习,得到各网络节点间的条件概率分布;否则返回步骤(1);所述的各网络节点间的条件概率分布包括:当前时刻气象和外部因素的条件概率分布、当前时刻地形和外部因素的条件概率分布、当前时刻时间和外部因素的条件概率分布、当前时刻外部因素和威胁的条件概率分布、当前时刻相对实力和威胁的条件概率分布、当前时刻相对距离和威胁的条件概率分布、当前时刻相对速度和威胁的条件概率分布、上一时刻威胁和当前时刻威胁的条件概率分布;

(4c)将训练所得的各网络节点间的条件概率分布设置为动态贝叶斯网络参数;

(4d)将当前模式设置为应用模式,返回步骤(2);

(5)根据各网络节点概率分布和各网络节点间的条件概率分布,经贝叶斯推理得到当前时刻威胁的后验概率分布,具体包括以下步骤:

(5a)结合当前时刻的气象、地形、时间和当前时刻的外部因素先验概率分布经贝叶斯推理得到当前时刻外部因素的后验概率分布;

(5b)结合当前时刻的外部因素、相对实力、相对距离、相对速度、上一时刻威胁和当前时刻的威胁先验概率分布经贝叶斯推理得到当前时刻威胁的后验概率分布;

(5c)根据马尔可夫性,更新得到下一时刻的外部因素先验概率分布和下一时刻的威胁先验概率分布;

(6)将当前时刻威胁的后验概率分布融合为连续的威胁指数及离散的威胁等级,具体包括以下步骤:

(6a)从当前时刻威胁的后验概率分布中提取各威胁等级概率;

(6b)将各威胁等级概率融合为当前时刻威胁指数;

(6c)根据威胁指数和阈值,得到当前时刻威胁等级;

(7)输出当前时刻威胁指数和威胁等级,检查下一时刻的观测数据是否到达,若是,将下一时刻更新为当前时刻,跳转到步骤(2);否则,结束本流程;

其中,步骤(2c)所述的结合性能参数和观测数据,得到相对实力连续值、相对距离连续值和相对速度连续值,具体为:

计算相对实力连续值

其中,oi表示红方第i个目标实力量化值,i为红方目标标号,取值为1,2,···,nk,nk为红方目标数,ej表示蓝方第j个目标实力量化值,j为蓝方目标标号,取值为1,2,···,mk,mk为蓝方目标数;

计算相对距离连续值

其中,dk为红蓝双方实际距离,r为蓝方目标攻击范围;

计算相对速度连续值

其中,vk为蓝方目标径向速度,vsup为蓝方目标速度上限。

其中,步骤(2d)所述的对相对实力连续值、相对距离连续值和相对速度连续值进行离散化,得到相对实力、相对距离和相对速度,具体为:

离散化相对实力

离散化相对距离

离散化相对速度

其中,步骤(5a)所述的结合当前时刻的气象、地形、时间和当前时刻外部因素先验概率分布经贝叶斯推理得到当前时刻外部因素的后验概率分布,具体为:

其中,pu(ek)为k时刻外部因素的后验概率分布,p(wk)为k时刻气象概率分布,p(gk)为k时刻地形概率分布,p(tk)为k时刻时间概率分布,pf(ek)为k时刻外部因素先验概率分布,p(wk|ek)为k时刻气象和外部因素的条件概率分布,p(gk|ek)为k时刻地形和外部因素的条件概率分布,p(tk|ek)为k时刻时间和外部因素的条件概率分布。

其中,步骤(5b)所述的结合当前时刻的外部因素、相对实力、相对距离、相对速度、上一时刻威胁和当前时刻威胁先验概率分布经贝叶斯推理得到当前时刻威胁的后验概率分布,具体为:

其中,pu(thk)为k时刻威胁的后验概率分布,p(sk)为k时刻相对实力概率分布,p(dk)为k时刻相对距离概率分布,p(vk)为k时刻相对速度概率分布,pu(thk-1)为k-1时刻威胁后验概率分布,pf(thk)为k时刻威胁先验概率分布,p(ek|thk)为k时刻外部因素和威胁的条件概率分布,p(sk|thk)为k时刻相对实力和威胁的条件概率分布,p(dk|thk)为k时刻相对距离和威胁的条件概率分布,p(vk|thk)为k时刻相对速度和威胁的条件概率分布,p(thk-1|thk)为k-1时刻威胁和k时刻威胁的条件概率分布。

其中,步骤(5c)所述的更新得到下一时刻的外部因素先验概率分布和威胁先验概率分布,具体为:

pf(ek+1)=pu(ek);

pf(thk+1)=pu(thk);

其中,pf(ek+1)为k+1时刻外部因素先验概率分布,pf(thk+1)为k+1时刻威胁先验概率分布。

其中,步骤(6a)所述的从当前时刻威胁的后验概率分布中提取各威胁等级概率,具体为:

pu(thk)={w1,w2,w3};

其中,pu(thk)为k时刻威胁的后验概率分布,w1为k时刻威胁为“高”的概率,w2为k时刻威胁为“中”的概率,w3为k时刻威胁为“低”的概率。

其中,步骤(6b)所述的将各威胁等级概率融合为当前时刻威胁指数,具体为:

其中,ik为k时刻威胁指数,取值范围为ik∈[1,100],bc为第c个威胁等级的基准威胁度,c为威胁等级序号,取值为1,2,3,即b1为威胁等级为“高”的基准威胁度,b1=100,b2为威胁等级为“中”的基准威胁度,b2=10,b3为威胁等级为“低”的基准威胁度,b3=1。

其中,步骤(6c)所述的根据威胁指数和阈值,得到当前时刻威胁等级,具体为:

其中,lk为k时刻威胁等级。

本发明相比现有技术具有以下优点:

1)本发明采用动态贝叶斯网络实现威胁估计,能够反映各态势要素与威胁的动态关系,体现威胁在时间上连续变化特性;

2)本发明考虑了群目标的相对实力,能够有效反映编队间的威胁情况;

3)本发明通过设置各威胁等级的基准威胁度,结合各威胁等级概率,融合成为连续的威胁指数及离散的威胁等级,能够同时得到对威胁的定量和定性估计,可以为后续决策提供更为丰富、精确的参考信息,并且该威胁等级估计方法,相较传统方法,更为平滑,稳定。

附图说明

图1是本发明的整体流程图;

图2是用本发明进行威胁估计的动态贝叶斯网络拓扑;

图3是用本发明进行威胁估计的实验场景;

图4是用本发明进行威胁估计的各可观测节点随时间变化曲线;

图5是用本发明进行威胁估计的各威胁等级概率、威胁指数和威胁等级结果。

具体实施方式

下面结合附图及实施例对本发明做进一步详细的说明。

参照图1,本发明的基于动态贝叶斯网络的威胁估计方法,具体包括以下步骤:

步骤1.初始设置为训练模式;

步骤2.数据汇集整理,具体包括以下步骤:

2.1)初始化性能参数,包括:蓝方目标攻击范围r,蓝方目标速度上限vsup;

2.2)令初始时刻k=1,读入k时刻的观测数据,包括:气象wk,取值为“有利”或“不利”,地形gk,取值为“有利”或“不利”,时间tk,取值为“白天”或“夜晚”,蓝方目标数mk,红方目标数nk,蓝方目标实力量化数据ej表示蓝方第j个目标实力量化值,j为蓝方目标标号,取值为1,2,···,mk,红方目标实力量化数据oi表示红方第i个目标实力量化值,i为红方目标标号,取值为1,2,···,nk,红蓝双方实际距离dk,蓝方目标径向速度vk;

2.3)结合性能参数和观测数据,得到相对实力连续值相对距离连续值相对速度连续值

计算相对实力连续值

计算相对距离连续值

计算相对速度连续值

2.4)对相对实力连续值、相对距离连续值和相对速度连续值进行离散化,得到相对实力sk、相对距离dk、相对速度vk;

离散化相对实力

离散化相对距离

离散化相对速度

步骤3.建立动态贝叶斯网络拓扑。

3.1)利用专家知识和经验建立威胁估计动态贝叶斯网络拓扑,如图2所示,网络节点包括:可观测节点和隐藏节点,所述的可观测节点包括:气象wk、地形gk、时间tk、相对实力sk、相对距离dk、相对速度vk,所述的隐藏节点包括:外部因素ek、威胁thk,动态贝叶斯网络包含两层推理结构,首先将气象wk、地形gk、时间tk融合为外部因素ek,其次将外部因素ek、相对实力sk、相对距离dk、相对速度vk融合为威胁thk;

3.2)设置各网络节点概率分布:

3.2.1)由气象、地形、时间、相对实力、相对距离、相对速度,分别得到k时刻各态势要素的概率分布,包括:气象概率分布p(wk)、地形概率分布p(gk)、时间概率分布p(tk)、相对实力概率分布p(sk)、相对距离概率分布p(dk)、相对速度概率分布p(vk);

3.2.2)外部因素ek,取值为“有利”、“无影响”或“不利”,当k=1时k时刻外部因素先验概率分布pf(ek)设置为等概率分布,下标f表示所属概率分布为先验概率分布;

3.2.3)威胁thk,取值为“高”、“中”或“低”,当k=1时威胁先验概率分布pf(thk)设置为等概率分布;

步骤4.参数学习与设置。

训练模式下对动态贝叶斯网络参数进行学习与设置,具体包括以下步骤:

4.1)判断当前模式是否为训练模式,若是,则执行步骤4.2),若否则执行步骤5;

4.2)判断是否达到设定的学习次数,若是,则通过对观测数据学习,得到各网络节点间的条件概率分布;否则返回步骤(1);所述的各网络节点间的条件概率分布包括:k时刻气象和外部因素的条件概率分布p(wk|ek),k时刻地形和外部因素的条件概率分布p(gk|ek),k时刻时间和外部因素的条件概率分布p(tk|ek),k时刻外部因素和威胁的条件概率分布p(ek|thk),k时刻相对实力和威胁的条件概率分布p(sk|thk),k时刻相对距离和威胁的条件概率分布p(dk|thk),k时刻相对速度和威胁的条件概率分布p(vk|thk),k-1时刻威胁和k时刻威胁的条件概率分布p(thk-1|thk);

4.3)将训练所得各网络节点间的条件概率分布设置为动态贝叶斯网络参数;

4.4)将当前模式设置为应用模式,返回步骤2。

步骤5.贝叶斯推理。

根据各网络节点概率分布和各网络节点间的条件概率分布,经贝叶斯推理得到k时刻威胁的后验概率分布

5.1)结合k时刻的气象、地形、时间和k时刻外部因素的先验概率分布推理得到k时刻外部因素的后验概率分布

其中,下标u表示所属概率分布为后验概率分布;

5.2)结合k时刻的外部因素、相对实力、相对距离、相对速度、k-1时刻威胁和k时刻威胁的先验概率分布推理得到k时刻威胁的后验概率分布

5.3)根据马尔可夫性,更新得到k+1时刻的外部因素先验概率分布和威胁先验概率分布

pf(ek+1)=pu(ek),9)

pf(thk+1)=pu(thk)。10)

步骤6.威胁融合估计。

将k时刻威胁的后验概率分布融合为连续的威胁指数及离散的威胁等级。

6.1)从k时刻威胁的后验概率分布中提取各威胁等级概率

pu(thk)={w1,w2,w3};11)

其中,w1为k时刻威胁为“高”的概率,w2为k时刻威胁为“中”的概率,w3为k时刻威胁为“低”的概率。

6.2)将各威胁等级概率融合为k时刻威胁指数

其中,ik为k时刻威胁指数,取值范围为ik∈[1,100],bc为第c个威胁等级的基准威胁度,c为威胁等级序号,取值为1,2,3,即b1为威胁等级为“高”的基准威胁度,b1=100,b2为威胁等级为“中”的基准威胁度,b2=10,b3为威胁等级为“低”的基准威胁度,b3=1。

6.3)根据威胁指数和阈值,得到k时刻威胁等级

步骤7.威胁估计结果输出。

7.1)输出k时刻威胁指数ik和威胁等级lk;

7.2)检查下一时刻的观测数据是否到达,若是,令k=k+1,返回步骤2进行迭代;否则,结束本流程。

本发明的效果可通过以下仿真实验进一步说明:

1.仿真条件。

仿真环境:计算机采用intelcorei3-2130cpu3.4ghz,2gb内存,软件采用matlabr2011a仿真实验平台。

仿真参数:蓝方目标攻击范围r=60km,蓝方目标速度上限vsup=360km/h。

2.仿真方法。

方法1:本发明方法。

3.仿真内容与结果。

用方法1,实现图3所示实验场景中群目标2(蓝方)对群目标6(红方)的威胁等级估计,各可观测节点随时间变化曲线如图4所示,威胁估计结果如图5所示,其中:

图3为用本发明进行威胁估计的实验场景;

图4为用本发明进行威胁估计的各可观测节点随时间变化曲线;

图5为用本发明进行威胁估计的各威胁等级概率、威胁指数和威胁等级结果。

在图3中,局部区域a和b为地形不利区域,局部区域c和d为气象不利区域,黑点表示各群目标的位置量测,黑色六角形为群目标观测起始位置,旁边的数字为群目标编号,各群目标编队情况如表1所示。图3所描绘的态势情况为蓝方飞机与车辆多编队向红方车辆编队快速行进,遭遇红方飞机编队拦截后撤退。

表1

从图3和图4可以看出,随时间变化,相对实力保持不变;时间由白天到夜晚,为昼夜交替,傍晚时分;相对速度,初始为正向接近,后半段反向远离;地形,先后经过两个地形不利区域;气象,先后经过两个气象不利区域;相对距离,逐步接近至某一距离后稳定保持。

从图5可以看出,威胁等级高、中、低各自的概率,受各可观测节点的影响,起伏变化;量化融合得到的威胁指数,从整体趋势上反映了威胁连续变化,进而得到最终的威胁等级估计。通过分析可以看出,在前半段主要由于相对距离较远(处于攻击范围外),尽管受到相对速度正向接近和地形不利的影响,威胁指数整体处于较低水平;而在后半段,主要由于相对距离较近(处于攻击范围内),并受尽管受到地形和气象不利的影响,威胁指数整体在较高水平起伏波动。

综上可以得出,本发明能够综合多种态势要素,进行合理、智能的推理分析,实现了对蓝方群目标威胁动态的定量和定性估计,显著提升了态势分析能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1