基于麻雀搜索神经网络的空战机动决策方法

文档序号：26009302发布日期：2021-07-23 21:29阅读：226来源：国知局

本发明涉及一种空战机动决策方法，具体涉及一种基于麻雀搜索神经网络的空战机动决策方法。

背景技术：

在国内，对作战指挥与智能化控制技术方面的研究主要集中于计算、指挥员口令识别、作战文书模式匹配、军用卫星图像目标识别等计算智能和感知智能领域，而对认知智能方面的研究尚在起步阶段。随着以深度学习为代表的人工智能技术取得突破，尤其是alphago大获成功后，国内掀起了新一轮人工智能研究热潮，部分军事科研院所开展了指挥与智能化控制技术的创新研究和工程实践。

有学者提出了信息时代，是以信息化为主导，普遍采用计算机技术、网络技术等现代信息技术，从而充分高效地开发利用信息资源，推动经济发展和社会进步。信息化是新一轮军事变革的核心，促使体系作战指挥与控制发生新的深刻变革。

新一代人工智能技术、通信与计算技术的发展，使得信息化体系作战指挥与控制呈现智能化发展趋势。随着战斗机超机动作战技术的成熟，机动决策成为空战博弈中最重要的部分。所述机动决策以获得有利的攻击位置或逃离敌机攻击范围为目的，是作战飞机进行自主空战所必须具备的关键技术。在双方空战态势复杂的情况下，迅速、精准地进行空战机动决策，充分发挥战斗机地高机动特性，已经成为空战决策中急需解决地问题之一。

技术实现要素：

为满足机动决策的准确性和快速性的需求，本发明提供了基于麻雀搜索神经网络的空战机动决策方法。

为实现上述目的，本申请的技术方案为：基于麻雀搜索神经网络的空战机动决策方法，包括：

基于角度、距离、高度因素构造相应的态势函数，将所述态势函数结合起来并加权得到空战态势评估函数；

将所述态势函数作为神经网络的输入，将所述空战态势评估函数作为神经网络的输出，该输出结果作为机动决策的依据，利用麻雀搜索算法对所述神经网络的权值和阈值进行优化，得到麻雀搜索神经网络；

利用所述麻雀搜索神经网络的学习和预测功能对所述空战态势评估函数进行学习，得到空战机动决策模型。

进一步的，角度态势函数包括俯仰角态势函数和偏航角态势函数；所述俯仰角态势函数定义为：

其中γr是速度矢量相对于视距矢量的俯仰角；

所述偏航角态势函数定义为：

其中ψr速度矢量相对于视距矢量的偏航角。

进一步的，距离态势函数定义为：

式中，rd是为导弹射程，σ为攻击距离的标准差，r为空战两机之间的距离；

高度态势函数定义为：

式中，hop表示飞机对目标的最优攻击高度差，δz为飞机与目标的实时高度差，σh为最优攻击高度标准差。

进一步的，所述空战态势评估函数为：

s＝ω1sγa+ω2sψa+ω3sr+ω4sh+ω5sγb+ω6sψb(5)

其中，i＝1,2,…,6；sγa为作战飞机俯仰角，sψa为作战飞机偏航角，sγb为攻击目标飞机俯仰角，sψb为攻击目标飞机偏航角；

因此，将判断空战是否成功构建为：

其中，rfire是最佳导弹发射距离，sa、sb分别为作战飞机的空战态势评估函数和攻击目标飞机的空战态势评估函数；首先必须满足导弹发射条件，即式(6)中的前三个条件；然后作战飞机的空战态势评估函数必须大于攻击目标飞机的空战态势评估函数，才能取得胜利。

进一步的，所述神经网络包括：输入层，接收作战决策数据，将决策影响因素细分为因素1、因素2、…、因素n；隐藏层，对输入层传输的归一化数据信息进行组织，并按照一定的规则学习；输出层，通过s型变换函数映射完成非线性问题的解；所述s型函数的一般方法如下：

其中，u是输入的值。

更进一步的，得到空战机动决策模型，包括：

确定神经网络的结构和参数；

生成一组随机分布作为态势函数的权重，并确定神经网络的隐藏节点数目；

初始化麻雀搜索算法参数；

获取态势数据集，对所述态势数据集进行归一化操作，按照一定的比例划分训练集、测试集和验证集；

利用麻雀搜索算法修改神经网络的权重；

将麻雀搜索算法得到的优化值作为神经网络的权值，进行多次训练，不断优化权值，直到满足预定的精度；

获得空战机动决策模型，对该模型的输入数据集进行测试，不满足预先设定的误差要求，则继续训练。

更进一步的，所述利用麻雀搜索算法修改神经网络的权重，包括：

根据神经网络的误差函数，确定神经网络适应度函数；

获取麻雀的适应度函数并将其排序进而选择出初始最优值和最差值；

更新发现者的位置、加入者的位置以及意识到危险的麻雀位置；获得当前最优值，如果当前最优值比上一次迭代的最优值好的话则进行更新操作，否则不进行更新操作，并继续进行迭代直到满足条件为止，最终得到全局最优值和最佳适应度值。

本发明由于采用以上技术方案，能够取得如下的技术效果：上述空战机动决策方法速度快，准确性高，在空战中可以取得巨大的优势，从而赢得空战的胜利。麻雀搜索算法与神经网络的结合充分利用了两者的优点，使空战机动决策模型既具有神经网络的学习功能和鲁棒性，又具有麻雀搜索算法的优化能力。

附图说明

图1为本实施例中神经网络模型图；

图2为本实施例中利用麻雀搜索算法修改神经网络的权重流程图；

图3为本实施例中收敛速度对比图；

图4为本实施例中误差图；

图5为本实施例中验证策略一图；

图6为本实施例中验证策略二图。

具体实施方式

本发明的实施例是在以本发明技术方案为前提下进行实施的，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述实施例。

实施例1

本实施例提供基于麻雀搜索神经网络的空战机动决策方法，可以包括如下步骤：

s1.基于角度、距离、高度因素构造相应的态势函数，将所述态势函数结合起来并加权得到空战态势评估函数；

具体的，空战机动决策是根据角度、距离、高度等态势进行机动变换，如何进行快速、有效的变换是机动决策中最重要的问题，因此采用了四种态势函数和空战态势评估函数；

(1)俯仰角态势函数：空战中最重要的是射击，其次是各种战术机动，最后是飞行性能。不管是用机炮还是导弹来攻击敌人，都必须找到适合的位置，满足角度的要求。因此，空战中角度情况是最重要的。俯仰角态势函数定义为：

其中γr是速度矢量相对于视距矢量的俯仰角。飞机的仰角过大，会造成失速等危险情况，所以俯仰角的取值范围应为

(2)偏航角态势函数:偏航角决定了飞机的航向，即飞行方向，变换偏航角有利于躲避敌人的雷达锁定和导弹攻击，偏航角的态势函数定义为：

其中ψr速度矢量相对于视距矢量的相对偏航角，由于飞机的机动性能影响。偏航角的取值范围(-π，π)。

(3)距离态势函数:空战的最终目标是发射导弹摧毁攻击目标飞机，影响远程态势的主要因素是导弹的射程。因此，距离态势函数可以定义为：

式中，rd是为导弹射程，σ为攻击距离的标准差，r为空战两机之间的距离。当敌机处于导弹射程范围内时，距离态势函数值始终为1。当敌机超出导弹射程时，距离态势函数值随距离的增大而减小。

(4)高度态势函数:飞机的实时高度也很重要，因为如果高度过低，就有可能发生飞机坠毁，一般来说飞机高度高于敌方，会更有利于发射导弹。因此，高度态势函数可定义为：

式中，hop表示飞机对目标的最优攻击高度差，δz为飞机与目标的实时高度差，σh为最优攻击高度标准差。

(5)空战态势评估函数:现有的决策方法通常将态势评估函数值最高的机动视为最佳机动。根据以上态势信息，定义评估函数：

s＝ω1sγa+ω2sψa+ω3sr+ω4sh+ω5sγb+ω6sψb(5)

其中

空战目的是发射导弹摧毁敌机，因此需要满足导弹的发射条件。空战的胜败判断可以构建为：

其中rfire是最佳导弹发射距离，sa和sb代表我机的态势评估函数和敌机的态势评估函数。首先必须满足导弹发射条件，即式(6)中的前三个条件。然后，为了验证该决策方法的有效性，在满足导弹发射条件后，我机的态势评估函数值必须大于敌机，我机才能赢得战斗，反之亦然。

s2.将所述态势函数作为神经网络的输入，将所述空战态势评估函数作为神经网络的输出，该输出结果作为机动决策的依据，利用麻雀搜索算法对所述神经网络的权值和阈值进行优化，得到麻雀搜索神经网络；

具体的，麻雀种群数量作为参与优化神经网络权值的数量，优化维度表示参与优化的麻雀搜索空间，其与神经网络的输入层节点、隐藏层节点和输出层节点有关，麻雀的适应度函数与神经网络的权值、阈值建立直接的映射关系。

如图1所示，神经网络各层的具体功能如下:输入层是影响决策的模块，输入层接收作战决策数据，将决策影响因素细分为因素1、因素2、…、因素n。训练样本数据可以表示为xj＝(x1,x2,...,xn),隐藏层对输入层传输的归一化数据信息进行组织，并按照一定的规则进行学习，权值将输入层与输出层连接起来，通过s型变换函数映射完成非线性问题的解。其s型变换函数的一般方法如下：

神经网络的黑盒部分对空战机动决策数据进行处理，可以得到不同形式的表达式，为其提供理论依据。将神经网络应用于机动决策建模具有以下优点:

(1)作战系统通常是具有多个关联输入问题的动态非线性系统，不利于数学模型的建立，利用神经网络固有的强泛化能力和近似任意复杂非线性系统的能力，不再需要建立数学模型。

(2)将收集到的数据输入到网络中，网络通过训练建立模型，找出数据隐藏的规律性；在决策过程中，采集的大量数据中往往存在较多的噪声，而神经网络算法比其他评价方法更能消除噪声干扰，获得更理想的评价结果。

麻雀搜索算法与神经网络的结合充分利用了两者的优点，使机动决策模型既具有神经网络的学习功能和鲁棒性，又具有麻雀搜索算法的优化能力，这就是麻雀搜索神经网络(ssn)。

s3.利用所述麻雀搜索神经网络的学习和预测功能对所述空战态势评估函数进行学习，得到空战机动决策模型，具体可以包括如下步骤：

s3.1确定神经网络的结构和参数。影响决策的因素指标有俯仰角态势、偏航角态势、高度态势和距离态势，将其作为神经网络的输入建立模型；

s3.2确定各个影响因素的权重：生成一组随机分布作为态势函数的权重，并确定神经网络的隐藏节点数目；

s3.3初始化麻雀搜索算法参数；麻雀搜索算法的参数对整个网络至关重要，直接影响模型的好坏；

s3.4确定态势数据集，对所述态势数据集进行归一化操作，按照一定的比例划分训练集、测试集和验证集；

s3.5利用麻雀搜索算法修改神经网络的权重。首先，根据神经网络的误差函数，确定适应度函数；其次，获取麻雀的适应度函数并将其排序进而选择出初始最优值和最差值。然后，更新发现者的位置、加入者的位置以及意识到危险的麻雀位置，最后，获得当前最优值，如果当前最优值比上一次迭代的最优值好的话就进行更新操作，否则不进行更新操作，并继续进行迭代直到满足条件为止，最终得到全局最优值和最佳适应度值。

s3.6得到一个麻雀搜索神经网络：利用麻雀搜索算法计算出的优化值作为神经网络的权值，进行多次训练，不断优化权值，直到满足预定的精度；

s3.7获得空战机动决策模型。对决策模型的输入数据集进行测试，不满足预先设定的误差要求，则继续训练；否则，模型构建完成。流程如图2所示：

本发明将麻雀搜索算法优化神经网络的权值和阈值，建立麻雀搜索算法优化的神经网络模型，将模型从收敛性、误差方面进行分析，并与粒子群算法(pso)优化的神经网络(pson)和遗传算法(ga)优化的神经网络(gan)进行对比。设置麻雀搜索算法和神经网络的参数，如附表1、附表2所示。

表1ssa参数设置

表2神经网络参数设置

神经网络的权值优化是通过麻雀搜索算法完成的，麻雀的适应度函数和神经网络的权值建立了直接的映射关系，三种算法的适应度曲线如图3所示，随着迭代次数的增加，ssa、ga、pso的适应度曲线呈下降趋势，在初始阶段ssa的适应度值相比ga、pso较优，同时迭代开始后ssa的收敛速度是远大于pso和ga算法的。

输入训练数据开始训练。误差随着迭代次数的增多而变化，权值得以更新，当误差满足预先设置的精度或达到迭代次数时，训练结束。ssn的误差曲线如图4所示，误差曲线呈下降趋势，在经过32次迭代时，误差达到最小值，最小误差约为0.0098。用同样的方法对gan和pson进行仿真得到的结果如表3所示，gan和pson的误差分别为0.065和0.042。可以验证：在相同的条件下，ssn的误差远小于gan和pson。

表3ssn、gan、pson误差

根据以上分析，麻雀算法优化的神经网络应用于指挥决策是切实可行的，可以解决实际空战机动决策的一些复杂问题。

如表4所示，首先设置空战的参数，仿真实验共分为两种策略的对抗试验：第一种策略是敌机采用gan策略，第二种策略是敌机采用pson策略，两种条件下敌机均采用本发明提出的ssn策略来进行对抗。

表4空战仿真参数设置

敌机采用gan策略：附图5是策略一两机的态势值变化情况图，我机采用ssn策略敌机采用gan策略，在初始化阶段，双方态势值相当，我机在经过7s左右的机动变换后，占据了战场态势的主动，态势值不断增加，为赢得空战奠定了优势，在20s的时候赢得了空战的胜利。

敌机采用pson策略：附图6是策略二两机的态势值变化情况图，我机采用ssn策略对抗敌机的pson策略。在起飞后的阶段，我机态势值不断增加，牢牢占据着战场的主动，敌机始终处于不利态势，经过一段时间的机动变换后，最终在17s我机赢得了空战。

前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式，并且很显然，根据上述教导，可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用，从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘庆利;乔晨昊;商佳乐;王建伟;杨国强;张振亚
技术所有人：大连大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。