一种基于功能的装备决策行为仿真建模方法及系统

文档序号：30880295发布日期：2022-07-26 21:06阅读：245来源：国知局

1.本发明涉及决策技术领域，更具体地说，特别涉及一种基于功能的装备决策行为仿真建模方法及系统。

背景技术：

2.作战效能评估是支持战斗机装备论证、研制与使用等全寿命周期工作的重要内容，随着仿真技术的成熟和效能评估要求的提高，作战仿真已经成为战斗机作战效能评估的主要技术。战斗机作战效能仿真评估离不开高效可信的战斗机作战仿真系统的支持，飞行员的决策建模则属于战斗机作战仿真系统建设的关键一环。现有关于战斗机作战效能评估的作战仿真系统普遍缺乏有效的空战决策建模方法，大多采用反应式规则来进行脚本化建模，模拟出的空战决策行为与实际作战差别较大，可预测性强，缺乏慎思性，影响作战仿真效果的可信度，制约了作战仿真在战斗机效能评估领域作用的发挥。
3.2016年，由美国辛辛那提大学与美国空军联合研发的空战人工智能系统阿尔法(alpha ai)在模拟空战中击败了美国空军退役上校，此次事件引发了国内外广泛关注。阿尔法采用基于遗传模糊树的空战决策仿真建模方法，将决策空间的多个输入、输出变量进行模糊化或分类，基于遗传算法生成空战决策模糊推理规则，并将这些规则进行树形结构级联式连接，能有效模拟人脑实施规则型推理以贯彻上层决策意图，产生可信的行为。但是，对于某些具有明确二值含义的数据，或者具有明确语义的离散值，不便于使用隶属度函数进行模糊化。对于这种情形，很朴素的一种做法就是对模糊推理输出设计一个简单分类器，将连续值作离散化处理，分别对应原有的离散输出。不难看出，这往往就会带来较强的主观性，模型可解释性反而大打折扣。
4.当前国内外典型的空战决策行为建模方法概括起来主要有三种类型：知识工程、模糊逻辑和机器学习，其中，模糊逻辑常与启发式智能优化算法结合使用。下面主要以状态图和遗传模糊树为例对前两者进行分析。
5.空战中战斗机状态一般经历起飞、巡航、探测、接敌、交战、结束任务、返回基地几个基本阶段。战斗机接到作战命令后，起飞并以一定巡航速度沿预定航线飞行，同时开启机载雷达搜索目标。当发现来袭目标并识别后，进入接敌阶段，根据目标的位置和速度机动并占位。当达到武器发射条件后，发射武器进入交战阶段，若发现敌方来袭导弹，战斗机迅速摆脱。任务结束或者油量耗尽，飞机返回基地。
6.根据上述空战特点及状态图建模规范，战斗机作战过程可抽象为一系列状态以及这些状态之间复杂的状态转换关系。实践表明，基于状态图的空战决策行为建模，在描述空战决策行为时，具有一定的局限性，不能真正反应实际中空战作战过程，主要表现在：一是状态转移关系复杂，不易维护。未来空战为联合一体化跨域作战，所包含的武器装备众多，战术战法复杂，采用状态图对其进行描述必将导致大量的状态以及这些状态之间复杂的转移关系，不易于维护，且扩展性不好，增加一个状态往往会引起整张状态图的变动，导致大量的调试工作。二是表达能力有限，不能描述不确定性专家知识。状态图只能对确定性的专
家知识进行描述，无法描述不确定性专家经验。随着战场维度的叠加，武器装备与战术战法的革新，必然会产生更加复杂和大量不确定性的战场信息，必须对战场的不确定性信息进行描述，以真实反应实际作战过程。三是非模块化建模方法，建模难度大。状态图采用了非模块化的建模方法，条理不够清晰，增加了建模难度，且无法将建模成果有效保留，不便于模型之间进行交流和兼容，新的建模人员无法快速参与到建模工作中，导致大量不必要的工作量，降低了行为建模的效率。
7.遗传模糊树(genetic fuzzy tree,gft)的演化过程主要经历了遗传算法(genetic algorithm,ga)、模糊推理系统(fuzzy inference system,fis)、遗传模糊系统(genetic fuzzy system,gfs)、遗传级联模糊系统(genetic cascading fuzzy system,gcfs)和遗传模糊树几个过程。一方面，遗传模糊树基于模糊逻辑并采用级联树形结构，能有效表达不确定性信息，同时以模块化的结构能有效减小问题的复杂性，提高模型可读性和可理解性。模糊逻辑善于表达界限不清晰的定性知识与经验，它借助于隶属度函数概念，模拟人脑实施规则型推理，推理解决常规方法难以对付的规则型模糊信息问题。另一方面，遗传模糊树运用遗传算法，把规则集、隶属度函数相关参数编码为染色体，再利用迭代的方式进行选择、交叉和变异等运算来交换种群中染色体的信息，最终生成符合优化目标的染色体[i][ii]。然而遗传模糊树仍存在以下问题：一是没有明确区分决策推理和行为动作，导致模型混乱。实际上，决策命令输出属于飞机行为动作，产生于决策推理并影响决策，二者在决策推理过程中并无交集，而是当前决策命令生成之后，直接作用于飞机本身。在建模过程中若不加以区分，将会给模型的理解和维护带来困难。二是模糊推理系统输出连续，表达能力有限。遗传模糊树对决策变量的不同水平进行推理，去模糊化之后为连续值，作为系统的输出。但在空战决策中，存在输入输出离散的决策点，比如是否发射导弹、是否开启雷达、武器类型选择等。运用模糊推理系统进行描述时，连续输出值的离散化意义解释性差。三是模型适用于具体决策问题，兼容性和继承性差。根据已有规则建立起来的模糊决策树模型，只适用于解决具体决策问题。如果作战场景发生变化，装备发生革新，已有的决策模型无法继承，再次建模难度增大，模型扩展性不好，难以兼容其他方法，兼容性差。

技术实现要素：

[0008]
本发明的目的在于提供一种基于功能的装备决策行为仿真建模方法及系统，以克服现有技术所存在的缺陷。
[0009]
为了达到上述目的，本发明采用的技术方案如下：
[0010]
一种基于功能的装备决策行为仿真建模方法，包括以下步骤：
[0011]
s1、构建功能决策树，所述功能决策树内包括元模型根节点，所述元模型根节点包括树节点和边，所述树节点包括态势分析节点、决策节点和动作节点，所述边包括用于传输数据的数据边和用于决策控制的决策边，所述态势分析节点、决策节点、动作节点之间通过数据边和决策边关联，所述态势分析节点根据输入态势数据执行相应计算并输出数据，所述决策节点输入态势分析节点的输出数据进行内部决策并返回下一个需要决策的决策节点，所述动作节点根据决策结果执行相关动作；
[0012]
s2、执行仿真，判断节点类型，若节点类型是决策节点则执行相应决策并返回下一个决策节点，若下一个决策节点不为空则迭代，若节点类型是动作节点直接执行相应动作，
若是态势分析节点则先对所有节点进行拓扑排序再循环执行排序中每个态势分析节点得到最终输出值。
[0013]
进一步地，所述态势分析节点有0或多个输出数据边，所述动作节点有且只有一个输出决策边，所述决策节点有且只有一个输入决策边，有0或多个输出决策边，且所述决策节点接收态势分析节点输出的数据，有0或多个输入数据边。
[0014]
进一步地，所述步骤s2中对所有节点进行拓扑排序的步骤具体包括：初始化排序节点列表，获取所有有输出的节点，获取所有有输入的节点，计算所有有输出节点但没有输入的节点列表，计算所有有输入节点但没有输出的节点列表，若所有有输出节点但没有输入的节点列表不为空则返回排序节点列表，再输出排序后的排序节点列表。
[0015]
进一步地，所述功能决策树以python脚本的形式存在，所述功能决策树元模型中各个元素都映射为相应的脚本元素。
[0016]
本发明还提供一种根据上述的基于功能的装备决策行为仿真建模方法的系统，包括：
[0017]
构建模块，用于构建功能决策树，所述功能决策树内包括元模型根节点，所述元模型根节点包括树节点和边，所述树节点包括态势分析节点、决策节点和动作节点，所述边包括用于传输数据的数据边和用于决策控制的决策边，所述态势分析节点、决策节点、动作节点之间通过数据边和决策边关联，所述态势分析节点根据输入态势数据执行相应计算并输出数据，所述决策节点输入态势分析节点的输出数据进行内部决策并返回下一个需要决策的决策节点，所述动作节点根据决策结果执行相关动作；
[0018]
仿真执行模块，用于执行仿真，判断节点类型，若节点类型是决策节点则执行相应决策并返回下一个决策节点，若下一个决策节点不为空则迭代，若节点类型是动作节点直接执行相应动作，若是态势分析节点则先对所有节点进行拓扑排序再循环执行排序中每个态势分析节点得到最终输出值。
[0019]
与现有技术相比，本发明的优点在于：本发明采用功能决策树，是从功能的视角去定义行为模型，仿真应用人员不需要定义和维护大量的状态、事件等变量，能有效缓解由输入变量过多带来的状态空间组合爆炸问题，本发明采用树形分层结构去描述决策与决策之间、决策与动作之间的节点控制关系，仿真建模人员能方便地对功能决策树模型中的节点进行删除、增加、复用等操作，易于维护和扩展，功能决策树中的树节点是一类高度抽象的决策行为，可看着黑箱接收相关输入并作相应处理后得到输出，建模人员不需要关注节点内部计算，有望兼容其他诸如行为树、状态机、遗传模糊树、神经网络等典型仿真建模方法。
附图说明
[0020]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0021]
图1是本发明中的功能决策树元模型图。
[0022]
图2是本发明中的态势分析过程图。
[0023]
图3是本发明中的攻击决策过程图。
[0024]
图4是本发明中的防御决策过程图。
[0025]
图5是本发明中战斗机alpha仿真结果输出图。
[0026]
图6是本发明中单机空战仿真实验二维展示图。
具体实施方式
[0027]
下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。
[0028]
本发明的设计理念为功能决策树，功能决策树为五元组fdt＝(t,n
analysis
,n
action
,n
decision
,ξ,δ,λ)，其中，t是时间集，n
analysis
为分析节点集，n
action
为动作节点集，n
decision
为决策节点集，ξ:n
analysis
→ndecision
为数据输入函数，δ:n
decision
×nanalysis
→ndecision
为决策节点控制函数，λ:n
decision
×nanalysis
→naction
为动作输出函数。
[0029]
本发明的功能决策树设计理念主要包括以下三点：一是与目前大多数作战仿真系统所采用的基于状态和事件的描述建模方法不同，功能决策树是从功能的视角去定义行为模型，仿真应用人员不需要定义和维护大量的状态、事件等变量，能有效缓解由输入变量过多带来的状态空间组合爆炸问题。二是功能决策树采用树形分层结构去描述决策与决策之间、决策与动作之间的节点控制关系，仿真建模人员能方便地对功能决策树模型中的节点进行删除、增加、复用等操作，易于维护和扩展。三是功能决策树中的树节点是一类高度抽象的的决策行为，可看着黑箱接收相关输入并作相应处理后得到输出，建模人员不需要关注节点内部计算，有望兼容其他诸如行为树、状态机、遗传模糊树、神经网络等典型仿真建模方法。
[0030]
参阅图1所示，本实施例公开了一种基于功能的装备决策行为仿真建模方法，包括以下步骤：
[0031]
步骤s1、构建功能决策树，所述功能决策树内包括元模型根节点tree，所述元模型根节点包括树节点treenode和边edge，树节点包括态势分析节点analysisnode、决策节点decisionnode和动作节点actionnode，边包括用于传输数据的数据边dataedge和用于决策控制的决策边decisionedge，态势分析节点、决策节点、动作节点之间通过数据边和决策边关联，所述态势分析节点根据输入态势数据执行相应计算并输出数据，所述决策节点输入态势分析节点的输出数据进行内部决策并返回下一个需要决策的决策节点，所述动作节点根据决策结果执行相关动作。
[0032]
本实施例中，态势分析节点有0或多个输出数据边，所述动作节点有且只有一个输出决策边，所述决策节点有且只有一个输入决策边，有0或多个输出决策边，且所述决策节点接收态势分析节点输出的数据，有0或多个输入数据边。
[0033]
步骤s2、执行仿真，判断节点类型，若节点类型是决策节点则执行相应决策并返回下一个决策节点，若下一个决策节点不为空则迭代，若节点类型是动作节点直接执行相应动作，该执行仿真算法如下表1。
[0034]
表1
[0035][0036][0037]
若是态势分析节点，树中每个态势分析节点都通过处理输出产生输出，并将其传向其他节点，该输入输出关系采用前向反馈的思想。先对所有节点进行拓扑排序再循环执行排序中每个态势分析节点得到最终输出值，如表2所示。
[0038]
表2
[0039][0040]
本实施例中，功能决策树以python脚本的形式存在，所述功能决策树元模型中各个元素都映射为相应的脚本元素。树节点为抽象节点，被态势分析节点analysisnode、决策节点decisionnode和动作节点actionnode所继承。具体的：
[0041]
(1)态势分析节点，态势分析节点，输入作战态势数据，执行相应计算，对数据进行预处理，输出给决策节点进行决策所需要的数据。主要包括三类作战态势数据：一是目标状态信息，如目标距离、目标速度；二是飞机本身性能参数，如剩余燃油、剩余导弹；三是作战
态势数据，如是否被敌方雷达锁定、导弹告警等等。analysisnode通过compute(input_par，output_par)成员函数进行计算，所有子节点需要重写该函数，执行相应计算。一般不执行任何计算的态势数据也可直接将其输入到决策节点中。
[0042]
(2)决策节点，决策节点实质上是一个控制节点，包括一个输入边和多个输出边，输入分析节点得到的数据，进行内部决策，在多个输出边中选择一条，返回下一个需要决策的节点。在整个单机空战过程中，每一个需要决策的环节一般都需抽象成为一个决策节点，如作战决策、进攻、防御、航路飞行、返航、武器选择、武器发射等。decisionnode通过make_decision(input_par)函数，由用户实现内部决策逻辑，输出下一个需要决策的决策节点。
[0043]
(3)动作节点，动作节点一般作为叶节点出现，所有动作节点应该继承自actionnode类，并且重写do_action(input_par)函数，执行相关动作。例如，返航、航路飞行、发射中远距空空导弹、发射近距空空导弹、自动规避导弹、发射箔条、发射曳光弹等等。
[0044]
下面通过具体案例对本发明作进一步描述。
[0045]
案例基于武器装备效能仿真系统(weapon effectiveness simulation system,wess)，该系统支持装备作战仿真应用的开发、运行和分析，包括装备数据管理、想定编辑、决策建模、仿真实验设计、蒙特卡洛仿真运行、仿真实验管理、仿真数据采集、二维/三维分布式表现、记录回放等。本实施例以单机空战为例，重点关注决策建模环节。
[0046]
单机空战仿真实验想定，红蓝双方配系相同，各装配中远距空空导弹4枚、机载火控雷达一部。唯一不同的是红方战斗机(fighter)使用默认基于状态图的决策行为脚本(cmaeroobject.py)，而蓝方飞机(alpha)使用本文基于功能决策树的决策行为脚本(cmalpha.py)。双方起飞后沿着各自预定航路飞行，航线中途产生交汇，当有一方进入另一方探测范围，识别成功后开始交战。当任何一方被击毁或到达最后一个航路点则任务完成，仿真结束。
[0047]
基于功能决策树的空战决策行为模型如图2-图4所示，主要分为态势分析、攻击决策、防御决策三个部分。
[0048]
(1)态势分析。态势感知部分应用分析节点，主要表示目标状态信息、飞机自身性能参数以及实时作战态势等信息，最终交汇于态势决策节点(statusdecision)。目标状态信息包括目标距离(targetdistance)和目标速度(targetvelocity)；飞机自身性能参数包括剩余燃油(remainingfuel)和剩余导弹(remainingmissles)；作战态势包括是否被雷达锁定(islockbyradar)和是否导弹告警(missilewarning)。
[0049]
(2)攻击决策。攻击决策主要包括超视距作战(bvr)和近距作战(cac)。超视距作战包括跟踪(autotrace)、和锁定(lockon)和发射中原距空空导弹(launchfaraam)；近距作战包括追击(autochase)和发射近距空空导弹(launchnearaam)。
[0050]
(3)防御决策。防御决策主要包括主动防御(activedefense)和被动防御两种(passivedefense)类型。主动防御包括摆脱锁定(autobreaklock)和开启电子干扰措施(openecm)；被动防御包括规避导弹(autoavoidmissile)、抛洒箔条(lauchchaff)和发射曳光弹(launchflare)。
[0051]
仿真运行结束后蓝方战斗机alpha仿真运行输出如图5所示。alpha在1278时刻首次捕获目标，在1448时刻将该目标识别为飞机，此时红蓝双方距离约130公里。随后，alpha根据实时感知的态势数据扫描决策行为模型，进行一轮决策，执行决策节点，决策顺序为态
势决策、进攻和超视距作战，并沿11点钟方向发射一枚中远距空空导弹。在1658时刻，红方飞机fighter被蓝方飞机alpha发射的第四枚中远距空空导弹击毁。
[0052]
仿真二维展示如图6所示，可以明显看出红蓝双方已创建的作战实体，在1449时刻，蓝方飞机alpha下达发射武器指令，发射第一枚中远距空空导弹，攻击红方飞机fighter。
[0053]
鉴于空战决策行为的复杂性和不确定性，传统基于状态图的确定性行为建模方法难以真实反映真实的战斗机决策行为。遗传模糊树运用模糊逻辑处理空战中不确定性的模糊数据，所建立的模型层次性较好，易于扩展和维护，并运用遗传算法对作战行为规则和隶属度函数进行优化，取得了较好的效果。但是对于一些具有明确离散语义的变量，特别是“是/否”型二值变量，如果还是套用遗传模糊树进行模糊处理，显得过于累赘而且会影响战斗机行为的决策质量。在研究遗传模糊树的基础上，本发明提出基于功能决策树的空战决策行为建模方法，从功能的视角去看待每一个决策，决策建模人员只需明确每一个决策的输入和输出，不需关注内部决策逻辑，能够兼具多种仿真建模方法的特点。下一步工作重点集成神经网络、支持向量机等机器学习智能算法，进一步验证功能决策树在空战决策行为建模领域的有效性和通用性。
[0054]
本发明还提供一种根据上述的基于功能的装备决策行为仿真建模方法的系统，包括：构建模块，用于构建功能决策树，所述功能决策树内包括元模型根节点，所述元模型根节点包括树节点和边，所述树节点包括态势分析节点、决策节点和动作节点，所述边包括用于传输数据的数据边和用于决策控制的决策边，所述态势分析节点、决策节点、动作节点之间通过数据边和决策边关联，所述态势分析节点根据输入态势数据执行相应计算并输出数据，所述决策节点输入态势分析节点的输出数据进行内部决策并返回下一个需要决策的决策节点，所述动作节点根据决策结果执行相关动作；仿真执行模块，用于执行仿真，判断节点类型，若节点类型是决策节点则执行相应决策并返回下一个决策节点，若下一个决策节点不为空则迭代，若节点类型是动作节点直接执行相应动作，若是态势分析节点则先对所有节点进行拓扑排序再循环执行排序中每个态势分析节点得到最终输出值。
[0055]
虽然结合附图描述了本发明的实施方式，但是专利所有者可以在所附权利要求的范围之内做出各种变形或修改，只要不超过本发明的权利要求所描述的保护范围，都应当在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱智吴一非雷永林王涛李群朱一凡
技术所有人：中国人民解放军国防科技大学
我是此专利的发明人

上一篇：一种巷道小型电缆自动敷设装置的制作方法
上一篇：热管理控制方法、系统及行车电脑、车辆和存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。