基于多层次模糊分支结构动态优化的飞行员决策推演方法

文档序号:31447608发布日期:2022-09-07 12:18阅读:80来源:国知局
基于多层次模糊分支结构动态优化的飞行员决策推演方法

1.本发明涉及人机系统中控制决策的推演技术领域,尤其是涉及一种基于多层次模糊分支结构动态优化的飞行员决策推演方法。


背景技术:

2.在人机系统的决策推演过程中,存在着诸多影响飞行员决策的因素,如决策模式的不同层级复合、飞行员的认知能力水平、交互界面的布局设计等。在由逻辑结构决定的飞行员决策推演过程中,其涉及到的人为因素将在不同的层级中影响飞行员的决策。因此,设计有效的决策逻辑推演结构从而表达飞行员在时序过程的决策推演对于分析人机系统的决策极为重要,为了合理的表达飞行员在追踪目标执行决策过程中的推演过程,并考虑其自身的人为特性,设计客观高效和具备普适性应用的决策框架,并基于飞行员决策特点进行逻辑结构的设计。
3.目前主流表达飞行员决策过程的方法有:
4.1)在实验系统或真实飞行测试中通过各类传感器获取飞行员的生理指标及行为动作,如心率、眼动、脑电、肌电、手势操作,完成采集数据后建立模型;
5.2)将控制器的设计迁移到飞行员模型中,从而将飞行员视作一个完成飞行动作的实时控制器,对该控制器满足稳定性以及鲁棒性的条件下求解建立模型;
6.3)设计定性模型的方法如感知决策执行的三层静态式结构将飞行员的决策过程进行表达,从而分析飞行员的决策过程。
7.随着人机系统技术与信息的进步,对飞行器的设计思路逐渐趋同于以飞行员为中心,从飞行员的决策模式出发,设计适配飞行员决策过程的飞行器驾驶舱。目前上述三种飞行员决策模型方法均不能充分反映飞行员的决策推理逻辑与推演过程:在方法1)中获得的生理指标及行为动作在机械化系统及半自动化系统中虽然具有一定的参考价值,但无法准确描述规则判断与动态优化的复杂因果效应;在方法2)中通过设计控制器方法建立的飞行员决策模型存在不可避免的静态性和滞后性;在方法3)中,通过建立定量模型感知决策执行结构的方法,将飞行员对外部状态的感知、对目标的认知决策、以及飞行员的决策动作加入到模型中,而忽略了飞行员决策中层级之间的内在关联,并且上述这些方法的假设条件均基于飞行员是一个标准化的机器人模型,而较少从飞行员的人为因素角度考虑其决策过程,难以在实际的人机系统中应用,因此,就本发明涉及的飞行员逻辑判断的决策推演过程而言,上述方法中运用到的假设不够合理。


技术实现要素:

8.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多层次模糊分支结构动态优化的飞行员决策推演方法。
9.本发明的目的可以通过以下技术方案来实现:
10.一种基于多层次模糊分支结构动态优化的飞行员决策推演方法,包括以下步骤:
11.1)根据人机系统中基本组成结构,量化表达决策状态集合;
12.2)根据飞行员决策推演的判断层次,量化表达多层级的模糊规则集合;
13.3)针对不同决策层级分别设计自终止序列搜索因子、长短期记忆因子、迟滞因子、飞行员技能水平稳定因子、状态转移因子、转移时间,考虑人机系统的可观测状态数据和能控制输入决策,构建形式化表达多层次的分支结构关系,实现决策推演的单步实例化机制;
14.4)进行层次化模糊规则的动态优化,即通过连续动态迭代实现决策推演机制,对单步实例化决策其潜在模糊规则的调整机制;
15.5)基于决策状态集合和多层级的模糊规则集合,通过迭代的决策推演与规则优化机制,导出飞行员的决策推演序列结果。
16.所述的步骤1)中,对于量化表达决策状态集合,通过各层级的抽象化表示,量化决策状态集合中的元数据用以进行决策推演机制中的实例构建。
17.所述的决策推演机制中的实例构建具体包括:
18.建立人机系统中航路目标对应的抽象状态元素;
19.建立人机系统中可观测仪表对应的抽象状态元素;
20.建立人机系统中飞行员技能水平对应的抽象状态元素;
21.建立人机系统操纵设备对应的抽象状态元素;
22.量化决策状态集合是多层次的分支结构进行迭代决策推演的基础元数据。
23.所述的步骤2)中,对于量化表达多层级的模糊规则集合,不同层级的模糊决策逻辑规则的量化通过设计航路目标的分类器、可观测仪表的调度器、飞行员技能水平稳定因子的判断器、操纵设备的调度器以及控制方法特性的判断器实现。
24.所述的步骤2)具体包括以下步骤:
25.21)根据航路目标的轨迹要素以及当前飞行器系统的飞行状态元素,建立用于切换目标的模糊判断边界集合;
26.22)根据可观测仪表的选择集合以及对仪表序列的历史选择状态,建立仪表的选择序列;
27.23)根据技能水平稳定因子的变化率,建立飞行员切换技能水平的模糊边界集合;
28.24)根据操纵设备提供的能控状态要素以及对操纵设备的历史选择状态,建立对操纵设备选取的模糊调度集合;
29.25)根据控制方法的状态元素以及当前人机系统中直接关联的飞行状态元素,建立飞行员依据目标切换控制方法的模糊边界集合;
30.26)所有上述不同层级内涵盖的模糊规则元素将作为决策推演机制中的规则集合参与到迭代的动态调整中。
31.所述的步骤3)中,决策层级包括目标决策层、可观测仪表决策层、能力水平特性层、操纵设备决策层和状态判断决策层。
32.所述的步骤3)中,通过多层次的复合模糊推理器考虑自终止序列搜素因子、迟滞因子、长短期记忆因子后与状态判断层的转移概率、转移时间相关联,从而实现量化后的规则逻辑器能够应用于飞行员的决策推演,得到有效的负荷认知决策的操控量,具体包括以下步骤:
33.31)根据当前决策时刻人机系统输出的数据状态,测算当前目标与状态之间的代
价函数,根据目标决策层的模糊规则集完成目标层的决策规划;
34.32)引入自终止序列搜素因子,用于测评在选择仪表时带来的时间代价,依据仪表方位测算耗费的时间与最终搜索的仪表状态量,完成仪表选择层的决策规划;
35.33)根据技能水平特性,设计飞行员关于不同飞行任务的能力水平因子分级,向该层的逻辑判断器提供输入;
36.34)根据操纵设备的历史序列,设计长短期记忆的飞行员权重因子,根据操纵设备选择层的模糊决策规则,输出飞行员在该决策层的选择操纵设备,从而决定飞行员对人机系统的决策输入量;
37.35)基于目标层、仪表选择层、技能水平特性层和操纵设备选择层,将得到的可观测状态量和能控决策量,根据状态转移时间和状态转移概率,最终完成决策状态量的一次有效估计。
38.所述的步骤4)中,层次化模糊规则的动态优化通过设计代价函数和反馈回路,将不同层级的模糊推理器所输出结果结合人机系统状态与代价指标相比较,从而完成优化,具体包括以下步骤:
39.41)飞行目标层逻辑判断器的动态优化:通过将期望目标同逻辑判断器的阈值结合,引入飞行可观状态获取的信息从而调整规则集中元素的边界范围;
40.42)仪表选择层逻辑调度器的动态优化:通过比较对本次决策过程中计划搜索仪表元素数同历史记忆的仪表搜索元素数,规避非必要的仪表元素,从而优化本层中影响逻辑调度的自终至序列搜索因子;
41.43)能力水平层逻辑判断器的动态优化:考虑当前人机系统的状态瞬时变化对飞行员技能水平稳定因子的影响,从而调整判断规则集中同状态相关联的边界;
42.44)操纵设备层逻辑调度器的动态优化:作为人机系统中飞行员对能控决策输入量的优化调节,根据飞行员技能水平因子的变化,并考虑长短期记忆因子的权重变化,模拟实现飞行员根据飞行状态和个人技能水平对可操纵设备的选择;
43.45)对状态决策层逻辑推理器的综合优化:通过结合复合层级逻辑推理的时滞因素,通过状态的梯度变化,优化当前目标的代价方程,同期望的最小值相比较,优化当前决策状态的转移时间迟滞因子和转移概率。
44.所述的步骤5)中,对于决策推演序列,以揭示飞行员认知决策推演方法中的元素关联为基础,构建递推式适应调整的飞行员决策推演机制,并通过闭环的反馈机制优化飞行员认知决策依赖的模糊判断规则集合。
45.所述的步骤5)具体包括:
46.51)建立多种飞行员认知决策机制中多个因素的关联与潜在的关联;
47.52)全面反映飞行员决策推演过程中的决策层次化特点以及实际任务场景下的认知逻辑结构;
48.53)通过迭代的计算方式,更新多个内在的状态变量,从而得到稳定的决策输出;
49.54)同步更新的分层级的模糊规则综合了飞行员认识决策推演中涉及到迟滞因子、转移因子、飞行员技能水平因子等变量因素,基于该规则集合的动态适应,从而保证人机系统在决策推演中的稳定性。
50.与现有技术相比,本发明具有以下优点:
51.一、本发明克服了现有技术中飞行员模型固定化,人为参数静态化的缺点,优化了飞行员决策推演的鲁棒性。
52.二、本发明通过设计不同决策层级与其规则的适应变化,引入了人类关于认知机制和决策特性的逻辑思维模式,提高了飞行员决策推演的准确性。
53.三、本发明在不同决策层中引入衡量飞行员决策因素相关的自终止序列搜索因子、迟滞因子、长短期记忆因子、飞行员技能水平稳定因子,避免了现有决策技术中所考虑因素的不充分性。
54.四、本发明以构建多层次的模糊分支决策结构为核心,考虑人机系统中飞行员的可观测状态量和能控制决策量,并设计状态转移概率、转移时间的马尔科夫动态优化机制,从而完善飞行员决策推演的过程。
附图说明
55.图1为本发明的流程示意图。
56.图2为决策推演结构中不同决策层的状态与规则量化示意图。
57.图3为在一次静态决策推演中不同决策层级间的逻辑关联与详细运行示意图。
58.图4为决策推演过程中对逻辑结构层的动态优化示意图。
具体实施方式
59.下面结合附图和具体实施例对本发明进行详细说明。
60.实施例
61.如图1所示,本发明提供一种基于多层次模糊分支结构动态优化的飞行员决策推演方法,包括以下内容:
62.(1)在本实施例中,飞行器与驾驶员的人机系统数据将在运行的过程中装载入飞行员的决策推演过程中;
63.(2)人机系统数据中包含有飞机运行状态数据:高度、速度、垂直速度、姿态角、方位、迎角与侧滑角;驾驶舱仪表数据:可读参数的仪表以pfd,nd为例;可控设备驾驶杆、脚蹬和油门杆等;飞行员状态数据:飞行员控制量;上述数据是本发明展开决策推演序列生成的依据,在本发明中,人机系统具体指可被飞行员操纵的飞行器;
64.(3)不同逻辑结构的层级数据包括量化动作与状态集合、量化规则集合,并且该结构层数据在整个递推式的飞行员决策推演过程中将保持动态更新状态;
65.(4)量化动作与状态集合包括:与飞行员动作集合相关的元素,对飞行目标状态的判断元素分类,对可读仪表的元素划分,对飞行员可控设备的元素抽象化;量化规则集合中包括不同层级中可判断的目标分类;为使技术人员对通道量化过程有更全面的了解,相关细节在图2中进行说明;
66.(5)在决策推演过程中,目标层、仪表层、设备层、技能水平层、方法特性层共同组成飞行员决策推演的完整逻辑推演结构。这些不同决策层级之间的逻辑关系为顺序关联关系,在每一层完成决策判断后,传递结果给下一个决策层级使用;
67.(6)自终止序列搜索因子、迟滞因子、长短期记忆因子、飞行员技能水平稳定因子分别在不同的决策层级中起到作用,同时,通过递推的决策推演过程中所保存的不同决策
层得到的结果,层级优化机制优化转移概率和转移时间,从而调整决策结构中的参数因子。
68.(7)递推方式具体指依据时序,以多层次飞行员决策逻辑结构为模型,通过规则参数的动态优化,得到决策推演序列的输出,为使技术人员对本发明的工作负荷及自动化水平测评机制有更全面的了解,相关细节在图3和图4中进行说明。
69.如图2所示,飞行员状态和规则的量化的主要步骤为:
70.(1)建立影响飞行员决策推演的层次,可分为两步进行,其中,第一步量化决策层级的输入与输出元素;第二步相应的决策层级内判断过程的量化;
71.(2)飞行员从仪表中获取的信息包括视觉观测到的飞机仪表信息、视景信息、听觉信息、体感信息(重力感知、加速度感知等)等,其中视觉信息与飞行员的控制行为直接相关,需要飞行员主动分配一定的注意力资源进行观测,其余的信息则可以通过被动获取,起补偿的作用,仪表层中从仪表上可搜索得到的状态量为飞行的高度、速度、姿态角、航向、经纬度;
72.(3)按对飞行员操作影响的重要程度从高到低分为直接影响、间接影响和影响较弱三类。直接影响:速度、位置、姿态角;间接影响:加速度,角速度等;影响较弱:燃油表、温度计、辅助系统状态指示等;
73.(4)量化飞行员可观测的仪表集合为{st1,st2,...,stn};其中,定义不同仪表中所涉及的飞行直接相关的参数不同,
74.(5)在设备层中,对飞行员可允许操纵的设备分为操纵杆、脚蹬、油门、其他设备和单独的空操纵这五类;
75.(6)量化设备层中的模糊选择规则时,飞行员将把目标判断结果以及仪表层得到的可观测状态量作为模糊规则的输入变量;将飞行员最终在设备操纵层选择的可控设备作为该层的量化输出结果;
76.(7)在技能水平层中,考虑飞行员对前述操纵带来的偏差和操纵目标的比值计入飞行员的操纵偏差的变化情况;
77.(8)技能水平层中的量化输入为目标层的判断输出,量化的输出结果为不同等级的能力水平稳定因子;
78.(9)方法特性层中将飞行员决策推演由于目标偏差带来的控制比例作为干扰飞行员的控制变量;量化飞行员对确定类型的控制量的输入比例;
79.(10)在方法特性层中,将前述输出的设备选择结果、技能水平稳定因子以及目标层的判断输出作为该层的量化输入元素;将所得到的控制比例作为该层的量化输出结果;
80.如图3所示,一次可视为独立的飞行员决策推演过程的静态实例主要步骤为:
81.(1)视觉信息的获取在整个飞行过程中的模型并不是固定的,在飞机的起飞和降落过程,由于飞机状态变化较快,飞行精度的要求较高,飞行员必须时刻密切关注高度、速度、方向角这几个与飞行绩效直接相关的信息,并且这个过程中飞行员的有效信息获取频率是最高的;而在定高巡航等飞机状态比较稳定的过程中,飞行员可以以较低的频率进行信息获取,并且可以分散部分注意力观测如燃油表,温度表等次要仪表信息,所以飞行员模型的视觉信息获取部分是与当前的飞行任务直接相关的;
82.(2)引入自终止序列搜索因子将飞行员对多个相同仪表进行扫视过程的耗时可
以近似用一个线性方程计算:其中,st是总搜索时间,即获取仪表信息的总耗时;a
p
是固有时间常数,包括转头时间,注意力转移时间等;bi是第i个仪表的搜索与驻留的时间常数;n是仪表个数;
83.(3)每次搜索决策结束后得到自终止序列搜索因子和搜索得到的状态量将作为历史信息h保存;
84.(4)定义飞行员搜索时对不同仪表中的选择概率,p={p1,p2,...,pn},同时引入长短期记忆因子l,将历史的设备选择概率调整为
85.(5)从选择的不同仪表设备中,得到飞行员选择的可观测状态量u1={x1,x2,...,xm}=∑pi'sti;
86.(6)定义目标决策层的输出状态元素为接近、远离、附近三个类别;定义这三类状态元素相关的目标决策层的输入变量集合{x1,x2,...,xm};计算此时可观测状态元素同目标飞行点状态元素的偏差,δ=∑||x
i-yi||2;并将该偏差值作为目标层的输入变量;
87.(7)根据目标决策的规则定义目标层输入和输出变量的隶属度函数其中,c为均值,σ为标准差;
88.(8)根据隶属度函数可输出目标决策层的模糊判断结果u1;
89.(9)在目标决策层中,将当前状态同期望目标点的状态比值定义为决策因子ss=∑||x-y||/∑||y||;
90.(10)设备层的选择同样依赖于长短期记忆因子,定义飞行员对设备的选择将依赖于前述时刻中设备的使用频率,有
91.(11)其中q={q1,q2,...,qm}定义为不同设备的选择概率,m为设备决策层的设备数量;在设备层中,定义每个设备对应一个操纵量;
92.(12)依据概率qi的大小挑选,得到当前设备决策层的输出结果u2;
93.(13)在技能水平层中,引入的技能水平稳定因子对飞行员决策推演过程的由于稳定性带来的偏差动态赋予权重;
94.(14)定义输入变量能力稳定因子输出变量为决策中偏差的分布均值ω,限制均值的幅度在[ω
min

max
]之间;定义技能水平层中的模糊规则的判断隶属度函数为s型隶属函数其中,a为斜率,c为函数的拐点;
[0095]
(15)根据隶属度函数可拟合输出技能水平层的判断结果u3;
[0096]
(16)在方法特性层中,前述计算得到的目标因子作为输入变量,前述所得的飞行员的能力稳定水平因子(图2的技能水平动态稳定因子)作为隶属度函数中的参数中值c,a和b分别是该规则判断函数的上下稳定阈值边界;
[0097]
(17)定义该层中飞行员根据方法特性层的规则定义隶属度函数
[0098]
(18)根据隶属度函数可拟合求解x,得到方法特性层的判断结果u4;
[0099]
(19)综合前述的得到的u
t
={u1,u2,u3,u4},得到在飞行员能力水平影响下、当前飞行员可观测状态下、飞行员选取的可控输入量下,得到的决策推演控制结果δ;
[0100]
(20)飞行员在获取飞机仪表信息或视窗信息的过程中存在着人因时延,飞行员观测每个飞机仪表并获得信息是需要一定时间的,这部分用自终止序列搜索因子表达;同时,决策推演过程中的设备操纵中,引入迟滞因子表达飞行员对设备的操纵时间;
[0101]
(21)将得到的控制量和总时滞量输入飞行器仿真系统中,得到对应的飞行器系统状态响应;
[0102]
(22)检测飞行的目标是否在设定的航域内以及是否发生目标切换;
[0103]
(23)检查当前飞行目标的占比是否达到了要求,并得到代价因子提供给技能水平层;
[0104]
(24)飞行员的动态决策推演可不依赖于飞行员主观的工作负荷与操纵绩效直接相关的假设,而是根据不同决策层级中的推理结构关系从而得到飞行员最终向飞行器输入的决策控制量,即图3所列的各类因子及相关变量之间的决策逻辑关系。
[0105]
如图4所示,飞行员动态决策推演与模糊分支结构适应性优化的步骤如下:
[0106]
(1)多层次模糊分支结构动态优化的飞行员决策推演中结构的动态优化主要考虑到飞行中人机系统状态的时变因素对飞行员决策的影响;
[0107]
(2)在图4中,模糊分支结构的动态优化是指飞行员的多层级逻辑决策结构会随着在时序的递推过程对决策结构中的所涉及到图3中的因子变量进行调整;
[0108]
(3)其中,子目标的判断即计算代价函数通过未来状态代价的转移预测并考虑历史的决策代价函数,通过优化,完成一次结构的动态优化;
[0109]
(4)计算完成当前决策动作后的本次飞行员决策代价函数w=∑||x-y||2;
[0110]
(5)考虑长短期记忆因子l,计算从决策开始到当前t时刻的累积代价函数
[0111]
(6)根据决策层中不同层级归一化后的权重比例,在求解决策参数的梯度优化方向
[0112]
(7)在决策历史片段内,将过去的代价同未来可能的代价进行综合,由极大极小值算法求解当前可得到的规则参数其中函数l(
·
)表示在当前梯度的参数优化下未来的决策代价,α代表历史和未来奖励的不同考虑权重;
[0113]
(8)对仪表选择层和设备决策层,适应规则参数的优化与可读参数仪表和可控参数的设备的历史选择信息有关;分别考虑仪表和设备的选择概率p,q,其概率的选择变化为这里符号代表历史信息同当前状态之间满足最大最
小功能覆盖的原则;
[0114]
(9)根据公式所得规则参数,飞行员决策模型在下一次决策时将采用更新后的规则参数、权重系数;
[0115]
(10)所构建的多层次动态优化的模糊规则模型建立了各决策层级间飞行员判断对其前述决策的直接或间接依赖关系,各级决策判断的观测模型具有多个测量指标,且所引入的相应层级间的因子变量对于非完备的考虑人为因素的结构模型,由于测量误差的存在,其相关系数以预定的比例变化,具备一定的适用性与实用性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1