一种大规模空中任务决策方法及系统与流程

文档序号:20684981发布日期:2020-05-08 18:45阅读:314来源:国知局
一种大规模空中任务决策方法及系统与流程
本申请属于飞机控制
技术领域
,特别涉及一种大规模空中任务决策方法及系统。
背景技术
:哈希表作为一种快速查询数据的数据结构,有着o(1)的查询时间,因此在强实时的决策系统中被大量应用,由于哈希表的特点,即每个决策点均需要列出哈希规则的结果,因此,在根据人类知识填写哈希规则的时候,会产生组合爆炸问题,即如果决策输入向量维数过高,每维的输入区域划分过多,根据乘法原理,其会发生庞大的解空间增长,例如输入向量维数为n维,每一维输入向量的区域划分为i1,i2,...,in,则其解空间为∏in,假如决策单元输入维度为20维,则其解空间至少是220≈106,并且无法将人的知识完全填入解空间。技术实现要素:本申请的目的是提供了一种大规模空中任务决策方法及系统,以解决或减轻
背景技术
中的至少一个问题。在一方面,本申请提供的技术方案是:一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。在本申请中,所述全区域决策规则的变量维数大于或等于所述非全区域决策规则的变量维数。在本申请一优选实施方式中,当所述全区域决策规则的变量维数大于所述非全区域决策规则的变量维数时,在所述根据所述非全区域决策规则生成全区域决策规则过程中,以所述非全区域决策规则和所述全区域决策规则相同的变量维数所对应的参数构建所述全区域决策规则,并忽略所述非全区域决策规则小于所述所述全区域决策规则的变量维数所对应的参数。在本申请一优选实施方式中,当所述全区域决策规则的变量维数等于所述非全区域决策规则的变量维数时,在所述根据所述非全区域决策规则生成全区域决策规则过程中,以所述非全区域决策规则和所述全区域决策规则相同的变量维数所对应的参数构建所述全区域决策规则。在本申请一优选实施方式中,所述哈希空间为哈希表。在另一方面,本申请提供了一种大规模空中任务决策系统,所述系统包括:知识获取模块,用于获取已知的空中任务决策知识体系;非全区域决策规则生成模块,用于根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;全区域决策规则生成模块,用于根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;决策模块,用于根据所述哈希空间中的全区域决策规则执行空中任务的决策。在本申请中,所述全区域决策规则的变量维数大于或等于所述非全区域决策规则的变量维数。在本申请一优选实施方式中,当所述全区域决策规则的变量维数大于所述非全区域决策规则的变量维数时,在所述根据所述非全区域决策规则生成全区域决策规则过程中,以所述非全区域决策规则和所述全区域决策规则相同的变量维数所对应的参数构建所述全区域决策规则,并忽略所述非全区域决策规则小于所述所述全区域决策规则的变量维数所对应的参数。在本申请一优选实施方式中,当所述全区域决策规则的变量维数等于所述非全区域决策规则的变量维数时,在所述根据所述非全区域决策规则生成全区域决策规则过程中,以所述非全区域决策规则和所述全区域决策规则相同的变量维数所对应的参数构建所述全区域决策规则。在本申请一优选实施方式中,所述哈希空间为哈希表。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。附图说明为了更清楚地说明本申请提供的技术方案,下面将对附图作简单地介绍。显而易见地,下面描述的附图仅仅是本申请的一些实施例。图1为本申请的大规模空中任务决策方法示意图。图2为本申请一实施例的任务决策示意图。图3为本申请的大规模空中任务决策系统示意图。具体实施方式为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行更加详细的描述。哈希表(也成为散列表),是根据关键码值而直接进行访问的数据结构,给定表m,存在函数f(key),对任意给定的关键字key,带入函数后若能得到包含该关键字的记录在表中的地址,则称表m为哈希(hash)表,函数f(key)为哈希(hash)函数,其主要特点是访问复杂度为o(1)。在飞机执行空中任务决策领域中,由于决策具有强实时性,因此需要保证每次决策所做的计算尽可能少,多级的逻辑判断分支会导致决策时间变长,因此通常使用哈希表进行o(1)时间的查找,即决策系统的数学抽象为s->d的一个映射,其中s是状态集合,d是决策集合,每次决策系统收到环境输入的状态向量x={x1,x2,x3…xn}时,需要输出相应的决策向量y={y1,y2,y3,……ym},使用哈希表求解此映射问题的方法是将状态向量x进行唯一性编码,例如x={高度=高,速度=快,是否有角度优势=有},则编码为:key=高&快&有,以此编码作为键值,输入哈希表,寻找相应的决策映射。但现有的基于哈希表的决策系统虽可以快速输出编码对应的决策值,但却存在以下问题:1)当输入的状态维度高,每个维度所对应的变量多的时候,哈希表的映射关系组合爆炸,例如求解20维的空战问题决策单元,在进行决策树结构依赖建模后,一般需要7万多条哈希映射规则;2)将人的知识映射到哈希表中非常困难,需要逐一填写编码对应决策输出。为此,如图1所示,本申请提出了一种大规模空中任务决策方法,包括:s1、获取已知的空中任务决策知识体系;s2、根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;s3、根据非全区域决策规则生成全区域决策规则并填入哈希空间中;s4、根据哈希空间中的全区域决策规则执行空中任务的决策。在本申请中,全区域决策规则的变量维数大于或等于非全区域决策规则的变量维数。在本申请中,当全区域决策规则的变量维数大于非全区域决策规则的变量维数时,在根据非全区域决策规则生成全区域决策规则过程中,以非全区域决策规则和全区域决策规则相同的变量维数所对应的参数构建全区域决策规则,并忽略非全区域决策规则小于全区域决策规则的变量维数所对应的参数。在本申请中,当全区域决策规则的变量维数等于非全区域决策规则的变量维数时,在根据非全区域决策规则生成全区域决策规则过程中,以非全区域决策规则和全区域决策规则相同的变量维数所对应的参数构建全区域决策规则。在本申请中,哈希空间为哈希表。例如在一实施例中,对于每个空中任务决策单元,其输入向量为n维,每维划分的区域数为a1,a2,a3,...,an,则此决策单元的输入总复杂度为a1*a2*a3*...*an。例如,输入向量的维度为{高度,速度,角度优势},区域划分数为{(高,中,低),(快,中,慢),(好,坏)},则总复杂度为3*3*2=18。但当上述实施例中的维度数和每维划分区域数很大的时候,会发生排列组合爆炸,无法实现人工的逐一填写。而本申请则是利用人类对于固定规则的不完全区域划分的特点,例如,上述实施例中有已知决策体系规则包括:1)若高度=高,速度=快,则发射导弹,2)若高度=高,速度=快或慢,角度优势=好,则发射导弹,3)若高度=低,速度=慢,则不发射导弹,此三条不完全区域决策规则可指导覆盖全部决策规则,例如对于规则1,可以自动生成全区域决策规则,包括{高度=高,速度=快,角度优势=好,则发射导弹;若高度=高,速度=快,角度优势=坏,则发射导弹}。对于规则2,可以自动生成全规则,包括{高度=高,速度=快,角度优势=好,则发射导弹;若高度=高,速度=慢,角度优势=好,则发射导弹}。因此,通过已知决策体系给出的不完全决策规则,可以生成全决策规则。从上述实施例可以看出,全区域决策规则的变量维数不小于非全域决策规则的变量维数,且当全区域决策规则的变量维数大于非全域决策规则的变量维数时,忽略了全区域决策规则大于全域决策规则的变量维数所对应的参数。例如规则1中,忽略了角度优势参数。当全区域决策规则的变量维数等于非全域决策规则的变量维数时,全区域决策规则则以非全域决策规则的变量维数所对应的参数来构建。例如规则2中,则完全以高度、速度和角度优势的非全区域决策规则来构建的全区域决策规则。若规则展开后没有覆盖全决策规则,则补充一条默认规则,即没有覆盖到的规则统一填写默认规则。在以下所示中以空战相关的变量作为方法的输入,例如:输入为{x,y,z,速度,进入角,…}的20维变量,输出为{机动指令∈(平飞,俯冲,拦射,破s,转入...),导弹发射指令∈(发射,不发射)},则会产生{(平飞,发射),(俯冲,不发射),(拦射,发射),(破s,不发射)…}等等的输出排列组合。在一个决策系统中,一般有多个决策点,如图2所示:以敌我速度态势决策节点为例,其输入为{敌方速度∈(快,中,慢),我方速度∈(快,中,慢)},输出为{敌我态势∈(很差,差,中,好,很好)},其全排列组合如表1所示:表1以上为一般的基于哈希表的推理决策结构,使用时将前两列key值进行编码即可,例如:快&快,或者,快&中,推理过程为:快&快->中,快&中->好。由于其哈希规则一共为九条,则可以通过手动填写。当某个决策节点的输入维度高,并且每一维划分区域多的时候,会出现组合爆炸的问题,无法进行手动填写,需要进行不完全规则自动填写,例如:机动选择节点:输入有三个维度,每个维度分为五个区域即:{敌我速度态势∈(很差,差,中,好,很好),敌我角度态势∈(很差,差,中,好,很好),敌我高度态势∈(很差,差,中,好,很好)};输出为:{机动指令∈(平飞,俯冲,拦射,破s,转入…)},由于推理结构基于哈希表,因此需要进行输入key值编码,根据排列组合原理,输入的维度为5*5*5=125维,输入规模较大,手动填写比较困难,根据认知总结以下规律,如表2所示:表2敌我速度态势敌我角度态势敌我高度态势输出指令好或很好*好或很好拦射好或很好或中差或很差*转入差或很差差或很差很好转入差或很差好或很好或中*破s差或很差好或很好差或很差转出中或差或很差好或很好或中好或很好俯冲***平飞表2中*代表所有区域全包括{很差,差,中,好,很好}。则根据认知表格,自动生成规则,如表3所示:表3敌我速度态势敌我角度态势敌我高度态势输出指令自动生成规则数好或很好*好或很好拦射2*5*2=20好或很好或中差或很差*转入3*2*5=30差或很差差或很差很好转入2*2*1=4差或很差好或很好或中*破s2*3*5=30差或很差好或很好差或很差转出2*2*2=8中或差或很差好或很好或中好或很好俯冲3*3*2=18***平飞5*5*5=125则从后往前,对输入进行编码,根据编码与输出写入哈希表,若编码发生碰撞,则将其输出进行覆盖替换,则可以根据认知自动生成所有规则。此外,如图3所示,本申请还提供了一种大规模空中任务决策系统,系统10包括:知识获取模块11,用于获取已知的空中任务决策知识体系;非全区域决策规则生成模块12,用于根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;全区域决策规则生成模块13,用于根据非全区域决策规则生成全区域决策规则并填入哈希空间中;决策模块14,用于根据哈希空间中的全区域决策规则执行空中任务的决策。在本申请中,全区域决策规则的变量维数大于或等于非全区域决策规则的变量维数。在本申请一优选实施方式中,当全区域决策规则的变量维数大于非全区域决策规则的变量维数时,在根据非全区域决策规则生成全区域决策规则过程中,以非全区域决策规则和全区域决策规则相同的变量维数所对应的参数构建全区域决策规则,并忽略非全区域决策规则小于全区域决策规则的变量维数所对应的参数。在本申请一优选实施方式中,当全区域决策规则的变量维数等于非全区域决策规则的变量维数时,在根据非全区域决策规则生成全区域决策规则过程中,以非全区域决策规则和全区域决策规则相同的变量维数所对应的参数构建全区域决策规则。在本申请一优选实施方式中,哈希空间为哈希表。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1