一种飞行数据知识获取系统及其获取方法

文档序号:6604656阅读:178来源:国知局
专利名称:一种飞行数据知识获取系统及其获取方法
技术领域
本发明属于飞参数据处理领域,具体涉及一种飞行数据知识获取系统及其获取方 法。
背景技术
飞行数据是飞机从起飞到降落过程中由飞行数据记录设备所记录下来的一系列 与飞机性能和状态相关的飞行参数,对飞行动作识别、设备性能趋势分析和飞行事故鉴定 具有重要的作用。目前利用飞行数据进行故障诊断和趋势预测,实现飞机的视情维修是一个重要的 研究方向,这两个功能的实现是以强大的知识库为基础的,知识库是构建飞行数据专家系 统的重要基础。因此,知识库中知识的获取问题成为飞行数据专家系统的瓶颈问题。按知识获取的自动化程度,可以将知识获取分为半自动知识获取和自动知识获取 两种方式。在半自动的知识获取方式中,知识获取分两步进行知识工程师首先从相应知识 源获取知识,然后通过知识编辑软件将知识输入到知识库中。这种方式主要是人工输入,同 时非常依赖于专家经验,因此如果能找到一种方法实现知识的自动获取,将在很大程度上 提高专家系统的智能性,更能发挥出专家系统的专家优势。自动知识获取是一种理想的知识获取方式,指系统自身具有获取知识的能力,不 仅可以直接从知识源“学习”相关的基础知识,而且还能从系统自身的运行实践中总结、归 纳出新知识,不断完善自身知识库。尽管目前尚不能实现知识的完全自动获取,但长期以 来,知识获取研究工作集中于提高知识获取过程的自动化程度,减轻知识工程师的负担,已 经取得了长足进展。目前关于自动知识获取的方法主要有基于神经网络、免疫算法、遗传算法和粗糙 集方法。神经网络具备大规模并行分布处理能力、非线性处理能力、高度的鲁棒性和学习联 想能力,但主要面临的问题是确定网络的结构、降低网络学习的复杂性和提高网络的泛化 能力。免疫算法是模拟生物规律的算法,它试图寻求最优解,因此算法的运行时间较长、效 率不高,并且对于大量的连续属性的模糊信息系统在使用过程中效果不会很好。遗传算法 在求解过程中必须选取适当的交叉概率和变异概率,否则会造成算法不稳定或收敛问题; 粗糙集理论作为一种分析和处理不精确、不一致、不完整信息和知识的数学工具,它能从大 量的数据中推导出具有指导意义的诊断规则,分析发现有用的规律信息。经研究发现,数据挖掘中的关联规则方法具有强大的知识获取能力,它能挖掘出 数据之间的不易发现的联系,把这种联系表示成规则,形成知识,最后把大量的知识形成知 识库,为专家系统进行故障诊断和趋势预测提供强大的知识依据。关联规则通过对给定数 据集中各项之间的频繁项(经常发生的事件)进行分析,找到有意义的知识,这种方法可以 对各种类型的数据进行处理,并且可以处理单维和多维空间的大量数据,适合对飞行数据 进行处理。目前国内外已经初步开展利用关联规则进行飞参数据的知识获取方法研究,但都是针对单维数据进行的处理,而且没有形成相应的系统。

发明内容
本发明的目的是提出一种飞行数据知识获取系统及其方法,该系统可以根据飞行 数据的特点,同时不依赖于专家经验,不需考虑数据类型的不一致性的特点,可以对数值型 数据、区间型数据、字符型数据进行处理,分析飞行数据中隐含的有用信息,形成知识,为开 展故障诊断和趋势预测提供知识库。本发明适合解决单维和多维飞行数据的知识获取问 题,同时也可以应用于其它类型的知识获取平台,另外根据关联规则方法的特点,该系统可 以对大数据量的飞行数据集提供快速的处理能力。本发明一种飞行数据知识获取系统,由用户参与,主要包括飞行数据获取模块、飞 行数据库模块、模式选择模块、数据准备模块、数据显示模块、任务执行模块、规则输出模 块、规则处理模块、知识获取模块和知识库模块。飞行数据获取模块获取飞行数据,将获取的飞行数据发送给飞行数据库模块;飞 行数据库模块将得到的飞行数据存储到数据库表中;数据准备模块对飞行数据库模块中数 据库表中记录的飞行数据进行数据处理,使处理后的数据能够用于关联规则挖掘,并将处 理后的数据作为数据源提供给数据显示模块和任务执行模块;数据准备模块针对单维飞行 数据采用字符标记处理,针对多维飞行数据,根据飞行数据的数值区间进行数据分层,采用 字符标号对每一层的数据区间进行标识,在进行数据分层前对飞行数据的数值异常点按前 后均值方法进行处理;数据显示模块将接收的飞行数据显示给用户;用户通过模式选择模块选择知识获取模式选择进行单维飞行数据的知识获取或 者选择进行多维飞行数据的知识获取,模式选择模块将选择好的知识获取模式通知给任务 执行模块;任务执行模块根据知识获取模式,对数据准备模块处理后的飞行数据开展规则获 取工作,获取隐含在飞行数据中的有用信息,并形成规则,提供给规则输出模块;规则输出模块将获取的规则显示给用户,并将获取的规则提供给规则处理模块; 规则处理模块对规则输出模块提供的规则进行处理,主要包括对冗余规则的处理和进行规 则的合并,并将该规则作为知识提供给知识获取模块;知识获取模块将接收的知识,显示给用户,同时将知识提供给知识库模块;知识库 模块将知识获取模块提供的知识按照存储到数据库中。所述任务执行模块采用Apriori算法处理单维飞行数据,采用Mulit-Rule方法处 理多维飞行数据,其中,Multi-Rule方法是本发明基于Apriori算法提出的一种进行多维 关联规则挖掘的方法。本发明的基于飞行数据知识获取系统的一种飞行数据知识获取方法,包括以下步 骤步骤一、获取飞行数据飞行数据获取模块通过飞行参数记录仪的数据读取软件 获取飞行数据,或者通过飞行数据文件获取飞行数据,飞行数据获取模块将获取的飞行数 据存储到飞行数据库模块中;步骤二、选择知识获取模式用户根据实际的需求,通过模式选择模块来选择需要 进行知识获取模式,选择进行单维飞行数据的知识获取或者选择进行多维飞行数据的知识获取,模式选择模块将选择的知识获取模式传递给任务执行模块;
步骤三、数据准备数据准备模块对飞行数据库模块中的数据进行处理,主要包括 消除噪声、类型转换和数据分层工作,使飞行数据库模块中的数据成为关联规则挖掘能用 的数据,数据准备模块将处理后的数据传递给任务执行模块; 步骤四、关联规则挖掘任务执行模块根据步骤二用户选择的知识获取模式,对步 骤三处理后的数据,通过关联规则挖掘获取隐含在飞行数据中的有用信息,并将这些信息 形成规则;步骤五、规则输出规则输出模块将步骤四形成的规则提供给规则处理模块,同时 将规则通过人机界面显示给用户;步骤六、规则处理规则处理模块对规则输出模块提供的规则进行处理,处理后的 规则作为知识提供给知识获取模块;步骤七、知识获取知识获取模块接收步骤六的知识,将该知识存储到知识库模 块,并显示给用户。本发明的优点与积极效果在于(1)不但适用于单维飞行数据的知识获取,在多维数据知识获取方面同样具有优 势;(2)进行知识获取时,可以同时处理多种类型(如数值型、区间型)的数据,无须考 虑数据类型不一致的问题;(3)利用关联规则方法进行知识的获取工作,该方法对大数据量的飞行数据集提 供快速的处理能力;(4)可以对得到的规则进行处理,消除冗余规则并对相互包含的规则进行合并,使 知识库的维护难度降低;(5)利用关联规则方法研制的知识获取系统,可以实现知识自动获取的过程,减少 人工输入和对专家经验的依赖。


图1是本发明基于关联规则方法的飞行数据知识获取系统结构图;图2是本发明基于关联规则方法的飞行数据知识获取基本流程图;图3是本发明处理单维飞行数据知识获取方法的流程图;图4是本发明处理多维飞行数据知识获取方法的流程图;图5是本发明规则处理模块处理过程的流程图。图中1.飞行数据获取模块 2.飞行数据库模块 3.模式选择模 块4.数据准备模块5.数据显示模块6.任务执行模块 7.规则输出模块 8.规则处理模块9.知识获取模块 10.知识库模块11.用户
具体实施例方式下面将结合附图和实施例对本发明作进一步的详细说明。本发明一种基于关联规则的飞行数据知识获取系统的结构如图1所示,主要包括 飞行数据获取模块1、飞行数据库模块2、模式选择模块3、数据准备模块4、数据显示模块5、任务执行模块6、规则输出模块7、规则处理模块8、知识获取模块9和知识库模块10。其中,飞行数据获取模块1获取飞行数据传递给飞行数据库模块2保存在数据库表中,数据准备模块4将飞行数据库模块2中保存的飞行数据进行处理以使该飞行数据能 够用于关联规则挖掘,数据准备模块4将处理好的数据传送给数据显示模块5和任务执行 模块6。数据显示模块5将数据显示给用户11。用户11通过模式选择模块3选择知识获 取的模式,模式选择模块3将选择的知识获取模式通知任务执行模块6。任务执行模块6根 据知识获取模式对经过数据准备模块4处理后的飞行数据进行关联规则挖掘,将有用的信 息形成规则输出给规则输出模块7。规则输出模块7将接收的规则传送给规则处理模块8 和用户11。用户11可以对规则输出模块7输出的规则进行查看。规则处理模块8对规则 输出模块7提供的规则进行冗余规则处理和合并规则处理,并将该规则作为知识提供给知 识获取模块9。知识获取模块9将接收的知识,显示给用户11,同时将知识提供给知识库模 块10。知识库模块10将得到的知识按照设计好的数据库格式存储到相应的数据库中。飞行数据获取模块1是本发明的知识获取系统与目前各种飞行参数记录仪数据 转换的接口。飞行数据获取模块1读取飞行数据,飞行数据通过飞行参数记录仪的数据读 取软件获取,或者直接通过飞行数据文件获取,并将读取的飞行数据发送给飞行数据库模 块2。飞行数据库模块2将从飞行数据获取模块1得到的飞行数据存储到相应的数据库 表中,该数据库表存储飞行数据的基本信息以及飞行数据的具体数值信息,飞行数据的基 本信息包括飞行数据所属系统的名称、飞行数据的标号、飞行数据的名称和飞行数据的类 型,飞行数据的具体数值信息包括如飞行数据的记录时间和相应的数据值。所有的飞行数 据都可以采用统一的数据库表结构。用户11通过模式选择模块3选择相应的知识获取模式,用户11可以选择进行单 维飞行数据的知识获取,也可以选择进行多维飞行数据的知识获取。模式选择模块3将选 择的知识获取模式提供给任务执行模块6。数据准备模块4对飞行数据库模块2中数据库表中记录的数据进行数据处理,使 处理后的数据成为关联规则挖掘可用的数据,将处理后的数据作为数据源提供给数据显示 模块5和任务执行模块6。飞行数据库模块2中记录的原始飞行数据并不是完整的数据,一 般都包含噪声、异常值或不一致的数据,因此数据准备模块4需要根据原始飞行数据的特 点对飞行数据库模块2中记录的原始飞行数据进行相应的处理,如消除噪声、剔除异常值、 进行类型转换工作。具体处理方式为对单维飞行数据主要是根据飞行数据的数据类型特 性进行字符标记;对多维飞行数据,将飞行数据的数值异常点按前后均值方法进行处理,再 根据飞行数据的数值区间进行数据分层,采用相应的字符标号对每一层的数据区间进行标 识。所述的前后均值方法就是取异常值所对应点的前一个点和后一个点,然后将这两个点 对应的数值求和并取平均值。数据显示模块5接收数据准备模块4处理好的飞行数据,并将其显示给用户11,便 于用户11对数据进行观察分析。任务执行模块6根据模式选择模块3选择的知识获取模式,并利用数据准备模块 4提供的处理后的飞行数据开展规则获取工作,获取隐含在飞行数据中的有用信息,并形成 规则,提供给规则输出模块7。在单维飞行数据的知识获取模式下,任务执行模块6采用Apriori算法进行关联规则挖掘;在多维飞行数据的知识获取模式下,任务执行模块6采用Mulit-Rule方法进行关联规则挖掘。所述Apriori算法是一种逐层搜索的迭代方法, Apriori算法中K项集用于搜索(K+1)项集。首先找出频繁1项集的集合,该集合记作Li, Ll用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到 K项集,从而完成规则的挖掘工作。其中,K为大于O的整数。所述的Mulit-Rule方法是本发明基于Apriori算法提出的一种进行多维关联规 则挖掘的方法,也是一种逐层搜索的迭代方法。Mulit-Rule方法中K项集用于搜索(K+1) 项集。首先找出频繁1项集的集合,该集合记作Li,Ll用于找频繁2项集的集合L2,L2用 于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作。规则输出模块7将从任务执行模块6获取的规则显示给用户11,便于用户11对得 到的规则进行察看,同时将获取的规则提供给规则处理模块8。规则处理模块8对规则输出模块7提供的规则进行处理,主要包括对冗余规则的 处理和进行规则的合并工作。经过规则处理模块8处理后的规则是最简的,同时是独立的 一种描述方式。根据每一条规则的前提与结论所涉及的飞行数据的具体信息,将每条规则 与相应的飞行参数所属系统相关联,并进行规则的语义描述,将相应的规则作为一种知识 进行描述,即提供符合实际的知识表达方式,并将该知识提供给知识获取模块9,该知识就 是通过关联规则处理后自动获取的,在相应的专家系统应用过程中,可以作为一种专家经 验指导故障诊断和趋势预测工作。知识获取模块9接收规则处理模块8提供的知识,将该知识显示给用户11,用户 11可以对知识进行查看。同时知识获取模块9将知识提供给知识库模块10。知识库模块10将知识获取模块9提供的知识存储到相应的数据库中,对提供的知 识可以采用统一的数据结构进行描述。该数据结构包括知识的标号、知识的前提、知识的结 论以及知识的可信度信息。这些知识为利用飞行数据进行故障诊断和趋势预测的专家系统 提供了专家经验。本发明基于上述知识获取系统的一种基于关联规则的飞行数据知识获取方法,如 图2所示,由下述步骤来完成步骤一获取飞行数据;飞行数据获取是进行知识获取的前提,这部分工作由飞行数据获取模块1完成。 所述飞行数据包括飞行数据的基本信息,如飞行数据所属系统的名称、飞行数据的标号、 名称和类型,和飞行数据的具体数值信息,如飞行数据的记录时间和相应的数据值。飞行 数据获取模块1可以通过飞行参数记录仪的数据读取软件获取飞行数据,也可以直接通过 相应格式的飞行数据文件获取飞行数据。飞行数据获取模块1获取这些飞行数据后将其存 储到飞行数据库模块2中。步骤二 选择知识获取模式;用户根据实际的需求,通过模式选择模块3来选择需要进行获取的模式。用户11 可以选择进行单维飞行数据的知识获取,也可以选择进行多维飞行数据的知识获取。步骤三数据准备;数据准备主要是对步骤一中存储到飞行数据库模块2中的数据进行处理,这部分 工作由数据准备模块4完成的。数据准备主要包括消除噪声、类型转换和数据分层工作。经数据准备模块4处理,使飞行数据库模块2中的数据成为关联规则挖掘可用的数据。根据步骤二中确定的知识获取模式的不同,数据准备的具体过程也有所不同。当选择单维飞行数据的知识获取时,其数据准备主要是根据飞行数据的数据类型 特性进行字符标记,将飞行数据转换为计算机便于处理的形式化符号,如用Ii代表低压转 子转速、12代表高压转子转速、13代表剩余油量、14代表气压高度。当选择多维飞行数据的知识获取时,其数据准备过程首先对飞行数据的数值异常 点按前后均值方法进行处理,然后在此基础上根据飞行数据的数值区间进行数据分层,最 后采用相应的字符标号对每一层的数据区间进行标识,便于进行后期处理。如对气压高度 来说,其数值区间为(1-30000),通过数据分层后,用Al代表(0-500)、A2代表(500-5000)、 A3代表(5000-10000) A4代表(10000-30000)。所述前后均值方法,为取异常值所对应点的 前一个点和后一个点,然后将这两个点对应的数值求和并取平均值。数据准备过程是进行关联规则挖掘的前提,其为关联规则挖掘提供了便于计算机 处理和识别的数据基础。步骤四关联规则挖掘;关联规则挖掘是进行知识获取的核心环节。这部分工作主要由任务执行模块6完 成。任务执行模块6根据用户11选择的知识获取模式,通过关联规则挖掘获取隐含在飞行 数据中的有用信息。当选择单维飞行数据的知识获取时,则利用Apriori算法进行关联规则挖掘。所 述Apriori算法是一种逐层搜索的迭代方法,K项集用于搜索(K+1)项集。首先找出频繁1 项集的集合,该集合记作Li,Ll用于找频繁2项集的集合L2,L2用于找频繁3项集的集合 L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作。其中,K为大于0的整数。在步骤二中选择单维飞行数据的知识获取时,关联规则挖掘具体通过下述步骤来 实现,如图3所示步骤a、参数设置;参数设置主要是对规则的最小支持度和最小置信度进行设置,是进行关联规则挖 掘工作时的一个前提步骤。规则的支持度和置信度是规则兴趣度的两种度量,它们分别反 映所发现的规则的有用性和确定性。如果规则同时满足条件大于最小支持度阈值和大于 最小置信度阈值,则此规则是有意义的。如果没有设定最小支持度和最小置信度,那么所有 通过关联规则挖掘得到的规则都将作为有意义的规则进行存储,但实际上并不是所有得到 的规则都是有意义的,这样一方面造成规则库的庞大,另一方面也会降低专家系统的工作 效率。规则的最小支持度和最小置信度由用户11根据经验进行设定,对于不同的专家 系统来说规则最小支持度和最小置信度的阈值并没有统一的规定,在本发明中将最小支持 度及最小置信度的阈值作为开放式接口,由用户设定,同时本发明所述系统提供了相应的 默认值,最小支持度阈值一般设置为W. 2-0. 5]闭区间范围内的任意值,最小置信度阈值 一般设置为
闭区间范围内的任意值。参数设置为进行规则获取提供决策条件,是开展下述步骤的前提。步骤b、生成候选1项集;候选1项集是Apriori算法的第一次迭代过程。基本过程是由本文涉及的飞行数据知识获取系统扫描飞行数据库模块2中所有的项,对每项出现的次数进行计数。所述的 项是经过数据准备过程处理后的飞行数据,即利用形式化符号描述的便于计算机处理的飞 行数据。根据参数设置的最小支持度,得到所有项计数大于最小支持度的项,形成候选1项 集。候选1项集中的每一个元素的项计数都大于最小支持度。步骤C、生 成频繁项集;频繁项集是指通过迭代找出最经常发生的各个参数之间的关联性,也就是项与项 之间的关联性。频繁2项集描述两项同时发生的集合,频繁3项集描述三项同时发生的集 合,依次类推。频繁项集生成是逐步迭代的过程,通过对飞行数据库模块2中各项关联性的 逐次搜索,完成最终的迭代过程,形成频繁项集,频繁项集的项计数大于用户设置的最小置 信度阈值。步骤d、规则输出;通过步骤a中参数设置的最小置信度阈值,在步骤c产生频繁项集的基础上,输出 关联规则,此时所有的关联规则的置信度均大于最小置信度阈值。步骤c产生的频繁项集就代表了最终通过关联规则挖掘得到的规则。步骤e、规则还原与保存;由于在数据准备过程中将数据转换为字符标识形式,因此输出的规则是字符标识 形式,需要对其进行还原,即把标识还原成其所表示的对象。同时将还原后的规则进行保 存,便于后期进行处理。如在数据准备过程中用Ii代表低压转子转速,则在此过程中将Ii 替换为低压转子转速。当选择多维飞行数据的知识获取时,则利用Mulit-Rule方法进行关联规则挖掘, Multi-Rule方法是本发明基于Apriori算法提出的一种进行多维关联规则挖掘的方法,因 此也是一种逐层搜索的迭代方法。K项集用于搜索(K+1)项集。首先找出频繁1项集的集 合,该集合记作Li,Ll用于找频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此 递推,直到不能找到K项集,从而完成规则的挖掘工作,因此Multi_Rule算法的很多定义都 和Apriori算法同样或者类似,如最小支持度,最小置信度,但其在数据准备方面需要进行 数据分层。其中,K为大于O的整数。在步骤二中选择多维飞行数据的知识获取时,利用Mulit-Rule方法进行关联规 则挖掘具体通过下述步骤来实现,如图4所示步骤A、数据表生成;将步骤三中经数据分层的飞行数据信息,即每种飞行数据的分层信息和标号重新 存入到数据库中,并形成数据表,为后期处理提供依据。所述形成的数据表的内容主要包括 飞行数据所属系统的名称、飞行数据的标号、飞行数据的名称和类型、分层的标识符号以及 对应的区间范围。步骤B、参数设置;参数设置主要是对规则的最小支持度和最小置信度进行设置。参数设置是进行关 联规则挖掘工作时的一个前提步骤。规则的支持度和置信度是规则兴趣度的两种度量。它 们分别反映所发现的规则的有用性和确定性。如果关联规则同时满足最小支持度阈值和最 小置信度阈值,则此规则是有意义的。最小支持度阈值和最小置信度阈值的设置同对单维飞行数据进行关联规则挖掘的步骤a中所述。本发明所述系统提供了相应的默认值,最小支持度阈值一般设置为
闭区间范围内的任意值,最小置信度阈值一般设置为
闭区间范围内 的任意值。参数设置为进行规则获取提供决策条件,是开展下述步骤的前提。步骤C、生成候选1谓词集;谓词是多维飞行数据库中的每个属性,如一个飞行数据库中包括气压高度、无线电高度、低压转子转速属性,则每一个属性即代表一个谓词。也可以把不同的谓词称作维, 这样的话单维就仅仅涉及到一个谓词,即只有一个属性。而多维就涉及到多个谓词,即多维属性。候选1谓词集是Multi-Rule算法的第一次迭代过程。基本过程是扫描飞行数据 库模块2中所有的维,在本过程中维便是经步骤三处理后的利用形式化符号描述的便于计 算机处理的飞行数据,对每维出现的次数进行计数。根据参数设置的最小支持度,得到所有 满足计数大于最小支持度的集合,形成候选1谓词集。候选1谓词集中的每维计数都大于 最小支持度。步骤D、生成候选K谓词集;生成候选K谓词集是逐步迭代的过程,通过对数据库中各谓词关联性的逐次搜 索,完成最终的迭代过程,形成候选K谓词集,K代表多维谓词的最大值。候选K谓词集的 维计数都大于用户设置的最小置信度阈值。步骤E、规则输出;通过步骤B设置的最小置信度阈值,在步骤D产生候选K谓词集的基础上,输出关 联规则。对步骤C中得到的满足最小支持度要求的集合,步骤D在此基础上进行进一步限 定,得到满足最小置信度要求的集合,进而得到最终的规则集合。步骤D中形成的候选K谓 词集就代表了最终通过关联规则挖掘得到的规则。步骤F、规则还原与保存;由于在数据准备过程中将飞行数据的数值区间进行数据分层,并采用相应的字符 标号对每一层的数据区间进行标识,因此输出的规则是字符标识形式,需要对其进行还原。 本步骤把字符标识还原成其所表示的数据对象,同时将还原后的规则进行保存,便于后期 进行处理。如在数据准备过程中利用Al代表气压高度在0-500之间,那么在此过程中将A 替换为0-500。步骤五规则输出;规则输出由规则输出模块7完成,规则输出模块7将关联规则挖掘的规则通过人 机界面显示给用户11,便于用户进行分析和判断。步骤六规则处理;规则处理主要是对冗余规则进行处理,同时对一些相互包含的规则进行合并。这 部分工作主要由规则处理模块8完成。规则处理模块8对规则输出模块7提供的规则进行 处理后,将处理后的规则作为知识提供给知识获取模块9。规则处理模块8对规则输出模块7提供的规则进行具体处理的过程由下述步骤来 完成,如图5所示步骤6.1:导入规则;
规则处理模块8接收步骤五输出的单维飞行数据知识获取或多维飞行数据知识 获取得到的规则。步骤6. 2冗余规则处理;冗余规则 会降低系统的效率,造成知识库不必要的增大,同时使知识库的维护难 度加大。本发明飞行数据知识获取方法进行的冗余规则处理包括以下几种I 等价的冗余规则;等价的冗余规则是指一条规则的条件与结论和另一条规则的条件与结论完全等 价。如Rl :if A and B then C ;R2 :if B and A then C ;上述描述中,Rl、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。 规则Rl指由前提A和B得到结论C,规则R2指由前提B和A也得到结论C。如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除其中 的任意一条规则。II “与”条件包含的冗余规则;“与”条件包含的冗余规则是指一条规则“与”条件的约束包含另一条规则“与”条 件的约束,但它们的结论是相同的。如Rl :if A and B then C ;R2 :if Athen C ;上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。 规则Rl指由前提A和B得到结论C,规则R2指由前提A得到结论C。如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则 Rl0III “或”条件包含的冗余规则;“或”条件包含的冗余规则是指一条规则“或”条件的约束包含另一条规则“或”条 件的约束,但它们的结论是相同的。如Rl :if A OR B then C ;R2 :if A then C ;上述描述中,R1、R2分别代表一条规则,A、B代表规则的前提,C代表规则的结论。 规则Rl指由前提A或者B得到结论C,规则R2指由前提A得到结论C。如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则 R2。IV “与”结果包含的冗余规则;“与,,结果包含的冗余规则是这两个规则的条件是相同的,但是其中一条规则的结 果“与”条件个数多于另一规则的结果“与”条件个数。如Rl :if A then B and C and D ;R2 :if A then B and C ;上述描述中,Rl、R2分别代表一条规则,A代表规则的前提,B、C、D代表规则的结 论。规则Rl指由前提A得到结论B和C和D,规则R2指由前提A得到结论B和C。
如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除规则 R2。V “或”结果包含的冗余规则。“或”结果包含的冗余规则是两个规则的条件数是相等的,但是其中一条规则的结果“或”条件多于另一条规则的结果“或”条件个数。如Rl :if A then B or C or D ;R2 :if A then B or C ;上述描述中,RU R2分别代表一条规则,A代表规则的前提,B、C和D代表规则的 结论。规则Rl指由前提A得到结论B或C或D,规则R2指由前提A得到结论B或C。如果通过导入规则获取的两条规则满足这种情况,那么冗余规则处理会删除R2。步骤6. 3 规则合并;规则合并主要是对相互包含的规则进行处理。具体来说若存在两条规则,它们条 件相同、结论包含或者条件包含、结论相同,则可把这两条规则进行合并。规则合并分为如 下情况的规则i 条件相同,结论不同的情况;Rl :A and B = > CR2 :A and B = > D上述描述中,RU R2分别代表一条规则,A、B代表规则的前提,C和D代表规则的 结论。规则Rl指由前提A和B可得到结论C,规则R2指由前提A和B可得到结论D。那么如果通过导入规则获取的两条规则满足这种情况,那么规则合并会将规则Rl 和R2删除,并形成一条新的规则R3 :A and B = > C or D ;上述描述中,R3代表一条规则,A、B代表规则的前提,C和D代表规则的结论。规 R3指由前提A和B可得到结论C或者D。
条件不同,结论相同的情况;Rl :Α = > B and CR2 :D = > B and C上述描述中,RU R2分别代表一条规则,A、D代表规则的前提,B和C代表规则的 结论。规则Rl指由前提A可得到结论B和C,规则R2指由前提D可得到结论B和C。那么如果通过导入规则获取的两条规则满足这种情况,那么规则合并会将规则Rl 和R2删除,并形成一条新的规则R3 :A or D => B and C上述描述中,R3代表一条规则,A、D代表规则的前提,B和C代表规则的结论。规 则Rl指由前提A或者D可得到结论B和C。步骤6. 4 规则保存;将经过上述步骤6. 1 步骤6. 3处理后形成的规则存储到知识库模块10中。步骤七知识获取;知识获取是系统的最后一个环节,主要由知识获取模块9完成。知识获取得到的 是处理后的最简的、同时能体现数据特征的规则,并将这些规则作为知识存储到知识库模块10中,便于后期的研 究和使用。
权利要求
一种飞行数据知识获取系统,包括用户,其特征在于,还包括飞行数据获取模块、飞行数据库模块、模式选择模块、数据准备模块、数据显示模块、任务执行模块、规则输出模块、规则处理模块、知识获取模块和知识库模块;飞行数据获取模块获取飞行数据,将获取的飞行数据发送给飞行数据库模块;飞行数据库模块将得到的飞行数据存储到数据库表中;数据准备模块对飞行数据库模块中数据库表中记录的飞行数据进行数据处理,使处理后的数据能够用于关联规则挖掘,并将处理后的数据作为数据源提供给数据显示模块和任务执行模块;数据显示模块将接收的飞行数据显示给用户;用户通过模式选择模块选择知识获取模式选择进行单维飞行数据的知识获取或者选择进行多维飞行数据的知识获取,模式选择模块将选择好的知识获取模式通知给任务执行模块;任务执行模块根据知识获取模式,对数据准备模块处理后的飞行数据开展规则获取工作,在单维飞行数据的知识获取模式下,采用Apriori算法进行关联规则挖掘,在多维飞行数据的知识获取模式下,采用Mulit-Rule方法进行关联规则挖掘;任务执行模块获取隐含在飞行数据中的有用信息,并形成规则,提供给规则输出模块;规则输出模块将获取的规则显示给用户,并将获取的规则提供给规则处理模块;规则处理模块对规则输出模块提供的规则进行处理,主要包括对冗余规则的处理和进行规则的合并,并将该规则作为知识提供给知识获取模块;知识获取模块将接收的知识,显示给用户,同时将知识提供给知识库模块;知识库模块将知识获取模块提供的知识存储到数据库中。
2.根据权利要求1的一种飞行数据知识获取系统,其特征在于,所述飞行数据获取模 块,通过飞行参数记录仪的数据读取软件获取飞行数据,或者通过飞行数据文件获取飞行 数据。
3.根据权利要求1的一种飞行数据知识获取系统,其特征在于,所述的数据准备模块, 采用字符标记处理单维飞行数据,针对多维飞行数据,根据飞行数据的数值区间进行数据 分层,采用字符标号对每一层的数据区间进行标识,在进行数据分层前对飞行数据的数值 异常点按前后均值方法进行处理。
4.应用权利要求1所述的飞行数据知识获取系统的一种飞行数据知识获取方法,其特 征在于,具体包括如下步骤步骤一、获取飞行数据飞行数据获取模块通过飞行参数记录仪的数据读取软件获取 飞行数据,或者通过飞行数据文件获取飞行数据,飞行数据获取模块将获取的飞行数据存 储到飞行数据库模块中;步骤二、选择知识获取模式用户根据实际的需求,通过模式选择模块来选择需要进 行知识获取模式,选择进行单维飞行数据的知识获取或者选择进行多维飞行数据的知识获 取,模式选择模块将选择的知识获取模式传递给任务执行模块;步骤三、数据准备数据准备模块对飞行数据库模块中的数据进行处理,主要包括消除 噪声、类型转换和数据分层工作,使飞行数据库模块中的数据成为关联规则挖掘能用的数据,数据准备模块将处理后的数据传递给任务执行模块;步骤四、关联规则挖掘任务执行模块根据步骤二用户选择的知识获取模式,对步骤三 处理后的数据,通过关联规则挖掘获取隐含在飞行数据中的有用信息,并将这些信息形成 规则;步骤五、规则输出规则输出模块将步骤四形成的规则提供给规则处理模块,同时将规 则通过人机界面显示给用户;步骤六、规则处理规则处理模块对规则输出模块提供的规则进行处理,处理后的规则 作为知识提供给知识获取模块;步骤七、知识获取知识获取模块接收步骤六的知识,将该知识存储到知识库模块,并 显示给用户。
5.根据权利要求4所述的一种飞行数据知识获取方法,其特征在于,步骤三中所述的 数据准备模块对飞行数据库模块中的数据进行处理,针对不同的知识获取模式,具体处理 为当选择单维飞行数据的知识获取时,对飞行数据进行字符标记,转换为计算机便于处 理的形式化符号;当选择多维飞行数据的知识获取时,首先对飞行数据的数值异常点按前后均值方法进 行处理,在此基础上根据飞行数据的数值区间进行数据分层,最后采用字符标号对每一层 的数据区间进行标识;所述的前后均值方法就是取异常值所对应点的前一个点和后一个 点,然后将这两个点对应的数值求和并取平均值。
6.根据权利要求4所述的一种飞行数据知识获取方法,其特征在于,步骤四中所述的 任务执行模块通过关联规则挖掘获取隐含在飞行数据中的有用信息,针对单维飞行数据的 知识获取,采用Apriori算法进行关联规则挖掘,包括如下步骤步骤a、参数设置用户根据经验设定规则的最小支持度阈值和最小置信度阈值; 步骤b、生成候选1项集飞行数据知识获取系统扫描飞行数据库模块中所有的项,对 每项出现的次数进行计数,根据步骤a中设置的最小支持度,将所有项计数大于最小支持 度的项形成候选1项集;所述的项为经过数据准备过程处理后的飞行数据;步骤C、生成频繁项集频繁项集生成是逐步迭代的过程,通过对飞行数据库模块中各 项关联性的逐次搜索,完成最终的迭代过程,形成频繁项集,频繁项集的项计数大于用户设 置的最小置信度阈值;步骤d、规则输出步骤c产生的频繁项集就是最终通过关联规则挖掘得到的规则; 步骤e、规则还原与保存由于在数据准备过程中将数据转换为字符标识形式,因此输 出的规则是字符标识形式,需要对其进行还原,把标识还原成其所表示的数据对象,并保存 还原后的规则。
7.根据权利要求4所述的一种飞行数据知识获取方法,其特征在于,步骤四中所述的 任务执行模块通过关联规则挖掘获取隐含在飞行数据中的有用信息,针对多维飞行数据的 知识获取,采用Mulit-Rule方法进行关联规则挖掘,所述Multi-Rule方法是基于Apriori 算法提出的一种进行多维关联规则挖掘的方法,是一种逐层搜索的迭代方法,Mulit-Rule 方法中K项集用于搜索(K+1)项集,首先找出频繁1项集的集合,该集合记作L1,L1用于找 频繁2项集的集合L2,L2用于找频繁3项集的集合L3,如此递推,直到不能找到K项集,从而完成规则的挖掘工作;采用Multi-Rule方法针对多维飞行数据的知识获取进行关联规则挖掘的具体步骤为步骤A、数据表生成将步骤三处理后的飞行数据,包括每种飞行数据的分层信息和标 号重新存入到数据库中,并形成数据表,形成的该数据表主要包括飞行数据所属系统的名 称、飞行数据的标号、飞行数据的名称、飞行数据的类型、分层的标识符号以及对应的区间 范围;步骤B、参数设置设置最小支持度阈值和最小置信度阈值;步骤C、生成候选1谓词集扫描数据库中所有的维,对每维出现的次数进行计数,将所 有满足维计数大于最小支持度的集合形成候选1谓词集;所述的维是经过步骤三数据准备 处理后得到的利用形式化符号描述的飞行数据;步骤D、生成候选K谓词集通过对数据库中各谓词关联性的逐次搜索,完成最终的迭 代过程,形成候选K谓词集;其中,K代表多维谓词的最大值;候选K谓词集的维计数都大于 用户设置的最小置信度阈值;步骤E、规则输出步骤D中生成的候选K谓词集就是通过关联规则挖掘得到的规则; 步骤F、把步骤E输出的规则还原并保存把字符标识还原成其所表示的数据对象,同 时将还原后的规则进行保存。
8.根据权利要求6或7所述的一种飞行数据知识获取方法,其特征在于,步骤a或步骤 B中所述的参数设置,最小支持度阈值默认设置在W. 2-0. 5]闭区间范围内的任意值,最小 置信度阈值默认设置在W. 5-0. 9]闭区间范围内的任意值。
9.根据权利要求4所述的一种飞行数据知识获取方法,其特征在于,步骤六中所述的 规则处理模块对规则输出模块提供的规则进行处理,具体的处理过程为步骤6. 1、导入规则规则处理模块接收规则输出模块输入的规则; 步骤6. 2、冗余规则处理主要采用以下几种冗余规则进行处理等价的冗余规则; “与”条件包含的冗余规则;“或”条件包含的冗余规则;“与”结果包含的冗余规则;“或”结 果包含的冗余规则;步骤6. 3、规则合并主要有两种情况若两条规则的条件相同,结论不同则将两条规 则合并;若两条规则的条件不同,结论相同则将两条规则合并;步骤6. 4、规则保存将经过步骤6. 1 步骤6. 3处理后形成的规则存储到知识库模块中。
全文摘要
本发明提出一种飞行数据知识获取系统及其获取方法。其中,飞行数据知识获取系统主要包括飞行数据获取模块、飞行数据库模块、模式选择模块、数据准备模块、数据显示模块、任务执行模块、规则输出模块、规则处理模块、知识获取模块和知识库模块,将飞行数据输入并进行处理,通过规则获取工作,提取有用数据形成规则,并作为知识提供给用户。飞行数据知识获取方法,主要通过将输入的飞行数据进行处理,采用Apriori算法或者Mulit-Rule方法进行关联规则挖掘,将提取的规则作为知识提供给用户。本发明采用消除冗余规则和合并规则,降低知识库的维护难度,利用关联规则方法实现知识自动获取过程,适用于对多维和单维数据的处理,减少了人工输入和对专家经验的依赖。
文档编号G06N5/00GK101887531SQ20101020864
公开日2010年11月17日 申请日期2010年6月13日 优先权日2010年6月13日
发明者毛可飞, 路辉, 陈付亮 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1