运动目标的关联规则分析方法及系统的制作方法
【技术领域】
[0001] 本发明涉及数据挖掘技术领域,尤其涉及一种运动目标的关联规则分析方法及系 统。
【背景技术】
[0002] 现代空域管理和监视已经是一种大范围、快节奏的管理和监视方式,包括海、陆、 空、天多维度的多方平台。随着现代空域管理和监视过程中传感器种类的增加以及传感器 能力的提升,空域管理和监视范围进一步扩大,方式日趋复杂化,区域内运动目标的数据量 和种类也随之剧增,由此给运动目标的识别带来了极大的困难。因此,在复杂环境下针对不 同飞行任务、不同目标,快速、准确地完成运动目标的识别,是未来空域管理和监视的先决 条件和必要保障。
[0003] 针对现有技术中运动目标的关联规则分析方法:
[0004] (1)在数据挖掘方面,目前的处理方式几乎都是基于当前、时刻的"静态状态"数 据进行挖掘,没有考虑针对的"动态趋势"数据进行处理,因而挖掘结果缺乏对运动 目标趋势特性的体现,也同时会导致一些有用知识的遗漏;
[0005] ⑵在关联规则分析方面,目前最为著名的算法是Apriori算法和 FP-Growth (Frequent Pattern-Growth,频繁模式增长)算法,此外还有DHP、STEM算法等。 其中,Apriori算法采用了基于逐层搜索求解频繁项集的迭代的方法,其过程简单,且易于 理解,没有复杂的算法,实现起来也比较容易,但需要多次扫描数据库(数据表)且产生大 量候选频繁项集,实用性不够高,效率很低。FP-Growth算法是一种不产生候选频繁项的挖 掘算法,其基本思想是将事务数据库压缩到一颗FP (Frequent Pattern,频繁模式)树中, 采用分而治之的思想,自底向上挖掘FP树,最终输出所有的频繁项集,但该算法在遍历FP 树时需要消耗大量时间,且在支持度计算时需要完全遍历,无法充分利用算法的中间结果, 导致时间和空间效率略低。此外,Apriori算法和FP-Growth算法都存在一个共同的问题: 二者都认为频繁项集的所有非空子集必须也都是频繁的,但是这样产生出的大量候选频繁 项集虽然都是频繁的,但有一部分是原始数据源所不包含的,这在某些特定应用环境下是 不能够被接受的。
[0006] 综上,由于在未来空域管理和监视过程中,各种传感器获取的目标特征信息量大、 类型多样、特征间关系错综复杂,并且特征具有不同的种类和表现形式,所以现有技术中运 动目标的关联规则分析方法已无法适应新的需求。
【发明内容】
[0007] 本发明的目的在于克服现有技术中运动目标的关联规则分析方法存在的以下技 术缺陷:在数据挖掘方面,对运动目标的运动趋势无法充分体现。为实现上述目的,本发明 提供了一种运动目标的关联规则分析方法及系统。
[0008] 根据本发明的一个方面,提供了 一种运动目标的关联规则分析方法,所述方法包 括:
[0009] 每隔预设的采样间隔获取关于至少两个运动目标的特征数据表,所述特征数据表 中保存有分别对应每个运动目标的运动特征、固有特征和属性特征;
[0010] 依次对预设时间段内的每个采样时刻,根据所述采样时刻及其上一采样时刻分别 获取的特征数据表,得到变化趋势数据表,并对所述变化趋势数据表进行关联规则分析,得 到所述采样时刻对应的第一关联知识;
[0011] 整合所述预设时间段内所有采样时刻对应的第一关联知识,得到动态关联知识;
[0012] 依次对所述预设时间段内的每个采样时刻,将所述采样时刻获取的特征数据表中 的所有固有特征和所有属性特征保存到固有特征数据表,并对所述固有特征数据表进行关 联规则分析,得到所述采样时刻对应的第二关联知识;
[0013] 整合所述预设时间段内所有采样时刻对应的第二关联知识,得到静态关联知识;
[0014] 对所述动态关联知识和所述静态关联知识进行数据融合,得到关联规则知识。
[0015] 优选的是,所述根据所述采样时刻及其上一采样时刻分别获取的特征数据表,得 到变化趋势数据表包括:
[0016] 依次对所述采样时刻获取的特征数据表中的每个运动特征,计算所述运动特征与 上一采样时刻获取的特征数据表中的相应运动特征的差值,得到所述运动特征对应的第一 差值;
[0017] 依次对所述采样时刻获取的特征数据表中的每个固有特征,计算所述固有特征与 上一采样时刻获取的特征数据表中的相应固有特征的差值,得到所述固有特征对应的第二 差值;
[0018] 根据所述特征数据表中的所有属性特征、所有运动特征对应的第一差值和所有固 有特征对应的第二差值,得到所述变化趋势数据表。
[0019] 优选的是,所述根据所述特征数据表中的所有属性特征、所有运动特征对应的第 一差值和所有固有特征对应的第二差值,得到所述变化趋势数据表包括:
[0020] 将所有属性特征保存到变化趋势数据表;
[0021] 依次对所述特征数据表中的每个运动特征,当所述运动特征对应的第一差值大于 0时,将通过所述运动特征的预设编码和1得到的变化趋势数据保存到变化趋势数据表;当 所述运动特征对应的第一差值等于0时,将通过所述运动特征的预设编码和0得到的变化 趋势数据保存到变化趋势数据表;当所述运动特征对应的第一差值小于0时,将通过所述 运动特征的预设编码和-1得到的变化趋势数据保存到变化趋势数据表;
[0022] 依次对所述特征数据表中的每个固有特征,当所述固有特征对应的第二差值为非 0时,将通过所述固有特征的预设编码和1得到的变化趋势数据保存到变化趋势数据表;当 所述固有特征对应的第二差值等于0时,将所述固有特征作为变化趋势数据保存到变化趋 势数据表。
[0023] 优选的是,所述对所述变化趋势数据表进行关联规则分析,得到所述采样时刻对 应的第一关联知识包括:
[0024] 利用所述变化趋势数据表,构建频繁模式树;
[0025] 依次针对所述变化趋势数据表中的每个单项,对所述频繁模式树进行数据挖掘, 得到所述单项对应的频繁项集;
[0026] 去除所述频繁项集中的不包含属性特征的无用项和至少包括两个属性特征的矛 盾项,得到所述单项对应的优化频繁项集;
[0027] 根据所述变化趋势数据表中的所有单项对应的优化频繁项集,得到所述第一关联 知识。
[0028] 优选的是,所述对所述固有特征数据表进行关联规则分析,得到所述采样时刻对 应的第二关联知识包括:
[0029] 利用所述固有特征数据表,构建频繁模式树;
[0030] 依次针对所述固有特征数据表中的每个单项,对所述频繁模式树进行数据挖掘, 得到所述单项对应的频繁项集;
[0031] 去除所述频繁项集中的不包含属性特征的无用项和至少包括两个属性特征的矛 盾项,得到所述单项对应的优化频繁项集;
[0032] 根据所述固有特征数据表中的所有单项对应的优化频繁项集,得到所述第二关联 知识。
[0033] 根据本发明的另一个方面,提供了一种特征数据表的关联规则分析系统,所以系 统包括:
[0034] 特征数据表获取单元,设置为每隔预设的采样间隔获取关于至少两个运动目标的 特征数据表,所述特征数据表中保存有分别对应每个运动目标的运动特征、固有特征和属 性特征;
[0035] 变化趋势数据表确定单元,设置为依次对预设时间段内的每个采样时刻,根据所 述采样时刻及其上一采样时刻分别获取的特征数据表,得到变化趋势数据表;
[0036] 第一关联知识确定单元,设置为对所述变化趋势数据表进行关联规则分析,得到 所述采样时刻对应的第一关联知识;