用于同业对标的数据处理方法和装置的制造方法

文档序号:8473067阅读:438来源:国知局
用于同业对标的数据处理方法和装置的制造方法
【技术领域】
[0001] 本发明涉及数据处理领域,具体而言,涉及一种用于同业对标的数据处理方法和 装置。
【背景技术】
[0002] 在相关技术中,用于同业对标的管理平台在分析指标数据时,还停留在对单项指 标数据自顶向下的定性分析和提高上,缺乏深度分析,而自顶向下地逐项对全部指标数据 进行分析必然耗费大量的时间,影响了企业的工作效率。
[0003] 并且,发明人发现,在相关技术中,对指标数据进行孤立分析无法得知各指标之间 的关联度,导致无法对企业事务进行科学决策。
[0004] 针对上述的问题,目前尚未提出有效的解决方案。

【发明内容】

[0005] 本发明实施例提供了一种用于同业对标的数据处理方法和装置,以至少解决由于 无法得知不同指标数据之间的关联性而造成的企业工作效率低的技术问题。
[0006] 根据本发明实施例的一个方面,提供了一种用于同业对标的数据处理方法,包括: 获取多个指标中每个指标在多个事务中的指标数据,上述多个指标为用于同业对标的指 标;以及根据上述多个指标中每个指标在上述多个事务中的指标数据确定上述多个指标中 满足预设关联规则的部分指标。
[0007] 进一步地,上述多个指标构成候选指标集,上述多个指标中的每个指标为上述候 选指标集中的一个元素,上述多个事务中的每个事务包含于上述候选指标集,根据上述多 个指标中每个指标在上述多个事务中的指标数据确定上述多个指标项中满足预设关联规 则的部分指标包括:获取预先设定的Apriori算法;根据上述预先设定的Apriori算法和 上述多个指标中每个指标在上述多个事务中的指标数据对上述候选指标集中的所有指标 在上述多个事务中挖掘满足预设关联规则的频繁项集,上述频繁项集为每项的支持度都大 于最小支持度的项集;以及将上述频繁项集中所涉及的指标作为满足上述预设关联规则的 部分指标。
[0008] 进一步地,根据上述预先设定的Apriori算法和上述多个指标中每个指标在上述 多个事务中的指标数据对上述候选指标集中的所有指标在上述多个事务中挖掘满足预设 关联规则的频繁项集包括:根据上述预先设定的Apriori算法和上述上述多个指标中每个 指标在上述多个事务中的指标数据对上述候选指标集中的所有指标在上述多个事务中确 定所有的频繁项集;由上述所有的频繁项集产生强关联规则,上述强关联规则满足上述最 小支持度的要求;将上述强关联规则中所涉及的指标作为满足上述预设关联规则的部分指 标。
[0009] 进一步地,在将上述强关联规则中所涉及的指标作为满足上述预设关联规则的部 分指标之前,上述数据处理方法还包括:检测上述强关联规则是否满足最小置信度的要求, 其中,如果检测出上述强关联规则满足上述最小置信度的要求,则将上述强关联规则中所 涉及的指标作为满足上述预设关联规则的部分指标;和/或,如果检测出上述强关联规则 不满足上述最小置信度的要求,则先将上述强关联规则中一个或者若干个不满足上述最小 置信度的要求的指标剔除,再将剔除了上述一个或者若干个不满足上述最小置信度的要求 的指标的关联规则中所涉及的指标作为满足上述预设关联规则的部分指标。
[0010] 进一步地,在获取多个指标中每个指标在多个事务中的指标数据之后,上述数据 处理方法还包括:检测获取的指标数据是否存在空缺值,如果检测出上述获取的指标数据 存在上述空缺值,则对上述空缺值进行填充,之后,执行根据上述多个指标中每个指标在上 述多个事务中的指标数据确定上述多个指标项中满足预设关联规则的部分指标的步骤;和 /或检测获取的指标数据是否存在孤立点数据,如果检测出上述获取的指标数据存在上述 孤立点数据,则对上述孤立点数据进行填充,之后,执行根据上述多个指标中每个指标在上 述多个事务中的指标数据确定上述多个指标项中满足预设关联规则的部分指标的步骤。
[0011] 根据本发明实施例的另一方面,还提供了一种用于同业对标的数据处理装置,包 括:获取单元,用于获取多个指标中每个指标在多个事务中的指标数据,上述多个指标为用 于同业对标的指标;以及确定单元,用于根据上述多个指标中每个指标在上述多个事务中 的指标数据确定上述多个指标中满足预设关联规则的部分指标。
[0012] 进一步地,上述多个指标构成候选指标集,上述多个指标中的每个指标为上述候 选指标集中的一个元素,上述多个事务中的每个事务包含于上述候选指标集,上述确定单 元包括:获取模块,用于获取预先设定的Apriori算法;挖掘模块,用于根据上述预先设定 的Apriori算法和上述多个指标中每个指标在上述多个事务中的指标数据对上述候选指 标集中的所有指标在上述多个事务中挖掘满足预设关联规则的频繁项集,上述频繁项集为 每项的支持度都大于最小支持度的项集;以及确定模块,用于将上述频繁项集中所涉及的 指标作为满足上述预设关联规则的部分指标。
[0013] 进一步地,上述挖掘模块包括:确定子模块,用于根据上述预先设定的Apriori 算法和上述上述多个指标中每个指标在上述多个事务中的指标数据对上述候选指标集中 的所有指标在上述多个事务中确定所有的频繁项集;生成子模块,用于由上述所有的频繁 项集产生强关联规则,上述强关联规则满足上述最小支持度的要求;确定子模块,用于将上 述强关联规则中所涉及的指标作为满足上述预设关联规则的部分指标。
[0014] 进一步地,上述数据处理装置还包括:第一检测单元,用于在将上述强关联规则中 所涉及的指标作为满足上述预设关联规则的部分指标之前,检测上述强关联规则是否满足 最小置信度的要求,其中,上述确定子模块还用于在检测出上述强关联规则满足上述最小 置信度的要求时,将上述强关联规则中所涉及的指标作为满足上述预设关联规则的部分指 标;和/或,上述确定子模块还用于在检测出上述强关联规则不满足上述最小置信度的要 求,则先将上述强关联规则中一个或者若干个不满足上述最小置信度的要求的指标剔除, 再将剔除了上述一个或者若干个不满足上述最小置信度的要求的指标的关联规则中所涉 及的指标作为满足上述预设关联规则的部分指标。
[0015] 进一步地,上述数据处理装置还包括:第二检测单元,用于在获取多个指标中每个 指标在多个事务中的指标数据之后,检测获取的指标数据是否存在空缺值;第一填充单元, 用于在检测出上述获取的指标数据存在上述空缺值时,对上述空缺值进行填充,之后,上述 确定单元执行根据上述多个指标中每个指标在上述多个事务中的指标数据确定上述多个 指标项中满足预设关联规则的部分指标的功能,和/或第三检测单元,用于检测获取的指 标数据是否存在孤立点数据;第二填充单元,用于在检测出上述获取的指标数据存在上述 孤立点数据时,对上述孤立点数据进行填充,之后,上述确定单元执行根据上述多个指标中 每个指标在上述多个事务中的指标数据确定上述多个指标项中满足预设关联规则的部分 指标的功能。
[0016] 在本发明实施例中,采用挖掘关联规则的方式,通过获取多个指标中每个指标在 多个事务中的指标数据,多个指标为用于同业对标的指标;以及根据多个指标中每个指标 在多个事务中的指标数据确定多个指标项中满足预设关联规则的部分指标,达到了从所有 指标中挖掘出具有一定关联规则的部分指标的目的,从而实现了提高企业的工作效率的技 术效果,进而解决了由于无法得知不同指标数据之间的关联性而造成的企业工作效率低的 技术问题。
【附图说明】
[0017] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1