用于同业对标的数据处理方法和装置的制造方法_2

文档序号:8473067阅读:来源:国知局
释本发明,并不构成对本发明的不当限定。在附图中:
[0018] 图1是根据本发明实施例的一种可选的用于同业对标的数据处理方法的流程图; 以及
[0019] 图2是根据本发明实施例的一种可选的用于同业对标的数据处理装置的示意图。
【具体实施方式】
[0020] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的 附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是 本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术 人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范 围。
[0021] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语"第一"、"第 二"等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用 的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。此外,术语"包括"和"具有"以及他们的任何变形,意图在于 覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限 于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产 品或设备固有的其它步骤或单元。
[0022] 实施例1
[0023] 根据本发明实施例,提供了一种用于同业对标的数据处理方法的方法实施例,需 要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统 中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的 顺序执行所示出或描述的步骤。
[0024] 图1是根据本发明实施例的一种可选的用于同业对标的数据处理方法的流程图 图,如图1所示,该方法包括如下步骤:
[0025] 步骤S102,获取多个指标中每个指标在多个事务中的指标数据,多个指标为用于 同业对标的指标;以及
[0026] 步骤S104,根据多个指标中每个指标在多个事务中的指标数据确定多个指标中满 足预设关联规则的部分指标。
[0027] 其中,同业对标是指用指标评价企业、用业绩考核企业,主要从安全管理、资产经 营、营销服务、电网运行、人力资源等五类评价指标。
[0028] 实施时,可以获取用于评价几个属于同行业企业的所有的指标作为上述的多个指 标,而用于评价每个企业所有的指标可以作为一个事务,每个事务中的每个指标对应一个 指标数据,利用这些指标数据可以从所有的指标中选出具有关联规则的部分指标。
[0029] 通过上述步骤,由于对具有关联规则的指标中任一指标的大力改进都可以从很大 程度上提高其余指标的值,因此,对于某个企业(如电网企业),考虑到其实际指标因素非 常繁杂,通过本发明实施例的数据处理方法,挖掘具有关联规则的部分指标可以突出关键 指标,从而大大提高企业的工作效率,并且为管理层决策提供更清晰、更科学的规划。
[0030] 可选地,可以将上述多个指标构成一个候选指标集,其中,这多个指标中的每个指 标为候选指标集中的一个元素,上述多个事务中的每个事务可以包含于候选指标集,这样, 根据多个指标中每个指标在多个事务中的指标数据确定多个指标项中满足预设关联规则 的部分指标可以包括:
[0031] S2,获取预先设定的Apriori算法;
[0032] S4,根据预先设定的Apriori算法和多个指标中每个指标在多个事务中的指标数 据对候选指标集中的所有指标在多个事务中挖掘满足预设关联规则的频繁项集,频繁项集 为每项的支持度都大于最小支持度的项集;以及
[0033] S6,将频繁项集中所涉及的指标作为满足预设关联规则的部分指标。
[0034] 其中,Apriori算法可以用于挖掘关联规则的频繁项集,它通过候选集生成和情节 的向下封闭检测两个阶段来挖掘频繁项集。
[0035] 例如,根据电网公司的目标确定候选指标集(即候选指标库)I=U1,i2, . . .,ij, 它是指标项的集合,针对每一个管理类别,如安全管理、财务管理等,先确立能够反映部门 工作好坏的指标,再确定候选指标集。事务集D是相关事务的集合,其中每个事务T是指标 项的集合,使得7^二/。
[0036] 为了便于计数,在获取指标数据之后,可以确定与每项指标在不同事务中的指标 数据相对应的指标逻辑值。具体地,如果某个管理类别中某个候选指标的考核变化率的绝 对值大于绩效目标变化率的绝对值,则将该候选指标的逻辑值标记为" 1" ;否则,将该候选 指标的逻辑值标记为"〇"。其中,当候选指标的逻辑值标记为" 1"时,表明可保留该候选指 标;当候选指标的逻辑值标记为"〇"时,表明可剔除该候选指标。
[0037] 另外,关联规则是形如A-B的蕴涵式,其中A、B是I的元素,且Jn/J= 0。规则 A-B在事务集D中成立需要满足两个条件,即同时满足最小支持度阈值和最小置信度阈 值。
[0038] 通过本发明实施例,与相关技术中的同业对标着重对单个指标进行分析并采取相 应的措施逐个提高指标的水平相比,本发明首次将最大频繁项集挖掘算法应用到企业绩效 指标的管理应用中,利用Apriori算法对频繁模式进行挖掘,最终得到满足预设关联规则 的部分指标,而分析上述部分指标之间的关联性,可以减少对繁杂的具有重复性的指标的 分析,提高公司的效率。另外,通过计算指标项的最大频繁项集,可以明确知道某一管理范 围如企业财务管理领域的重要指标项,并且能够了解到不同指标对另一指标的影响程度, 有助于企业管理层采取针对性的措施进行科学决策。
[0039] 可选地,根据预先设定的Apriori算法和多个指标中每个指标在多个事务中的指 标数据对候选指标集中的所有指标在多个事务中挖掘满足预设关联规则的频繁项集可以 包括:
[0040] S8,根据预先设定的Apriori算法和多个指标中每个指标在多个事务中的指标数 据对候选指标集中的所有指标在多个事务中确定所有的频繁项集;
[0041] S10,由所有的频繁项集产生强关联规则,强关联规则满足最小支持度的要求;
[0042] S12,将强关联规则中所涉及的指标作为满足预设关联规则的部分指标。
[0043] 具体地,可以按照以下步骤实施本发明实施例:
[0044] (1)先统计各个指标在所有事务中的支持度计数,再对各个指标按照支持度计数 的大小进行排序,然后按照预先设定的最小支持度阈值minsup移走非频繁指标,也即,在 s(A-B)彡minsup时,形成频繁1-项集Ll。如果Ll为0,则停止;如果Ll不为0,则执 行⑵。
[0045] (2)由频繁1-项集Ll进行组合(即进行连接)形成候选2-项集C2,扫描所有 2_项集,找出支持度计数满足最小支持度阈值的2-项集,即频繁2-项集L2。如果L2为0 为,则停止;如果L2不为0,则执行(3)。
[0046] (3)根据(2),按照递归方式,找出频繁(k-1)项集Lk-1,k多2 ;并找出任两个有 (k-2)项集相同的频繁(k-l)_项集,组合成k-项集;判断所找出的k-项集其所有包括的 (k-l)_项集之子集是否都出现在频繁(k-1)项集Lk-I中,假如是,则保留此k-项集合,否 则就删除(即剪枝)。
[0047] (4)检查(3)所得出的k-项集,如果满足最小支持度阈值,则生成频繁k-项集Lk, 否则就删除(即剪枝)。
[0048] (5)转(3),找出频繁
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1