本发明涉及数据处理,尤其是用于电力工程项目全过程管理的数据文件分析处理方法。
背景技术:
1、文件处理是运用计算机对各类信息进行综合处理,其范围包括:(1)计算机储存行政管理纪录和其他有关信息(数据、文字、图表等);(2)用计算机把大量数据、文字、图表等信息进行编辑加工,形成文件。对于电力工程项目的全过程,会产生大量的数据文件,现有技术对于数据文件的分析处理方法较为繁琐,极易影响数据分析的效率与准确率。
技术实现思路
1、本发明的目的是通过提出用于电力工程项目全过程管理的数据文件分析处理方法,以解决上述背景技术中提出的缺陷。
2、本发明采用的技术方案如下:
3、提供用于电力工程项目全过程管理的数据文件分析处理方法,包括如下步骤:
4、s1:采集电力工程项目全过程数据文件并进行标准化处理;
5、s2:基于数据挖掘算法对采集的数据文件进行挖掘分析;
6、s3:基于改进的人工蜂群算法优化的分类函数对挖掘分析的数据文件进行分类处理;
7、s4:基于分类处理结果生成电力工程项目全过程数据的可视化结果。
8、作为本发明的一种优选技术方案:所述s1中的标准化处理包括对数据文件的文件格式的标准化处理、对文件编码方式的标准化处理和对文件数据类型的标准化处理。
9、作为本发明的一种优选技术方案:所述s2中,所述数据挖掘算法具体如下:
10、设电力工程项目全过程数据文件来自一个超级种群,由有限数量的集群按权重比例分别组成的数据文件,为第个数据文件的权重参数,其中:
11、
12、将超级种群进行多变量正态分布,其中为数据的个数:
13、
14、
15、
16、
17、其中,表示由数据文件产生数据的概率,为数据文件的均值向量,为数据文件的协方差矩阵,、和分别为权重参数、均值向量和协方差矩阵第次迭代时的值,为数学常量,表示数据的转置。
18、作为本发明的一种优选技术方案:所述数据挖掘算法基于迭代值进行数据的多变量正态分布的重复计算直至收敛。
19、作为本发明的一种优选技术方案:所述数据挖掘算法基于判别函数进行数据的挖掘分类:
20、
21、其中,为判别函数,、为数据的均值向量和协方差矩阵。
22、作为本发明的一种优选技术方案:所述s3中,基于所述s2的挖掘分析获取电力工程项目全过程数据,其中,,表示数据包含类数据,构建由个二分类器构成的有向无环图结构对数据进行分类。
23、作为本发明的一种优选技术方案:所述二分类器具体如下:
24、
25、其中,为分类函数,为拉格朗日乘子,为数据的类别标签,为核函数,用于代替内积,为分布参数。
26、作为本发明的一种优选技术方案:所述分类函数中,基于改进的人工蜂群算法进行拉格朗日乘子的寻优,获取最优分类器函数进行电力工程项目全过程数据的分类。
27、作为本发明的一种优选技术方案:所述改进的人工蜂群算法具体如下:
28、设置分类函数的误差函数的倒数为适应度函数,种群初始化阶段,设食物源的数量为,则引领蜂的数量也为,解的维度为,引领蜂初始种群按照下式生成:
29、
30、其中,表示第只引领蜂第个维度的位置,、分别为第个维度的蜂群位置的上限和下限,为之间的随机数;
31、引领蜂阶段,每次迭代每个引领蜂通过下式进行邻域搜索:
32、
33、其中,为经过领域搜索获得的新的候选解,表示第只引领蜂第个维度的位置,为之间的随机数;
34、计算与的适应度并进行评价,择优选择进入下一次迭代;
35、跟随蜂阶段:
36、随机选取两个引领蜂分享的路径信息,基于两条新路径的适应度大小,采用自适应交叉的方法,与上一代对应的跟随蜂比较,并进行贪婪选择;
37、
38、其中,为交叉概率,为经过自适应选择的交叉概率,、分别为最大交叉概率和最小交叉概率,为适应度平均值,为第只引领蜂的适应度值,、分别为适应度最大值和最小值;
39、侦查蜂阶段:如果第个食物源经过最大次数进行迭代仍然没有被更新,则判断该解陷入局部最优,则舍弃该食物源,引领蜂变为侦查蜂,则根据初始种群生成算法重新产生一个新解代替原来的解;判定是否满足收敛条件,满足则输出最优解,否则返回重新根据引领蜂位置进行邻域搜索直至满足收敛条件。
40、作为本发明的一种优选技术方案:所述s4中的可视化结果为电力工程项目全过程数据的图表文件。
41、本发明提供的用于电力工程项目全过程管理的数据文件分析处理方法,与现有技术相比,其有益效果有:
42、本发明通过对电力工程项目全过程管理的数据文件进行挖掘分析,挖掘获取隐含数据,提升数据的表征能力,提升数据分析的准确度,基于由多个二分类器构成的有向无环图结构进行数据的分类,能够极大地提高扩展性,提升数据的分类效率与准确率,同时通过改进的人工蜂群算法对二分类器函数进行寻优,能够保证分类的效率与准确率。
1.用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述s1中的标准化处理包括对数据文件的文件格式的标准化处理、对文件编码方式的标准化处理和对文件数据类型的标准化处理。
3.根据权利要求1所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述s2中,所述数据挖掘算法具体如下:
4.根据权利要求3所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述数据挖掘算法基于迭代值进行数据的多变量正态分布的重复计算直至收敛。
5.根据权利要求4所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述数据挖掘算法基于判别函数进行数据的挖掘分类:
6.根据权利要求5所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述s3中,基于所述s2的挖掘分析获取电力工程项目全过程数据,其中,,表示数据包含类数据,构建由个二分类器构成的有向无环图结构对数据进行分类。
7.根据权利要求6所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述二分类器具体如下:
8.根据权利要求7所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述分类函数中,基于改进的人工蜂群算法进行拉格朗日乘子的寻优,获取最优分类器函数进行电力工程项目全过程数据的分类。
9.根据权利要求8所述的用于电力工程项目全过程管理的数据文件分析处理方法,其特征在于:所述改进的人工蜂群算法具体如下: