本发明涉及数据处理,尤其涉及一种基于cpc环境选择法的时序特征提取方法及相关设备。
背景技术:
1、大量时序特征在工业大数据分析建模问题上具有共性,一条产线可能存在上千个特征点位,但并非所有特征都有用,这些特征中大部分可能是冗余和不相关的,通过传统相关性度量进行特征提取,无法避免出现特征子集中存在冗余信息,且遗失的数据之间存在时序特性的问题。
技术实现思路
1、有鉴于此,本发明实施例提供一种基于cpc环境选择法的时序特征提取方法及相关设备,以解决现有技术中无法避免出现特征子集中存在冗余信息,且遗失的数据之间存在时序特性的问题。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、本发明实施例第一方面示出了一种基于cpc环境选择法的时序特征提取方法,所述方法包括:
4、获取上一迭代次数下的种群和存档集;
5、基于所述存档集和种群进行处理,得到当前迭代次数下的子代种群;
6、基于收敛惩罚拥挤(convergence penalty crowding,cpc)的环境选择法对所述子代种群和种群进行处理,得到当前迭代次数下的种群;
7、计算所述存档集和子代种群中个体的双目标函数值,所述目标函数值包括基于时序序列相关度量计算的第一目标函数值,以及基于互信息计算的第二目标函数值;
8、基于所述存档集和子代种群中个体的双目标函数值从所述存档集和子代种群中更新存档集,得到当前迭代次数下的存档集;
9、在确定当前迭代次数到达预设次数时,对当前迭代次数下的存档集进行处理,得到目标特征子集。
10、可选的,所述计算所述存档集和子代种群中个体的双目标函数值,包括:
11、针对所述存档集和子代种群中的每一个体,确定所述个体中被选择特征子集和标签;
12、计算所述被选择特征子集中特征之间的时移序列相关度量;
13、计算所述被选择特征子集中特征与标签之间的时移序列相关度量;
14、基于所述被选择特征子集中特征之间的时移序列相关度量,以及所述被选择特征子集中特征与标签之间的时移序列相关度量进行计算,得到个体的第一目标函数值,所述第一函数值属于双目标函数值。
15、可选的,所述计算所述存档集和子代种群中个体的双目标函数值,包括:
16、针对所述存档集和子代种群中的每一个体,确定所述个体中被选择特征子集和非被选择特征子集;
17、对所述被选择特征子集中特征对之间的平均归一化互信息nmi进行计算,得到第一函数;
18、基于所述非被选择特征子集与所述选择特征子集计算第二函数;
19、根据所述第一函数和第二函数进行计算,得到个体的第二目标函数值,所述第二目标函数值属于双目标函数值。
20、可选的,还包括:
21、若上一迭代次数为第一次迭代时,基于所述工业大数据对应的特征集确定种群;
22、对所述种群进行编码处理,得到处理后的种群,所述处理后的种群中包括多个个体;
23、计算每一个体的双目标函数值;
24、基于所述双目标函数值对所述所有的个体进行处理,得到存档集;
25、基于所述存档集和种群进行处理,得到第一次迭代下的子代种群;
26、基于所述子代种群和种群进行处理,得到第一次迭代下的种群;
27、计算所述存档集和子代种群中个体的双目标函数值;
28、基于所述存档集和子代种群中个体的双目标函数值从所述存档集和子代种群中更新存档集,得到第一次迭代下的存档集;
29、将所述第一次迭代下的种群和存档集进行存储。
30、可选的,所述基于所述存档集和种群进行处理,得到当前迭代次数下的子代种群,包括:
31、计算所述存档集和种群的非支配比例;
32、若确定所述存档集的非支配比例大于所述种群的非支配比例,且确定所述存档集的非支配比例大于预设数值时,从所述存档集中选择二个个体作为父本;
33、若确定所述存档集的非支配比例大于所述种群的非支配比例,且确定所述存档集的非支配比例小于或等于预设数值时,从所述存档集中选择一个个体作为父本,且从所述种群中选择一个个体作为父本;
34、对所述父本进行进化操作,得到当前迭代次数下的子代种群。
35、可选的,所述基于cpc环境选择法对所述子代种群和种群进行处理,得到当前迭代次数下的种群,包括:
36、利用收敛惩罚拥挤cpc环境选择法计算所述种群和所述子代种群中个体对应的局部收敛值;
37、基于所述局部收敛值计算对应的拥挤度值;
38、基于所述拥挤度值更新所述种群,得到当前迭代次数下的种群。
39、可选的,所述基于所述存档集和子代种群中个体的双目标函数值从所述存档集和子代种群中更新存档集,得到当前迭代次数下的存档集,包括:
40、基于所述存档集和子代种群中个体的双目标函数值进行处理,得到非支配解集;
41、基于所述非支配解集确定目标空间欧式距离,以及决策空间欧式距离;
42、采用目标空间和决策空间的深度k-最近邻dknn算法对所述目标空间欧式距离和所述决策空间欧式距离进行计算,得到对应的dknn值;
43、基于所述dknn值更新所述存档集,得到当前迭代次数下的存档集。
44、本发明实施例第二方面示出了一种基于cpc环境选择法的时序特征提取装置,所述装置包括:
45、获取单元,用于获取上一迭代次数下的种群和存档集;
46、处理单元,用于基于所述存档集和种群进行处理,得到当前迭代次数下的子代种群;基于cpc环境选择法对所述子代种群和种群进行处理,得到当前迭代次数下的种群;计算所述存档集和子代种群中个体的双目标函数值,所述目标函数值包括基于时序序列相关度量计算的第一目标函数值,以及基于互信息计算的第二目标函数值;基于所述存档集和子代种群中个体的双目标函数值从所述存档集和子代种群中更新存档集,得到当前迭代次数下的存档集;在确定当前迭代次数到达预设次数时,对当前迭代次数下的存档集进行处理,得到目标特征子集。
47、本发明实施例第三方面示出了一种电子设备,所述电子设备用于运行程序,其中,所述程序运行时执行如本发明实施例第一方面示出的基于cpc环境选择法的时序特征提取方法。
48、本发明实施例第四方面示出了一种存储介质所述存储介质包括存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本发明实施例第一方面示出的基于cpc环境选择法的时序特征提取方法。
49、基于上述本发明实施例提供的一种基于cpc环境选择法的时序特征提取方法及相关设备,所述方法包括:获取上一迭代次数下的种群和存档集;基于所述存档集和种群进行处理,得到当前迭代次数下的子代种群;基于收敛惩罚拥挤cpc环境选择法对所述子代种群和种群进行处理,得到当前迭代次数下的种群;计算所述存档集和子代种群中个体的双目标函数值,所述目标函数值包括基于时序序列相关度量计算的第一目标函数值,以及基于互信息计算的第二目标函数值;基于所述存档集和子代种群中个体的双目标函数值从所述存档集和子代种群中更新存档集,得到当前迭代次数下的存档集;在确定当前迭代次数到达预设次数时,对当前迭代次数下的存档集进行处理,得到目标特征子集。在本发明实施例中,基于时移序列相关度量和互信息确定的双目标函数,能够避免特征子集中出现冗余信息,且能够充分提取时序特征数据样本中目标值和特征集之间存在时序规律与波动的相关性,从而解决传统相关性度量可能会遗失数据之间存在时序特性的问题。