本发明实施例涉及多场景多目标问题优化领域,尤其涉及一种多场景多目标问题优化方法、装置、电子设备及存储介质。
背景技术:
1、传统的多目标优化问题(mops)同时优化多个相互矛盾的目标。通常情况下,提升一个目标的性能可能导致其他目标性能降低。因此,多目标优化问题的最优解是一组pareto解而不是一个单独的解。演化算法的显著特性是在一次运行中产生多个解(种群),因此,它在求解mops时具有天然的优势。近些年,演化算法已经成为优化mops最普遍的方法,为解决各种mops的变体以及偏好,大量演化多目标算法被提出来。
2、多场景多目标优化问题(msmos)起源于工业界的设计问题。当一个多目标优化问题被评估(加载)在不同的场景(视角)时,单一场景的评估模式转为了多场景的评估模式。多场景多目标优化问题是一个新兴的范例,随着工程或设计趋向大规模化和系统化,其受到越来越多的关注。
3、不同于mops找到一组折衷解。msmos需要同时关注两个折衷,一个是解集如何满足单个场景的收敛性和分布性,另外一个是解集如何考虑场景之间的均衡。两个折衷需要同时满足,因此,传统的支配原则已不能适应。
技术实现思路
1、鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种多场景多目标问题优化方法、装置、电子设备及存储介质。
2、第一方面,本发明实施例提供一种多场景多目标问题优化方法,包括:
3、将待优化的多场景多目标问题分解为多个多目标优化问题,且每个多目标优化问题都与一个基学习器相关;
4、采用集成策略组合多个基学习器并构建一个强学习器;
5、基于预先设计的自适应双调整策略对所述强学习器进行优化;
6、基于预先设计的微调策略继续对优化后的强学习器的种群的分布进行优化,以增加种群的进化动力;
7、基于预设的综合性能指标根据多场景的要求对优化后的强学习期做改进,归一化所有种群的适应值。
8、在一个可能的实施方式中,所述方法还包括:
9、初始化k个子种群,记为pi,i=1,…,k,k为场景数,每个子种群都有n个个体,设t=1;
10、对pi进行交配选择生成p'i,p'i变异生成qi,p'i与qi合并为ci,对ci进行环境选择生成新的pi,同时t+1;
11、如果r对t取余为0,则将所有的子种群合并,然后对其进行学习器组合,生成p,将新生成的p赋给pi。
12、在一个可能的实施方式中,所述方法还包括:
13、评估每个场景下的子种群,并计算其hvms值;
14、基于所述hvms值,去掉改进最小的子种群;
15、应用非支配排序分析种群p中的每一个个体,得到每一个个体的等级;
16、通过基于情景的支配和所述非支配排序的等级确定每一个个体的层级;
17、基于每一个个体的层级重新选择产生种群p。
18、在一个可能的实施方式中,所述方法还包括:
19、初始化所述种群p以及一组权重向量w=(w1,…,wn),并随机分配种群和权重向量的对应关系;
20、基于欧式距离,构建所有个体的邻居集b;
21、根据环境选择算法循环迭代,生成后代种群q;
22、通过环境选择算法,从合并种群p中选择目标个体;
23、基于周期参数调整权重向量并微调种群得到最终种群p。
24、在一个可能的实施方式中,所述方法还包括:
25、将所述后代种群q的整个目标空间划分为多个子区域,每个子区域含有一个子问题;
26、当每个子区域的关联后代非空时,为每个子区域确定一个目标解;
27、利用进化信息为每个标量函数确定合适的p值。
28、在一个可能的实施方式中,所述方法还包括:
29、通过信息聚合函数计算每个权重向量的价值value;
30、按降序排列value并分配等级;
31、判断权重向量中的每个向量,生成新向量以更新权重向量,并更新种群和邻域集。
32、在一个可能的实施方式中,所述方法还包括:
33、计算权向量中每个向量与新生成向量的夹角和其对应解之间的夹角;
34、通过判断两夹角的大小构建两个解之间的虚拟方向向量;
35、基于所述两个解之间的虚拟方向向量计算生成新解,根据新解生成新的种群;
36、通过联合种群和权重向量获得一个子区域集;
37、如果子区域集的个数小于预设阈值,则通过计算生成解,然后生成新的种群。
38、第二方面,本发明实施例提供一种多场景多目标问题优化装置,包括:
39、分解模块,用于将待优化的多场景多目标问题分解为多个多目标优化问题,且每个多目标优化问题都与一个基学习器相关;
40、构建模块,用于采用集成策略组合多个基学习器并构建一个强学习器;
41、优化模块,用于基于预先设计的自适应双调整策略对所述强学习器进行优化;
42、所述优化模块,还用于基于预先设计的微调策略继续对优化后的强学习器的种群的分布进行优化,以增加种群的进化动力;
43、所述优化模块,还用于基于预设的综合性能指标根据多场景的要求对优化后的强学习期做改进,归一化所有种群的适应值。
44、第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的多场景多目标问题优化程序,以实现上述第一方面中所述的多场景多目标问题优化方法。
45、第四方面,本发明实施例提供一种存储介质,包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中所述的多场景多目标问题优化方法。
46、本发明实施例提供的多场景多目标问题优化方案,通过将待优化的多场景多目标问题分解为多个多目标优化问题,且每个多目标优化问题都与一个基学习器相关;采用集成策略组合多个基学习器并构建一个强学习器;基于预先设计的自适应双调整策略对所述强学习器进行优化;基于预先设计的微调策略继续对优化后的强学习器的种群的分布进行优化,以增加种群的进化动力;基于预设的综合性能指标根据多场景的要求对优化后的强学习期做改进,归一化所有种群的适应值。相比于传统的支配原则不能适应多场景多目标优化问题,由本方案采用集成学习组合多个moeas,提出一种基于集成学习的多场景多目标优化框架mlsel,进一步根据基学习器的类型衍生出两个强学器来求解多场景多目标优化问题:同质强学习器msel-deadas采用了提出的多目标算法deadas;异质强学习器meel-moea采用了多个不同类型的moeas,能够适应多场景多目标优化问题。
1.一种多场景多目标问题优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将待优化的多场景多目标问题分解为多个多目标优化问题,包括:
3.根据权利要求1所述的方法,其特征在于,所述采用集成策略组合多个基学习器并构建一个强学习器,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于预先设计的自适应双调整策略对所述强学习器进行优化,包括:
5.根据权利要求4所述的方法,其特征在于,所述通过环境选择算法,从合并种群p中选择目标个体,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于周期参数调整权重向量并微调种群得到最终种群p,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于预先设计的微调策略继续对优化后的强学习器的种群的分布进行优化,以增加种群的进化动力,包括:
8.一种多场景多目标问题优化装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的多场景多目标问题优化程序,以实现权利要求1~7中任一项所述的多场景多目标问题优化方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一项所述的多场景多目标问题优化方法。