本发明属于多目标演化算法领域,涉及一种基于生成对抗网络的增强多样性的多目标演化方法。
背景技术:
1、多目标演化算法通过模拟自然界中的进化过程,结合交叉和变异等操作对种群进行更新迭代,进而使后代解逐步逼近帕累托前沿,这些过程通常计算成本较高并且由于交叉和突变操作的随机和无规则性,特别是当目标和决策变量数量增加时,常规算法通常无法取得很好的效果。特别是常见的多目标演化算法包括nsga-ii(non-dominated sortinggenetic algorithm ii)、spea2(strength pareto evolutionary algorithm 2)等。这些算法在处理小规模多目标演化问题时表现优秀,但是当决策变量或者目标函数增加时,常规的多目标演化算法常常会出现多样性不足、收敛速度变慢、对一些问题的适应性变差等问题。
2、生成对抗网络是一种通过两个神经网络相互博弈的方式进行学习的生成模型,能够在不使用标注数据的情况下来进行生成任务的学习,其在图像生成、文本生成和数据增强等方向有很多的应用。weihua qian等人发表的“a synergistic moea algorithm withgans for complex data analysis”中提出的基于生成对抗网络的多目标演化算法中生成对抗网络生成的解的多样性严重依赖于用于训练的数据的质量和网络的结果,如果生成对抗网络训练不充分或者用于训练的数据缺乏多样性,生成的解可能会出现多样性不足并无法充分覆盖整个帕累托前沿的问题。因此,研究一种有能力生成更具多样性候选解的基于生成对抗网络的多目标演化算法是有必要的。
技术实现思路
1、本发明的目标是对多目标演化算法进行改进,利用生成对抗网络能够针对性为多目标演化算法生成多样性候选解的优势,提高算法充分探索决策决策空间的能力。建立基于生成对抗网络的双存档演化算法,更好的对多样性种群进行筛选,使种群迭代过程在保证多样性的同时兼顾收敛性。
2、本发明的技术方案:
3、一种基于生成对抗网络的增强多样性的多目标演化方法,通过在生成对抗网络中引入更适合用于多目标演化算法的多样性损失函数,提高生成对抗网络为多目标演化算法所生成种群的多样性并充分探索决策空间。在多样性档案中引入k-means聚类算法,保证种群在决策空间中均匀分布。在收敛性档案中使用基于计算效率树的快速非支配排序方法(t-ens),加快其筛选高质量种群速度。在收敛性档案中引入基于生成对抗网络的多样性填充模块,使用此模块在高质量候选解中间进行填充候选解操作,使算法最终种群更加均匀的分布在帕累托前沿。
4、s1.构建基于生成对抗网络的候选解生成模块
5、s1.1初始化生成对抗网络
6、初始化生成器和鉴别器,设定网络参数和学习率;
7、s1.2定义新的损失函数
8、新的损失函数中的多样性损失函数通过计算每次迭代中生成样本中每个个体与均值向量的欧式距离的平均值来计算;
9、生成样本的均值向量计算公式为:
10、
11、其中,g(zi)为生成器生成的样本,n为生成样本的数量,zi为随机噪声向量;
12、生成样本中每个个体与均值向量之间的欧氏距离的平均值计算公式为:
13、
14、为了保证生成对抗网络的基础功能,多样性损失函数还应加入常规损失函数其中,d(x)代表鉴别器真实样本x为真的概率,g(z)是生成器根据噪声z生成的样本,d(g(z))是鉴别器判断生成器生成的样本为真实的概率;
15、算法多样性损失函数为:
16、
17、其中,λdiv表示多样性损失函数的权重;
18、s1.3生成候选解
19、输入一批非支配解作为训练样本,生成器根据所设置参数和训练样本生成一批候选解;
20、s1.4鉴别器进行鉴别
21、鉴别器对上一步所生成的候选解进行鉴别,并将鉴别结果和多样性损失函数的梯度反向传播给生成器和鉴别器;
22、s1.4优化并训练
23、生成器和鉴别器根据反向传播来的鉴别结果和多样性损失函数梯度来进行参数的更新,使生成的候选解更具多样性;
24、s1.5输出多样化候选解
25、使用优化过的生成器生成多样化的候选解集合,并将其传递给多样性档案更新模块进行进一步处理;
26、s2.构建多样性档案更新模块
27、s2.1聚类筛选
28、使用k-means聚类方法将生成对抗网络生成的多样化的候选解集合分成k个簇,取每个簇中距离簇中心点最近的解作为中心解,将这些中心解组成新的种群;
29、s2.2更新多样性档案
30、将新的种群加入到多样性档案中;
31、s2.3输出多样性档案种群
32、将多样性档案中的种群传递给收敛性档案更新模块进行进一步处理;
33、s3.构建收敛性档案更新模块
34、s3.1快速非支配排序
35、初始化一个t-ens树,将多样性档案中的每个个体逐个插入t-ens树中,利用t-ens树的结构来保存种群中的支配关系,以此来实现种群的快速非支配排序;
36、s3.2更新收敛性档案
37、在t-ens树中查找未被任何解支配的个体,将其加入到收敛性档案中;
38、s3.3多样性填充
39、提取收敛性档案中的每个解在被生成对抗网络生成时所使用的噪声变量,在每两个使用不同噪声变量的解之间进行填充操作,此操作通过取两个解的噪声变量的均值来实现;他们之间的用于填充解的噪声计算公式为:
40、
41、其中,zi和zj分别是生成解xi和xj的噪声变量;在两个解之间的填充流程中,噪声变量zij将被输入进生成器中,而生成器将生成分布在两个解之间的候选种群,从而达到在xi和xj之间填充解的目的;
42、生成对抗网络根据用于填充解的噪声zij在收敛性档案中现有高质量解之间生成填充解。填充解操作效果如图3所示。
43、s3.4填充解筛选
44、填充解筛选基于总距离的大小,总距离代表填充解与它的两个父代解距离之和的大小,筛选流程将保留总距离最小的填充解并将其保存到收敛性档案中,总距离计算公式如下:
45、dis(c)=∥φ(c)-φ(xi)∥2+∥φ(c)-φ(xj)∥2
46、其中,c代表所生成的填充解,xi和xj代表两个父代解,φ(c)是填充解c在特征空间的表示,φ(xi)和φ(xj)是两个父代解在特征空间的表示;∥·∥2表示l2范数的欧氏距离;
47、如图4所示描述的是对两个解之间所生成的填充解进行筛选的过程。在这个过程中,将比对在两个父代解之间每个填充解的总距离大小。
48、筛选出所有填充解中总距离最小的的个体并将其加入收敛性档案中。
49、s3.5.判断迭代次数是否达到设定值,当达到设定值算法将使用收敛性档案种群作为输出结果,未达到设定值时,算法将从s1.5开始进行下次迭代。
50、本发明的有益效果:
51、本算法基于生成对抗网络生成多样化候选解,通过在生成对抗网络中加入基于欧氏距离的多样性损失函数来增强所生成候选解的多样性。改善了传统的基于遗传算法生成后代解的无规律性的特点,本发明所设计的基于生成对抗网络的候选解生成模块以多样性为导向,能够更具针对性的为算法中的多样性档案提供多样性候选解提高算法探索高维决策空间的能力。
52、算法在多样性档案中使用k-means算法来筛选和更新多样性档案,能快速得到在目标决策空间中均匀分布的种群,提高所生成的种群充分探索整个决策空间的能力,能够使多样性档案中的种群更加科学和快速的更新至多样且均匀分布。
53、本发明中在收敛性存档中使用了比较次数更少时间效率更低的基于计算效率树的非支配排序方法。弥补了传统的多目标演化算法通过传统非支配排序效率过低的缺点,降低了收敛性档案收敛过程的时间复杂度。
54、在收敛性档案更新完成后算法中提出了基于生成生成对抗网络的多样性填充模块,进一步在高质量解之间填充解,能够使最终种群在帕累托前沿更加均匀的分布,在算法收敛完成之后进一步更具针对性的保证了种群的多样性。