本技术涉及计算机,具体而言,涉及一种缓蚀剂的确认方法和装置。
背景技术:
1、腐蚀是金属材料和结构破坏的主要原因之一,在世界范围内造成巨大的经济损失。缓蚀剂是抑制金属腐蚀的一种有效方法,具有成本低、操作简单、效率高等优点。目前,在选择缓蚀剂时需要进行大量的实验,从而导致缓蚀剂的选择效率相对较低。
技术实现思路
1、有鉴于此,本技术实施例提供了一种缓蚀剂的确认方法和装置,以提高选择缓蚀剂时的选择效率。
2、第一方面,本技术实施例提供了一种缓蚀剂的确认方法,所述方法包括:
3、在获取到若干缓蚀剂的缓蚀数据后,对于每个缓蚀数据,根据该缓蚀数据中的缓蚀剂分子结构smiles格式,将所述缓蚀剂分子结构smiles格式中包括的各非氢原子作为读取开始,按照所述缓蚀剂分子结构smiles格式中包括的分子连接关系进行读取,得到多个增强smiles格式,所述增强smiles格式和所述缓蚀剂分子结构smiles格式为同一缓蚀剂分子的不同smiles格式,该缓蚀数据还包括:腐蚀介质数据、被缓蚀金属、缓蚀温度、缓蚀效率和缓蚀剂浓度;
4、对于任一增强smiles格式,将该增强smiles格式和该缓蚀数据中的其他数据进行组合,得到扩展数据,以将所述扩展数据和该缓蚀数据作为缓蚀样本数据;
5、在得到所有缓蚀数据对应的缓蚀样本数据后,对于每个缓蚀样本数据,将该缓蚀样本数据对应的特征向量和用于使所有缓蚀样本数据保持正态分布的噪声向量输入到条件对抗生成网络中的生成器中,得到第一缓蚀剂分子结构smiles格式对应的第一特征向量,其中,每个缓蚀样本数据对应的噪声向量是随机生成的;
6、将所述第一特征向量和该缓蚀样本数据中包括的第二缓蚀剂分子结构smiles格式对应的第二特征向量输入到条件对抗生成网络中的判别器中,利用如下公式计算目标函数值:
7、
8、其中,g表示所述生成器,d表示所述判别器,lcgan为对抗损失,llc为第一特征向量和第二特征向量的摩根相似性,λ为llc的预设系数;
9、判断所述目标函数值是否小于为所述目标函数值设定的设定函数值;如果所述目标函数值大于或等于所述设定函数值,则按照反向梯度传播算法对所述生成器中的可调参数进行调节,直至得到的目标函数值小于所述设定函数值为止,其中,第一次得到的目标函数值对应的设定函数值为预设的初始函数值,第一次之后得到的目标函数值对应的设定函数值为上一次得到的目标函数值;
10、在得到训练好的生成器后,将目标数据输入到训练好的生成器中,得到第三缓蚀剂分子结构smiles格式对应的第三特征向量,以将所述第三特征向量对应的缓蚀剂作为缓蚀效率最高的缓蚀剂,其中,所述目标数据包括:目标腐蚀介质数据、目标被缓蚀金属、目标缓蚀温度、目标缓蚀效率和目标缓蚀剂浓度。
11、在一个可行的实施方案中,所述腐蚀介质数据包括:腐蚀介质、腐蚀介质种类和腐蚀介质浓度;
12、腐蚀介质包括:硫酸、氯化氢或氯化钠;
13、腐蚀介质种类包括:酸、碱或盐。
14、在一个可行的实施方案中,所述方法还包括:
15、在得到所有缓蚀数据对应的缓蚀样本数据后,对于每个缓蚀样本数据,对该缓蚀样本数据中的缓蚀剂分子结构smiles格式按照设定的指纹半径进行摩根指纹转换,得到摩根指纹向量;
16、对该缓蚀样本数据中的数值型数据进行归一化处理,得到归一化特征向量,其中,归一化特征向量的取值范围为[0,1];
17、对于该缓蚀样本数据中的其他数据,对该其他数据的数据属性进行赋值,得到赋值向量;
18、将所述摩根指纹向量、所属归一化特征向量和所述赋值向量拼接在一起得到拼接向量,以将所述拼接向量作为该缓蚀样本数据对应的特征向量。
19、在一个可行的实施方案中,利用如下公式得到lcgan(g,d):
20、lcgan(g,d)=ex,y[logd(x,y)+ex,z[log(1-d(x,g(x,z)))];
21、其中,e表示求平均值,x为所述第二特征向量,y为所述第一特征向量,z为所述噪声向量。
22、在一个可行的实施方案中,利用如下公式得到llc(g):
23、
24、其中,“&”表示与操作,“|”表示或操作。
25、在一个可行的实施方案中,在得到所有缓蚀数据对应的缓蚀样本数据后,使用温度采样的方式选择输入到生成器中的缓蚀样本数据。
26、第二方面,本技术实施例提供一种缓蚀剂的确认装置,所述装置包括:
27、增强单元,用于在获取到若干缓蚀剂的缓蚀数据后,对于每个缓蚀数据,根据该缓蚀数据中的缓蚀剂分子结构smiles格式,将所述缓蚀剂分子结构smiles格式中包括的各非氢原子作为读取开始,按照所述缓蚀剂分子结构smiles格式中包括的分子连接关系进行读取,得到多个增强smiles格式,所述增强smiles格式和所述缓蚀剂分子结构smiles格式为同一缓蚀剂分子的不同smiles格式,该缓蚀数据还包括:腐蚀腐蚀介质数据、被缓蚀金属、缓蚀温度、缓蚀效率和缓蚀剂浓度;
28、组合单元,用于对于任一增强smiles格式,将该增强smiles格式和该缓蚀数据中的其他数据进行组合,得到扩展数据,以将所述扩展数据和该缓蚀数据作为缓蚀样本数据;
29、生成单元,用于在得到所有缓蚀数据对应的缓蚀样本数据后,对于每个缓蚀样本数据,将该缓蚀样本数据对应的特征向量和用于使所有缓蚀样本数据保持正态分布的噪声向量输入到条件对抗生成网络中的生成器中,得到第一缓蚀剂分子结构smiles格式对应的第一特征向量,其中,每个缓蚀样本数据对应的噪声向量是随机生成的;
30、计算单元,用于将所述第一特征向量和该缓蚀样本数据中包括的第二缓蚀剂分子结构smiles格式对应的第二特征向量输入到条件对抗生成网络中的判别器中,利用如下公式计算目标函数值:
31、
32、其中,g表示所述生成器,d表示所述判别器,lcgan为对抗损失,llc为第一特征向量和第二特征向量的摩根相似性,λ为llc的预设系数;
33、训练单元,用于判断所述目标函数值是否小于为所述目标函数值设定的设定函数值;如果所述目标函数值大于或等于所述设定函数值,则按照反向梯度传播算法对所述生成器中的可调参数进行调节,直至得到的目标函数值小于所述设定函数值为止,其中,第一次得到的目标函数值对应的设定函数值为预设的初始函数值,第一次之后得到的目标函数值对应的设定函数值为上一次得到的目标函数值;
34、生成单元,用于在得到训练好的生成器后,将目标数据输入到训练好的生成器中,得到第三缓蚀剂分子结构smiles格式对应的第三特征向量,以将所述第三特征向量对应的缓蚀剂作为缓蚀效率最高的缓蚀剂,其中,所述目标数据包括:目标腐蚀介质数据、目标被缓蚀金属、目标缓蚀温度、目标缓蚀效率和目标缓蚀剂浓度。
35、在一个可行的实施方案中,所述腐蚀介质数据包括:腐蚀介质、腐蚀介质种类和腐蚀介质浓度;
36、腐蚀介质包括:硫酸、氯化氢或氯化钠;
37、腐蚀介质种类包括:酸、碱或盐。
38、在一个可行的实施方案中,所述装置还包括:
39、处理单元,用于在得到所有缓蚀数据对应的缓蚀样本数据后,对于每个缓蚀样本数据,对该缓蚀样本数据中的缓蚀剂分子结构smiles格式按照设定的指纹半径进行摩根指纹转换,得到摩根指纹向量;以及,用于对该缓蚀样本数据中的数值型数据进行归一化处理,得到归一化特征向量,其中,归一化特征向量的取值范围为[0,1];以及,用于对于该缓蚀样本数据中的其他数据,对该其他数据的数据属性进行赋值,得到赋值向量;以及,用于将所述摩根指纹向量、所属归一化特征向量和所述赋值向量拼接在一起得到拼接向量,以将所述拼接向量作为该缓蚀样本数据对应的特征向量。
40、在一个可行的实施方案中,所述计算单元利用如下公式得到lcgan(g,d):
41、lcgan(g,d)=ex,y[logd(x,y)+ex,z[log(1-d(x,g(x,z)))];
42、其中,e表示求平均值,x为所述第二特征向量,y为所述第一特征向量,z为所述噪声向量。
43、在一个可行的实施方案中,所述计算单元利用如下公式得到llc(g):
44、
45、其中,“&”表示与操作,“|”表示或操作。
46、在一个可行的实施方案中,在得到所有缓蚀数据对应的缓蚀样本数据后,使用温度采样的方式选择输入到生成器中的缓蚀样本数据。
47、本技术的实施例提供的技术方案可以包括以下有益效果:
48、在本技术中,先利用有限数量的缓蚀数据扩展成满足训练数量要求的缓蚀样本数据后,采用反向梯度传播算法使用缓蚀样本数据对生成器进行训练,在训练好生成器后,可以使用设定好的目标数据得到缓蚀剂,通过上述方法,在使用设定好的目标数据选择缓蚀剂时有利于提高缓蚀剂的选择效率。
49、为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。