本发明涉及人工智能,具体是一种面向金属有机框架材料吸附性能的预测方法。
背景技术:
1、分子吸附性能预测人工智能辅助mofs材料设计流程中关键的任务之一,通过提取mof分子的特征信息,对吸附性质做出预测,从而使人们能够在候选mofs材料库中找到符合预期性质的mofs材料,这对于加快mofs材料的筛选和设计速度,具有重要的研究意义。
2、传统的基于密度泛函理论(density functional theory,dft)的量子化学方法能够精确预测多种分子的包括吸附性质在内的不同性质,但需要巨大的时间成本和计算功耗,数个小时才能完成单个分子的计算,另外,候选化合物数量往往较为庞大,人们难以在短时间内完成分子性质预测。近期许多研究者采取将分子视为图数据的方式,结合深度学习方法来完成分子性质预测任务,由于神经网络的前向传播耗时极短,因此其计算耗时远远小于dft等传统的量子化学计算方法。目前,基于深度学习方法设计的分子性质预测模型仅考虑以分子的结构信息,研究表明,分子的特异性特征信息同样是决定分子性质的重要因素,但现有方法忽视了这一特征信息。
技术实现思路
1、为解决现有技术的不足,本发明在考虑分子结构信息的同时引入目前方法所忽略的分子特异性特征信息,并提供一种端到端的面向金属有机框架(mofs)材料吸附性能的高精度预测方法。
2、本发明为实现上述目的所采用的技术方案是:
3、一种面向金属有机框架材料吸附性能的预测方法,通过如下步骤获取面向材料吸附性能的预测模型,用于预测分子的吸附性质,所述方法包括以下步骤:
4、s1建立训练样本数据集:{分子结构数据,吸附性能标签},所述分子结构数据包括以原子为节点、原子间化学键为边的图结构数据及其属性;
5、s2搭建图同构网络并训练:建立提取分子图结构特征的结构信息提取网络、提取分子图形貌特征的分子特异性信息提取模型,融合二者特征输出;以样本集数据为输入,以所述训练样本的融合特征得到的预测吸附性能和训练样本的吸附性能标签的残差作为指标,进行训练优化图同构网络的模型参数,得到影响吸附性能的融合分子特征;
6、s3搭建分子性质预测网络并训练:建立极限梯度boosting模型,以所述样本数据集的融合分子特征进行预测训练、根据输出的所述样本的预测性质和所述性质标签,反向调整模型参数,得到所述训练样本的预测性质。
7、所述节点属性包括以下至少一种:原子序数、原子直径、自由电子数、原子位置,所述边的属性包括以下至少一种:原子键种类、键长、键角、扭转角、是否为环状结构。
8、所述吸附性能标签为吸附性质数据;所述吸附性质数据为计算的mofs分子在设定环境条件下对待预测分子co2、n2和ch4的吸附数据。
9、所述训练样本筛选自开源数据集,过滤受限孔直径小以及结构重复的mofs分子,按比例分为训练集、验证集以及测试集。
10、所述的结构信息提取网络为处理图数据的神经网络,将所述的分子图结构数据映射为低维空间的特征向量,以捕获图的拓扑结构、节点间关系以及关于图、子图和顶点的相关信息,将获取到的特征向量作为分子图结构特征。
11、所述的结构信息提取网络采用图卷积神经网络、图同构神经网络或图注意神经网络中的一种。
12、所述的分子特异性信息提取模型为处理分子全局特征的机器学习模型,用于将所述的分子特异性信息映射为低维空间的特征向量,以获取分子特异性信息中晶体的晶胞参数、温度、压强、分子大小作为分子图补充特征。
13、所述融合所述的分子图结构特征和所述的分子图补充特征的方式为拼接、相加或注意力加权,通过特征融合获取同时具有分子图结构信息和分子图补充信息的特征向量,作为融合分子特征。
14、所述图同构网络的迭代训练包括以下步骤:
15、初始化权重参数,得到所述的预测吸附性能,利用预测吸附性能和吸附性能标签的残差计算损失函数,其中,所述的损失函数包括均方差损失;
16、根据计算得到的损失函数值利用梯度反向传播算法对模型参数进行更新,其中,所述模型包括分子图结构特征提取网络、分子图补充特征提取网络;
17、重复以上步骤,直至验证集损失低于预设值,停止模型参数更新,作为图同构网络的特征提取模型。
18、所述分子性质预测网络的训练包括以下步骤:
19、初始化权重参数,得到所述的预测吸附性能,利用预测吸附性能和吸附性能标签的残差计算损失函数,其中,所述的损失函数包括均方差损失;
20、根据计算得到的损失函数值利用梯度反向传播算法对模型参数进行更新,其中,所述模型包括吸附性能预测模型;
21、重复以上步骤,直至验证集损失低于预设值,停止模型参数更新,作为最终模型。
22、与现有技术相比,本发明有益效果体现在:
23、本发明融合分子的结构特征信息和形貌特征信息,并结合神经网络提取分析,将深度学习应用于分子吸附性能预测,从而加快材料分子的筛选和设计速度。具体是:该方法从分子图中学习mofs材料的结构特征表示,包括原子性质、三维原子坐标、价电子、化学键等,以及从晶胞参数、吸附分子直径、温度、压力等分子特异性参数中提取的特征表示,以形成一组相对全面的特征群,并最大程度减少来自研究人员个人经验的影响。在此基础上,在模型训练阶段使用极限梯度boosting与图同构网络相结合的学习策略,在保证特征提取的完整性的基础上,准确拟合特征组与mofs材料对co2、ch4和n2的吸附性能之间的关系直接从mofs材料的结构到吸附性能实现端到端的预测,而且可以保证预测结果的准确度。
1.一种面向金属有机框架材料吸附性能的预测方法,其特征在于,通过如下步骤获取面向材料吸附性能的预测模型,用于预测分子的吸附性质,所述方法包括以下步骤:
2.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述节点属性包括以下至少一种:原子序数、原子直径、自由电子数、原子位置,所述边的属性包括以下至少一种:原子键种类、键长、键角、扭转角、是否为环状结构。
3.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述吸附性能标签为吸附性质数据;所述吸附性质数据为计算的mofs分子在设定环境条件下对待预测分子co2、n2和ch4的吸附数据。
4.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述训练样本筛选自开源数据集,过滤受限孔直径小以及结构重复的mofs分子,按比例分为训练集、验证集以及测试集。
5.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述的结构信息提取网络为处理图数据的神经网络,将所述的分子图结构数据映射为低维空间的特征向量,以捕获图的拓扑结构、节点间关系以及关于图、子图和顶点的相关信息,将获取到的特征向量作为分子图结构特征。
6.根据权利要求5所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述的结构信息提取网络采用图卷积神经网络、图同构神经网络或图注意神经网络中的一种。
7.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述的分子特异性信息提取模型为处理分子全局特征的机器学习模型,用于将所述的分子特异性信息映射为低维空间的特征向量,以获取分子特异性信息中晶体的晶胞参数、温度、压强、分子大小作为分子图补充特征。
8.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述融合所述的分子图结构特征和所述的分子图补充特征的方式为拼接、相加或注意力加权,通过特征融合获取同时具有分子图结构信息和分子图补充信息的特征向量,作为融合分子特征。
9.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述图同构网络的迭代训练包括以下步骤:
10.根据权利要求1所述的一种面向金属有机框架材料吸附性能的预测方法,其特征在于,所述分子性质预测网络的训练包括以下步骤: