一种基于深度卷积神经网络预测MOF对甲烷气体吸附性能的方法与流程

文档序号:22474694发布日期:2020-10-09 22:12阅读:758来源:国知局
一种基于深度卷积神经网络预测MOF对甲烷气体吸附性能的方法与流程
本发明属于功能材料智能预测
技术领域
,特别涉及一种基于深度卷积神经网络预测mof对甲烷气体吸附性能的方法。
背景技术
:金属有机框架(metal-organicframeworks),简称mofs,是由有机配体和金属离子或团簇通过配位键自组装形成的具有分子内孔隙的有机-无机杂化材料,属于配位聚合物类别。金属有机框架由三维周期网络组成,由分子构成构建块,如金属簇和有机连接体。这些众多的构建模块在不同拓扑结构下的可能组合结果是几乎无限数量的潜在mof。在mofs中,有机配体和金属离子或团簇的排列具有明显的方向性,可以形成不同的框架孔隙结构,从而表现出不同的吸附性能、光学性质、电磁学性质等。mofs在现代材料学方面呈现出巨大的发展潜力和诱人的发展前景。maryampardakhti等人分别用了金属有机框架的物理结构、化学结构以及物理和化学结构的组合作为输入,比较了决策树、泊松回归、支持向量机和随机森林方法的预测效果,得出了使用物理和化学的结构组合作为输入,使用随机森林算法的预测效果最好的结论。但是在实际应用中,能得到的金属有机框架是非常多的,它们的化学结构和一些物理结构需要通过计算、以及大量的实验得到,所以该方法在实际应用中也有一定的局限性。技术实现要素:针对上述现有技术中无法以cif文件中mof三维基础结构信息预测对甲烷气体的吸附值预测问题,本发明提供一种基于深度卷积神经网络(convolutionalneuralnetwork,cnn)预测mof对甲烷气体吸附性能的方法,用深度学习模型挖掘mof的基础空间结构中的特征信息相结合,通过对存储了mof的基础空间结构信息的cif文件进行特征提取,实现对甲烷吸附值的预测。技术方案如下:一种基于深度卷积神经网络预测mof对甲烷气体吸附性能的方法,包括以下步骤:1)数据预处理:对原始cif文件数据库进行扩充并且将cif文件中的mof基础三维结构转化成分类器能够接受的特征;2)使用卷积神经网络构建分类器,将mof对甲烷气体吸附能力划分区间对分类器进行迭代训练;3)将预处理后的数据输入训练后的分类器输出mof对甲烷的预测吸附值类别。进一步的,步骤1)的具体过程如下:将原始数据集按照吸附值的大小进行分类,并且随机划分成训练集和测试集,以数据量最多的一个类别为基准扩充其余类别中的数据;通过将cif文件中mof单一晶胞的围绕某一坐标轴旋转,旋转角度为垂直于此坐标轴的平面上的夹角角度,旋转之后得到mof晶胞边长发生了互换,反映到cif文件中即文件中的边a,b,c进行了互换,原子坐标也进行了改变,相应的a,b,c的夹角也发生了变化,从而得到基于同一结构的mof生成的多种cif文件,实现数据扩充。此外将数据存储的原子相对坐标转换为空间中的绝对坐标,统计所有mof文件中的原子绝对坐标大小,用最大最小归一化方法对原子绝对坐标进行归一化处理之后将归一化的mof晶胞坐标放大并得到xy面、xz面、yz面投影矩阵。进一步的,步骤2)中以卷积神经网络和残差块为基础构建分类器并进行迭代训练,最后用测试集测试得到分类效果最好的分类器,其中采用交叉熵函数作为分类器的损失函数,每个卷积层后都采用leakyrelu函数作为激活函数来防止过拟合。本发明所取得的有益效果:本发明的基于深度卷积神经网络预测mof对甲烷气体吸附性能的方法利用cif文件中的角度等信息对mof数据库实现数据扩充,使用卷积神经网络来提取mof存储于cif文件中的三维空间基础结构的特征,然后利用提取的特征进行分类器迭代训练,最后将训练好的分类器应用于mof对甲烷气体的预测吸附值。本发明可以更好地处理存储了mof的基础三维结构信息的cif文件,从cif文件中提取特征并以此特征能够得到的准确度更高的mof对甲烷的气体预测吸附性能。附图说明图1为本发明的mof对甲烷气体吸附性能的预测方法的流程图;图2是本发明的分类器得到的roc曲线;图3是现有技术中得到的roc曲线。具体实施方式为使本领域的技术人员更好地理解本发明的技术方案,下面结合实施例对本发明提供的基于深度卷积神经网络预测mof对甲烷气体吸附性能的方法进行详细描述。以下实施例仅用于说明本发明而非用于限制本发明的范围。步骤一、数据预处理:将原始数据集按照吸附值的大小分为五类,按照9:1的比例随机从五类中划分成训练集和测试集。之后以数据量最多的一个类别为基准扩充其余类别中的数据,cif文件中存储了mof单一晶胞的在三个坐标平面xy平面、xz平面、yz平面的三个夹角alpha、beta、gamma,以及mof单一晶胞中原子在晶胞中的相对原子坐标。由于旋转之后的晶胞还需要能够沿着x方向、y方向、z方向周期扩展,并且使生成的mof保持不变,因此不能按照任意角度进行旋转。按照cif文件中保存的alpha,beta,gamma或是其余角顺着x轴、y轴、z轴进行逆时针旋转或是顺时针旋转,这样旋转得到晶胞通过x方向、y方向、z方向周期扩展生成的mof与原mof结构一样,也就是其对于甲烷气体的吸附性能保持不变,而且cif文件中的边长、角度、坐标等信息都发生了改变,由此实现了对同一结构的mof生成了多种cif文件,也就是实现了对原始数据集的扩充。由于cif文件中存储的是mof中原子的相对坐标,数据扩充之后需将数据存储的原子相对坐标转换为空间中的绝对坐标上式中的x,y,z为得到原子绝对坐标,x’,y’,z’为的原子相对坐标,a,b,c为mof单一晶胞的三条边长,α,β,γ,为mof三条边的夹角。之后统计所有mof文件中的原子绝对坐标大小,对原子坐标进行归一化处理,归一化用最大最小归一化,之后将归一化的mof晶胞放置于100x100x100大小的空间中。上式中的xnew,ynew,znew为在100x100x100空间中的原子坐标,x,y,z为原子绝对坐标,xmax,ymax,zmax为所有数据中原子x,y,z的最大坐标值,xmin,ymin,zmin为所有数据中原子x,y,z的最小坐标值。最后把100x100x100空间中的mof分别向xy平面,yz平面,xz平面做投影,得到三个投影矩阵。步骤二、设计分类器:以卷积神经网络和残差块为基础,设计分类器并进行迭代训练,最后用测试集测试得到分类效果最好的分类器,其中采用交叉熵函数作为分类器的损失函数,每个卷积层后都采用leakyrelu函数作为激活函数来防止过拟合。步骤三、使用分类器预测得出mof对甲烷气体的预测吸附类别:将预处理后的数据输入到分类器中,依据分类器输出的分类结果,得到此mof对甲烷的预测吸附值类别。实施例1如图1所示,采用深度卷积神经网络的mof对甲烷气体的吸附性能预测方法,包括以下具体步骤:一、数据预处理:实施例采用的数据集为2016年chungyg等人发表于《scienceadvances》上的论文“insilicodiscoveryofmetal-organicframeworksforprecombustionco2captureusingageneticalgorithm”得到的数据库,包含51163种mofs。数据集共包含51163个mof样本以及其对甲烷气体的吸附值,每个mof样本中包含了mof单一晶胞的原子名称、原子相对坐标,晶胞三边长度以及三边夹角角度。统计得到吸附值最高为530cm3/g,之后将mof按照吸附值进行分类,共分为五类。分类之后按照9:1的比例划分成训练集和测试集,0-106cm3/g区间数据共有7717条,106-212cm3/g区间数据共有13056条,212-318cm3/g区间数据共有16955条,318-424cm3/g区间数据共有7274条,424-530cm3/g区间共有数据742条。以212-318cm3/g区间数据量为基准,对其余区间训练数据进行扩充。数据扩充方法为围绕某一坐标轴旋转垂直于此坐标轴的平面上的mof夹角角度,得到旋转后的mof的原子相对坐标发生了变化,但是其空间结构并没有发生变化,由此实现了对同一结构的mof生成了多种cif文件,也就是实现了数据扩充。扩充数据集之后将数据存储的原子相对坐标转换为空间中的绝对坐标,并进行最大最小归一化处理,再将归一化处理之后的坐标放大100倍向xy面、xz面、yz面进行投影,得到100x100的投影矩阵。二、设计分类器:以卷积神经网络和残差块为基础,设计分类器并进行迭代训练,最后用测试集测试得到分类效果最好的分类器,其中采用交叉熵函数作为分类器的损失函数,每个卷积层后都采用leakyrelu函数作为激活函数来防止过拟合。三、使用分类器预测得出mof对甲烷气体的预测吸附类别:本发明将预处理后的数据输入到分类器中,依据分类器输出的分类结果,得到此mof对甲烷的预测吸附值类别。为了证明所提方法的有效性,本发明中对数据集在分类器上得到的roc曲线图2以及在现有其余技术中得到的roc曲线图3做了比较。本发明中创建的cif-cnn分类器模型和对比实验方法的acc和auc值如表1:表1accauccif-cnn82%0.94svm29%0.54dt40%0.63rf46%0.76从表1可以看出,在这个数据集上,所提出的采用深度卷积网络的模型预测方法取得了最好的acc值和auc值并且差距很大,表明了采用深度卷积网络的模型预测方法更适合对mof三维空间基础结构进行特征提取,得出气体吸附预测值。上面结合实施例对本发明的实例作了详细说明,但是本发明并不限于上述实例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出的各种变化,也应视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1