一种基于图表示的金属有机框架的逆向设计方法

文档序号:34181455发布日期:2023-05-17 09:11阅读:109来源:国知局
一种基于图表示的金属有机框架的逆向设计方法

本发明涉及金属有机框架材料合成,具体的说,是一种基于图表示的金属有机框架的逆向设计方法。


背景技术:

1、金属有机框架(mofs)是一种晶体多孔材料,它们是通过在不同的拓扑结构中的分子构建块(即节点和连接器)的自组装而形成的。多样的构建块和不同组装方式赋予了mofs特殊的几何和化学可调性。大量的mofs已经应用于气体储存、分离、催化、电化学储能和药物传递等领域。由于构建块中的连接器具有庞大的化学空间,我们可以构建无限数量的mof。在实验环境下,针对特定应用开发一种mof需要大量的实验和测试,由于可能存在的mof数量庞大,通过实验进行寻找合适的mof需要耗费大量的人力物力和时间。随着计算机技术的发展,使用计算方法来替代人工寻找合适的mof变得越来越流行。有一种计算方法是对mof数据库进行高通量筛选,在筛选过程中使用分子模拟来预测mof在给定应用条件下的性能。由于分子模拟计算的复杂性,这种方法只能在几万个mof中进行筛选。为了加快高通量筛选,人们采用了启发式优化方法如遗传算法和进化算法,来得到更好的mof结构。这种方式可以搜索到更大的mof空间。它的缺点在于需要专家的先验知识来总结规则。此外,高通量筛选还有一个缺点,就是mof数据库中存在大多数是低性能mof。

2、考虑到以上情况和深度学习的发展,开发出一种生成新结构的工具具有极大的吸引力和可行性,它针对具有期望的应用性质,直接生成新的材料。这种从性质到结构的设计方式被称为逆向设计。逆向设计已经成功在应用在了mof领域,但是现有的方法中没有使用预测模型,设计过程中使用zeo++计算软件计算mof的吸收性能,计算成本比较大,而性能预测是逆向设计的关键步骤;有的使用分子模拟得到的能量网格来计算mof吸附性能,这也是一个耗费计算成本的过程;而且mof逆向设计需要一个更好的预测器,能在设计过程中快速、准确的进行性能预测。现有的mof性质预测模型使用传统机器学习,在训练过程中需要提供大量的输入参数和属性。这些参数和属性的质量将直接影响机器学习模型的可靠性。因此,现有的预测器也不能适用于mof逆向设计。构造一个更加适合逆向设计的预测器,是一个需要探索的工作。

3、在mof的逆向设计领域,需要更好的生成模型来设计mof。直观来看,可以把mof表示成是三维空间中大量有规律结合的粒子(原子)的集合,这样的表示在生成的时候,需要同时兼顾到粒子的类型、粒子的数量、以及粒子的空间位置。由于需要考虑到空间架构,粒子的巨大数量以及离散和连续变量的混合,在生成的时候有着巨大的挑战性。mof生成需要找到一个更加合适的表示方法。mof设计领域已有的表示,如能量形状、rfcode(edges|vertices|topologies),他们都存在一定的问题,使用能量形状只能有效表征比较简单的沸石结构,rfcode使用smiles(simplifified molecular input line entry system)来表示edges,在生成时仅关注smiles序列的句法特征和重复模式,忽略其语义并且无法编码更高层次的概念。这在生成分子或者mof的时候会存在一定的问题,比如(1)重建失效的概率比较高;(2)不能将mof的属性表示出来。这使得逆向设计过程中生成的mof结构不够准确,而且性质预测精度比较低。

4、因此,现有的金属有机框架的逆向设计中,由于不具备性能预测导致不能快速、准确的进行性能预测,以及由于没有合适的表示方法导致mof生成难度较大、生成的分子存在问题或者结构不够准确、性质预测精度比较低的问题。


技术实现思路

1、本发明的目的在于提供一种基于图表示的金属有机框架的逆向设计方法,用于解决现有技术中金属有机框架的逆向设计由于不具备性能预测导致不能快速、准确的进行性能预测,以及由于没有合适的表示方法导致mof生成难度较大、生成的分子存在问题或者结构不够准确、性质预测精度比较低的问题。

2、本发明通过下述技术方案解决上述问题:

3、一种基于图表示的金属有机框架的逆向设计方法,包括:

4、步骤s100、对金属有机框架mof进行图表征:从数据集中获取mof数据,包括mof的连接器、节点、拓扑和mof的性质,对mof数据进行预处理,采用分子图的形式表示mof的边,采用one-hot编码进行分类表示mof的节点和拓扑,形成mof的表征形式边图|节点|拓扑;

5、步骤s200、搭建生成模型,生成模型包括变分自编码模型vae、预测器和分子群优化器,对vae和预测器进行联合训练;

6、步骤s300、vae采用三组不同的编码解码器处理mof的边图|节点|拓扑,将边图|节点|拓扑编码到隐空间z中,预测器采用三层的感知机网络,将隐空间z中的向量作为输入并预测mof的性质,预测器的输出作为分子群优化器的目标函数值,分子群优化器在隐空间z中进行探索,根据目标函数值输出想要的mof。

7、所述变分自编码模型vae由三组编码器和解码器组成,其中,处理顶点和拓扑的编码器均采用三层感知机网络,处理顶点和拓扑的解码器均采用二层感知机网络;处理边图的编码器和解码器采用分层图编解码器。

8、对vae和预测器进行联合训练具体为:

9、vae将mof的表征形式边图|节点|拓扑对应到隐空间z中,预测器添加mof性质,对vae和预测器进行联合训练,设置生成模型的整体损失函数lloss为:

10、lloss=lelbo+lproperty

11、其中,lelbo为vae学习的损失函数,lproperty为预测器的损失函数,vae学习的损失函数lelbo:

12、

13、其中,i=1,2,3;n=3,代表有三个编码解码器;q(z1|x1)对应以拓扑结构的onehot编码x1为输入、z1为输出的编码器;q(z2|x2)对应以节点的onehot编码x2为输入、z2为输出的编码器;q(z3|x3)对应以边的图x3为输入、z3为输出的编码器;每个编码器构造的隐空间zi相加,形成一个总的隐空间z;p(z)代表先验分布;dkl代表是kl散度;p(x1|z)、p(x2|z)、p(x3|z)分别为以隐空间z为输入,分别输出拓扑结构的onehot编码、节点的onehot编码、边图的解码器,代表关于q(z|x)的期望;

14、预测器以半监督的形式运行的,预测器的输入为隐空间z,预测性质为mof结构和气体吸收性质,当输入的mof带有性质标签时,预测器则更新参数,当输入的mof没有标签时,预测器则不更新参数。

15、所述分子群优化器在隐空间z中进行探索,根据目标函数值输出想要的mof具体为:

16、给分子群优化器输入隐空间z的多个向量点,分子群优化器使用预测器得到向量点对应mof的co2吸收量,并自动选择更优的向量点进行下一步预测并评估,经过这样的多轮迭代,最终找到一个co2吸收量最高的向量点;

17、将这个co2吸收量最高的向量点使用解码器解码为边图|节点|拓扑后,在开源软件zeo++中构建mof。

18、还包括在开源软件raspa中使用巨正则蒙特卡洛模拟gcmc评估得到的mof的co2吸附量。

19、所述分子图是通过分子节点和共价键边的方式表示,g=(v,e),其中v表示一组节点向量,e表示一组边,vi、vj表示其中一个节点,vi∈v、vj∈v,eij=(vi,vj)∈e表示节点vi和节点vj形成的边。

20、本发明与现有技术相比,具有以下优点及有益效果:

21、(1)本发明提出了基于图的mof表示方法,并建立了一个由图神经网络生成模型和高准确度预测器组成的逆向设计深度学习框架,大大改善了mofs逆向设计中的生成成功率低和预测不够准确的问题。

22、(2)本发明将复杂的mof简化为边图|节点|拓扑(graphs|vertices|topologies)的表示形式,新的表示形式作为多组件分别通过对应的编码器编码后同时输入到vae中,为了更好的提取mof表示中边图的信息,使用图神经网络作为边图的编码器和解码器。同时,提取vae隐空间中的向量作为特征描述符来训练性质预测器,使模型在生成和属性预测上表现出了巨大的提升,证明使用图表示的mof和以及提取的对应特征能使模型学习得更好。采用mof在烟道气(co2/n2混合气体)中对co2的吸收量作为设计目标,使用优化算法搜寻隐空间中的mof,并将得到的mof使用gcmc模拟验证,得到极具竞争力的mof。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1