获取分子表示数据的方法及分子属性获取方法

文档序号:30576378发布日期:2022-06-29 09:26阅读:来源:国知局

技术特征:
1.一种基于分子结构信息获取分子表示数据的方法,其特征在于,包括:对于组成分子的各个原子,获取单个原子外层的各个电子轨道结构数据,并生成基于波函数表示的各个电子轨道结构数据,将所述波函数表示的各个电子轨道结构数据作为原子结构数据;在组成分子的单个原子的体素空间内,将基于波函数表示的各个电子轨道结构数据进行组合,形成基于波函数的原子卷积核,所述基于波函数的原子卷积核反映原子的物理结构;以及在组成分子的所有原子的整个体素空间内,对构成分子的各个原子,通过各个原子对应的所述基于波函数的原子卷积核进行卷积操作,分子的各个原子经对应的所述基于波函数的原子卷积核卷积操作后,生成基于体素的可视化分子表示数据;其中,所述体素空间,指在三维空间建立坐标系,将分子的几何中心作为原点,通过pca提取坐标系的三个轴方向,将分子旋转至各个轴,空间中原子对应的位置为一个单元,各个单元包含一个向量,向量长度与原子种类对应,且每个向量表示对应的原子种类的周围电子云在所述位置上的概率分布。2.根据权利要求1所述的基于分子结构信息获取分子表示数据的方法,其特征在于,所述原子的外层电子轨道数量为两层时,基于波函数表示的各个电子轨道结构数据包括:述原子的外层电子轨道数量为两层时,基于波函数表示的各个电子轨道结构数据包括:其中,各个表达式含义如下:r,表示第i层电子轨道的电子p到原子核p0的距离,r的取值为||p,p0||,i取值为1或2;z,表示原子的核电荷数;a0,取值为一个常数。3.根据权利要求2所述的基于分子结构信息获取分子表示数据的方法,其特征在于,所述原子的外层电子轨道数量为两层时,所述基于波函数的原子卷积核表示为:其中,各个表达式含义如下:(x,y,z),表示各个原子在体素空间坐标;ψ
i
,波函数形式表示的各个电子轨道,i取值为1或2;l,表示电子层数,l取值为1或2;r,表示第i层电子轨道的电子到原子核p0的距离。4.根据权利要求1所述的基于分子结构信息获取分子表示数据的方法,其特征在于,所述各个原子的基于波函数的原子卷积核进行卷积操作,包括:其中,各个表达式的含义如下:
p,表示分子中的原子;δ
x
,δ
y
,δ
z
:分别原子p在三个坐标轴方向的偏移量。5.一种分子属性获取方法,其特征在于,包括:将待预测属性的分子通过权利要求1至4任一所述方法生成基于体素的可视化分子表示数据;将所述基于体素的可视化分子表示数据输入分子属性预测网络,进行分子属性预测,所述分子属性预测网络经预先训练获得;以及分子属性预测网络输出所述待预测属性的分子的属性。6.根据权利要求5所述的分子属性获取方法,其特征在于,所述分子属性预测网络的组成包括:所述分子属性预测网络基于神经网络组成,包括多个卷积操作层和多个池化操作层;以及所述分子属性预测网络包括平均通道池化层,所述平均通道池化层使得各个体素在所有通道的平均值作为体素的值;其中,所述通道反应原子在空间的分布情况,所述通道不同时,反应不同原子在空间的分布情况。7.根据权利要求5所述的分子属性获取方法,其特征在于,所述分子属性预测网络的训练过程包括:初始化属性预测网络的参数;将数据集划分为训练集、验证集合测试集;将训练集中包括基于体素的可视化分子表示数据及分子属性作为输入,输入至分子属性预测网络进行训练;分别通过验证集、测试集的数据进行验证和测试;以及通过平均绝对误差评价分子属性预测网络的训练效果,反复训练、验证,直至达到预期训练指标。8.根据权利要求7所述的分子属性获取方法,其特征在于,所述基于体素的可视化分子表示数据经过归一化处理,以保证基于体素的可视化分子表示数据的各个原子在输入所述分子属性预测网络时具有统一的尺寸规格。9.根据权利要求7所述的分子属性获取方法,其特征在于,所述分子属性预测网络获得的分子属性包括旋转常数、偶极矩、各向同性极化率中的至少一个属性。10.根据权利要求7所述的分子属性获取方法,其特征在于,所述基于体素的可视化分子经过扩散策略处理,所述扩散策略中,通过以数字零或其他正整数作为扩散系数对所述分子中的各个原子进行扩散。

技术总结
本公开提供一种基于分子结构信息获取分子表示数据的方法,包括:对于组成分子的各个原子,获取单个原子外层的各个电子轨道结构数据,并生成基于波函数表示的各个电子轨道结构数据,将波函数表示的各个电子轨道结构数据作为原子结构数据;在组成分子的单个原子的体素空间内,将基于波函数表示的各个电子轨道结构数据进行组合,形成基于波函数的原子卷积核;在组成分子的所有原子的整个体素空间内,对构成分子的各个原子,通过各个原子对应的基于波函数的原子卷积核进行卷积操作,分子的各个原子经对应的基于波函数的原子卷积核卷积操作后,生成基于体素的可视化分子表示数据。本公开还提供了一种分子属性获取方法。开还提供了一种分子属性获取方法。开还提供了一种分子属性获取方法。


技术研发人员:佟强 沈嘉豪 刘晓彤 刘秀磊
受保护的技术使用者:北京信息科技大学
技术研发日:2022.03.24
技术公布日:2022/6/28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1