一种基于图注意机制迁移学习的小分子药物hERG毒性预测方法和装置

文档序号:26091320发布日期:2021-07-30 18:00阅读:来源:国知局

技术特征:

1.一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:该方法包括以下步骤:

s1:数据集预处理,将待检测的类药化合物通过分子指纹生成软件生成指纹序列;

s2:通过所述s1步骤生成的指纹序列得到原子及化学键特征,将原子及化学键特征构建分子图及图特征;

s3:通过图注意力机制对所述s2步骤得到的分子图进行处理,生成分子中每个原子特征向量;

s4:通过图注意力机制及每个原子的特征生成分子特征向量;

s5:参数迁移及属性预测,将源域生成的分子特征向量对应的权重矩阵w迁移到目标域中,协助目标域权重矩阵w的生成,最终生成信息聚合的特征向量并预测属性值。

2.根据权利要求1所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:所述s1步骤包括以下步骤:

s11:输入过氧化物酶体增殖剂激活受体γ(ppar-γ)数据集作为源域数据集,herg数据集作为目标域数据集;

s12:将s11步骤中的所述数据集中的所有小分子药物用smiles格式表示;

s13:对所有小分子药物做标准化处理,统一分子smiles表达式中的原子、键、连接关系的编码方式和顺序;

s14:对统一的smiles表达式去重复化处理。

3.根据权利要求1所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:所述s2步骤包括以下步骤:

s21:根据源域中分子的smiles表达式通过分子图生成软件生成分子二维图;

s22:根据所述s21步骤中分子二维图图中节点的特征生成,将每个原子看作一个节点生成节点的特征向量,原子的特征包括:原子符号、共价键数目、电荷、自由基电子数、芳香性、连氢的数目、手性、手性类型;

s23:根据所述s21步骤中分子二维图图中边的特征生成,将连接原子的键看作一条边生成边的特征,边的特征包括:键的类型、成环性、共轭性、立体性。

4.根据权利要求1所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:所述s3步骤包括以下步骤:

s31:将每个原子嵌入一个关注层,每个原子作为中心节点,使原子聚合与之相邻的化学键以及原子所包含的“消息”,为每个原子生成一个新的特征向量;

s32:s31步骤中得到的新的特征向量包含了中心原子以及相邻化学键和相邻原子的“消息”,将它们看作一个“大原子”嵌入下一个关注层,继续聚合与“大原子”相邻的化学键以及原子所包含的“消息”,直至特征向量经过多层关注层后,包含了所有原子的“消息”。

5.根据权利要求1所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:在所述s4步骤中,将整个分子视为连接分子中所有原子的超虚拟节点,并使用相同的原子嵌入注意机制嵌入,最终生成整个分子的特征向量。

6.根据权利要求1所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测方法,其特征在于:所述s5步骤包括以下步骤:

s51:在源域分子特征向量生成过程中,得到对预测ppar-γ属性有贡献的各个子结构及其权重矩阵w;

s52:将所述s51步骤中得到的子结构及其权重矩阵w迁移到目标域中,作为目标域中相同子结构对应的权重矩阵w的初始值;

s53:对目标域herg数据集进行s1步骤到s4步骤的操作,生成分子的特征向量,最后通过一个全连接层进行属性值的预测。

7.一种基于图注意机制迁移学习的小分子药物herg毒性预测装置,其特征在于:该装置包括基于图注意机制的毒性预测模块,用于构建毒性预测的模型;特征迁移模块,用于学习ppar-γ数据集和herg数据集中分子的共同特征,并进行参数迁移;小分子化合物毒性预测与性能评价模块,用于预测小分子化合物的毒性和评价模型性能;

由图注意机制的毒性预测模块得到源域数据对预测毒性有用的子结构(分子特征向量中体现)的及子结构对应权重矩阵w,然后给特征迁移模块进行权重矩阵w的迁移,w迁移给目标域数据集后,进入小分子化合物毒性预测与性能评价模块进行预测。

8.根据权利要求7所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测装置,其特征在于:所述图注意机制的毒性预测模块具体包括:初始模块,用于从数据库获取包含smiles和对应毒性的初始的数据集;分子图构建模块,用于根据分子smiles表达式,通过编码生成每一个分子的分子图以及图中特征;原子特征生成模块,用于聚合所有原子及其领域信息;分子特征生成模块,用于生成整个分子特征和相应权重值,最后构建分子毒性预测模型。

9.根据权利要求7所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测装置,其特征在于:所述特征迁移模块具体包括:有毒特征学习模块,用于学习ppar-γ数据集和herg数据集中有毒分子的共有特征;无毒特征学习模块,用于学习ppar-γ数据集和herg数据集中无毒分子的共有特征;特征筛选模块,用于筛选出既是ppar-γ数据集和herg数据集共有特征,也是ppar-γ数据集中对ppar-γ毒性预测贡献高的特征;参数迁移模块,用于将筛选出的ppar-γ数据集中特征的权重值迁移给herg数据集。

10.根据权利要求7所述的一种基于图注意机制迁移学习的小分子药物herg毒性预测装置,其特征在于:所述小分子化合物毒性预测与性能评价模块具体包括:预测模块,用于预测小分子的毒性;评价模块,用于得到评价模型性能的指标。


技术总结
本发明揭示了一种基于图注意机制迁移学习的小分子药物hERG毒性预测方法和装置,该方法包括以下步骤:S1:数据集预处理,将待检测的类药化合物通过分子指纹生成软件生成指纹序列;S2:通过S1步骤生成的指纹序列得到原子及化学键特征,将原子及化学键特征构建分子图及图特征;S3:通过图注意力机制对S2步骤得到的分子图进行处理,生成分子中每个原子特征向量;S4:通过图注意力机制及每个原子的特征生成分子特征向量。该方法基于图注意力机制对分子图结构进行处理,有效获取对预测属性值贡献大的子结构,基于迁移学习对源域和目标域数据集进行处理,有效解决样本量不足的问题。

技术研发人员:吴建盛;朱阳;胡海峰;朱燕翔
受保护的技术使用者:南京邮电大学
技术研发日:2021.04.29
技术公布日:2021.07.30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1