分子性质预测模型的训练方法、装置、电子设备及介质与流程

文档序号:41106780发布日期:2025-02-28 17:51阅读:14来源:国知局
分子性质预测模型的训练方法、装置、电子设备及介质与流程

本申请涉及人工智能技术,尤其涉及一种分子性质预测模型的训练方法、装置、电子设备及介质。


背景技术:

1、分子性质预测任务利用计算机模型和算法来预测分子的各种物理化学性质和生物活性的过程。分子性质可能包括分子的水溶性、亲脂性、毒性、生物活性、药代动力学特征。实际应用过程中,待预测的分子数据可能存在缺失,仅训练分子性质模型的分子性质预测功能无法覆盖上述情况,进而导致预测结果不准确。

2、相关技术中,暂无较好的方式提升分子性质预测的准确性。


技术实现思路

1、本申请实施例提供一种分子性质预测模型的训练方法、装置、电子设备及介质,能够通过分阶段的训练过程提升分子性质预测模型进行分子性质预测的准确性。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种分子性质预测模型的训练方法,所述方法包括:

4、对样本分子的至少一个原子的第一非几何信息进行掩码处理,得到第二非几何信息;

5、对所述样本分子的至少一个原子的第一几何信息进行加噪处理,得到第二几何信息;

6、将未经过所述掩码处理的原子的第一非几何信息、所述第二非几何信息、未经过所述加噪处理的原子的第一几何信息以及所述第二几何信息组合为预训练数据集合;

7、基于所述预训练数据集合,调用分子性质预测模型进行第一训练任务,得到训练后的所述分子性质预测模型;

8、基于所述样本分子的原始数据集合,对训练后的所述分子性质预测模型进行分子性质预测处理的第二训练任务,得到训练完成的分子性质预测模型。

9、本申请实施例提供一种分子性质预测模型的训练装置,包括:

10、样本获取模块,用于对样本分子的至少一个原子的第一非几何信息进行掩码处理,得到第二非几何信息;

11、所述样本获取模块,还用于对所述样本分子的至少一个原子的第一几何信息进行加噪处理,得到第二几何信息;

12、所述样本获取模块,还用于将未经过所述掩码处理的原子的第一非几何信息、所述第二非几何信息、未经过所述加噪处理的原子的第一几何信息以及所述第二几何信息组合为预训练数据集合;

13、第一训练模块,用于基于所述预训练数据集合,调用分子性质预测模型进行第一训练任务,得到训练后的所述分子性质预测模型;

14、第二训练模块,用于基于所述样本分子的原始数据集合,对训练后的所述分子性质预测模型进行分子性质预测处理的第二训练任务,得到训练完成的分子性质预测模型。

15、本申请实施例提供一种电子设备,所述电子设备包括:

16、存储器,用于存储计算机可执行指令或者计算机程序;

17、处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现本申请实施例提供的分子性质预测模型的训练方法。

18、本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令或者计算机程序,用于被处理器执行时,实现本申请实施例提供的分子性质预测模型的训练方法。

19、本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现本申请实施例提供的分子性质预测模型的训练方法。

20、本申请实施例具有以下有益效果:

21、对样本分子的非几何信息进行掩码,对样本分子的几何信息进行加噪,并组合为预训练数据集合,增加了样本数据的复制程度,基于处理后的样本数据能够执行预测实际数据的处理,使得执行第一训练任务的过程中,增强分子性质预测模型对于分子中原子的几何信息、非几何信息的识别能力以及预测能力。在此基础上,对预训练后的分子性质预测模型的参数进行分子性质预测处理的训练任务,能够提升分子性质预测模型对分子性质预测的准确性。同时,由于第一训练任务后的分子性质预测模型已经学习到了分子中原子的几何信息以及非几何信息的基本知识,第二训练任务针对性地训练分子性质预测功能时,分子性质预测模型的收敛速度加快,从而节省了训练时间以及训练所需的计算资源。



技术特征:

1.一种分子性质预测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对样本分子的至少一个原子的第一非几何信息进行掩码处理,得到第二非几何信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于第一预配置概率对遍历到的所述原子进行选择操作,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述样本分子的至少一个原子的第一几何信息进行加噪处理,得到第二几何信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于第二预配置概率对遍历到的所述原子进行选择,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述预训练数据集合,调用分子性质预测模型进行第一训练任务,得到训练后的所述分子性质预测模型,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于每个所述第一非几何信息以及每个所述第二非几何信息,调用所述分子性质预测模型执行原子类型预测处理,并基于所述原子类型预测处理的结果确定所述分子性质预测模型的第一交叉熵损失,包括:

8.根据权利要求6所述的方法,其特征在于,所述基于每个所述第一几何信息以及每个所述第二几何信息,调用所述分子性质预测模型执行原子位置预测处理,并基于所述原子位置预测处理的结果确定所述分子性质预测模型的第一回归损失,包括:

9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:

10.根据权利要求1至8任一项所述的方法,其特征在于,所述原始数据集合包括样本分子数据以及所述样本分子的实际分子性质;

11.根据权利要求1至8任一项所述的方法,其特征在于,所述原始数据集合还包括样本分子数据、所述样本分子的实际分子性质、所述样本分子中的原子基团的实际性质;

12.根据权利要求11所述的方法,其特征在于,所述基于所述样本分子数据,调用训练后的所述分子性质预测模型进行特征提取处理,得到所述样本分子的分子特征,包括:

13.根据权利要求1至8任一项所述的方法,其特征在于,在所述基于所述样本分子的原始数据集合,对训练后的所述分子性质预测模型进行分子性质预测处理的第二训练任务,得到训练完成的分子性质预测模型之后,所述方法还包括:

14.根据权利要求1至8任一项所述的方法,其特征在于,所述分子性质预测模型包括:图神经网络、第一预测模块、第二预测模块以及分子性质预测模块,其中,所述图神经网络用于对分子数据进行特征提取,所述分子数据包括几何信息以及非几何信息;所述第一预测模块用于对所述第二非几何信息对应的第一非几何信息进行预测,所述第二预测模块用于对所述第二几何信息对应的第一几何信息进行预测,所述分子性质预测模块用于预测分子性质。

15.一种分子性质预测模型的训练装置,其特征在于,所述装置包括:

16.一种电子设备,其特征在于,所述电子设备包括:

17.一种计算机可读存储介质,存储有计算机可执行指令或者计算机程序,其特征在于,所述计算机可执行指令或者计算机程序被处理器执行时实现权利要求1至14任一项所述的分子性质预测模型的训练方法。

18.一种计算机程序产品,包括计算机可执行指令或计算机程序,其特征在于,所述计算机可执行指令或计算机程序被处理器执行时实现权利要求1至14任一项所述的分子性质预测模型的训练方法。


技术总结
本申请提供了一种分子性质预测模型的训练方法、装置、电子设备及介质;方法包括:对样本分子的第一非几何信息进行掩码得到第二非几何信息;对样本分子的第一几何信息进行加噪第二几何信息;将未经过掩码处理的原子的第一非几何信息、第二非几何信息、未经过加噪处理的原子的第一几何信息以及第二几何信息组合为预训练数据集合;基于预训练数据集合,调用分子性质预测模型进行第一训练任务,得到训练后的分子性质预测模型;基于样本分子的原始数据集合,对训练后的分子性质预测模型进行分子性质预测处理的第二训练任务,得到训练完成的分子性质预测模型。通过本申请,能够通过分阶段的训练过程提升分子性质预测模型进行分子性质预测的准确性。

技术研发人员:刘雨一,李松佑
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2025/2/27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1