结合亲和力检测模型的训练方法及结合亲和力检测方法与流程

文档序号:35959100发布日期:2023-11-08 21:19阅读:42来源:国知局
结合亲和力检测模型的训练方法及结合亲和力检测方法与流程

本技术实施例涉及生物,特别涉及一种结合亲和力检测模型的训练方法及结合亲和力检测方法。


背景技术:

1、在生物技术领域中,蛋白质参与了催化、免疫、代谢等生命活动,是组成生物体的重要物质。通常情况下,可以度量蛋白质与药物小分子之间的结合亲和力,通过对结合亲和力进行分析,可以得到药物小分子的成药潜力。

2、相关技术中,可以利用结合亲和力检测模型来检测蛋白质和药物小分子之间的结合亲和力。由于蛋白质和药物小分子之间的结合亲和力与药物小分子的成药潜力息息相关,因此,如何训练出准确性较高的结合亲和力检测模型成为了一项重要的技术。


技术实现思路

1、本技术提供了一种结合亲和力检测模型的训练方法及结合亲和力检测方法,可用于提高结合亲和力检测模型的准确性,所述技术方案包括如下内容。

2、一方面,提供了一种结合亲和力检测模型的训练方法,所述方法包括:

3、获取样本蛋白质的蛋白质结构数据、样本药物小分子的小分子结构数据和样本标注结果,所述样本标注结果是通过标注得到的所述样本蛋白质与所述样本药物小分子之间的结合亲和力;

4、调用神经网络模型基于所述蛋白质结构数据和所述小分子结构数据,确定多个目标复合体构象的结构数据,任一目标复合体构象是通过预测得到的所述样本蛋白质和所述样本药物小分子结合形成的结构;

5、调用所述神经网络模型基于各个目标复合体构象的结构数据确定样本预测结果,所述样本预测结果是通过预测得到的所述样本蛋白质与所述样本药物小分子之间的结合亲和力;

6、利用所述样本预测结果和所述样本标注结果对所述神经网络模型进行训练,得到结合亲和力检测模型,所述结合亲和力检测模型用于检测目标蛋白质和目标药物小分子之间的结合亲和力。

7、另一方面,提供了一种结合亲和力检测方法,所述方法包括:

8、获取目标蛋白质的结构数据、目标药物小分子的结构数据和结合亲和力检测模型,所述结合亲和力检测模型是按照上述任一项所述的结合亲和力检测模型的训练方法训练得到的;

9、调用所述结合亲和力检测模型基于所述目标蛋白质的结构数据和所述目标药物小分子的结构数据,确定多个参考复合体构象的结构数据,所述参考复合体构象是通过预测得到的所述目标蛋白质和所述目标药物小分子结合形成的结构;

10、调用所述结合亲和力检测模型基于所述各个参考复合体构象的结构数据确定目标检测结果,所述目标检测结果是检测出的所述目标蛋白质与所述目标药物小分子之间的结合亲和力。

11、另一方面,提供了一种结合亲和力检测模型的训练装置,所述装置包括:

12、获取模块,用于获取样本蛋白质的蛋白质结构数据、样本药物小分子的小分子结构数据和样本标注结果,所述样本标注结果是通过标注得到的所述样本蛋白质与所述样本药物小分子之间的结合亲和力;

13、确定模块,用于调用神经网络模型基于所述蛋白质结构数据和所述小分子结构数据,确定多个目标复合体构象的结构数据,任一目标复合体构象是通过预测得到的所述样本蛋白质和所述样本药物小分子结合形成的结构;

14、所述确定模块,还用于调用所述神经网络模型基于各个目标复合体构象的结构数据确定样本预测结果,所述样本预测结果是通过预测得到的所述样本蛋白质与所述样本药物小分子之间的结合亲和力;

15、训练模块,用于利用所述样本预测结果和所述样本标注结果对所述神经网络模型进行训练,得到结合亲和力检测模型,所述结合亲和力检测模型用于检测目标蛋白质和目标药物小分子之间的结合亲和力。

16、在一种可能的实现方式中,所述确定模块,用于基于所述蛋白质结构数据和所述小分子结构数据,生成多个候选复合体构象的结构数据;调用所述神经网络模型基于各个候选复合体构象的结构数据确定所述各个候选复合体构象的质量指标,所述候选复合体构象的质量指标用于指示所述候选复合体构象的质量;调用所述神经网络模型基于所述各个候选复合体构象的质量指标,从所述多个候选复合体构象中选择多个目标复合体构象。

17、在一种可能的实现方式中,所述蛋白质结构数据为至少一种;

18、所述确定模块,用于对于任一种蛋白质结构数据,基于所述任一种蛋白质结构数据和所述小分子结构数据生成所述任一种蛋白质结构数据对应的候选复合体构象的结构数据;基于各种蛋白质结构数据对应的候选复合体构象的结构数据,确定多个候选复合体构象的结构数据。

19、在一种可能的实现方式中,所述确定模块,用于基于所述各个候选复合体构象的结构数据,确定所述各个候选复合体构象的图结构,任一个候选复合体构象的图结构用于表征所述任一个候选复合体构象的空间结构;调用所述神经网络模型基于所述各个候选复合体构象的图结构,确定所述各个候选复合体构象的构象特征;调用所述神经网络模型基于所述各个候选复合体构象的构象特征,确定所述各个候选复合体构象的质量指标。

20、在一种可能的实现方式中,任一个候选复合体构象的结构数据包括多个原子的原子数据,任一个原子为所述样本蛋白质中的原子或者所述样本药物小分子中的原子;所述任一个候选复合体构象的图结构包括多个节点和多个边;

21、所述确定模块,用于对于所述任一个候选复合体构象,基于所述任一个候选复合体构象包括的多个原子的原子数据,确定每两个原子之间的距离数据;将所述任一个候选复合体构象包括的各个原子的原子数据作为所述任一个候选复合体构象的图结构包括的各个节点;对于所述任一个候选复合体构象的图结构包括的任两个节点,若所述任两个节点对应的两个原子之间的距离数据小于距离阈值,则在所述任两个节点之间添加边。

22、在一种可能的实现方式中,所述确定模块,用于调用所述神经网络模型基于所述各个目标复合体构象的构象特征确定所述各个目标复合体构象的权重,任一个目标复合体构象的构象特征是基于任一个目标复合体构象的结构数据确定的;调用所述神经网络模型基于所述各个目标复合体构象的构象特征和权重确定样本预测结果。

23、在一种可能的实现方式中,所述确定模块,用于调用所述神经网络模型基于参考权重和所述各个目标复合体构象的构象特征,确定所述各个目标复合体构象的加权构象特征;调用所述神经网络模型对所述各个目标复合体构象的加权构象特征进行归一化处理,得到所述各个目标复合体构象的权重。

24、在一种可能的实现方式中,所述确定模块,用于调用所述神经网络模型基于所述各个目标复合体构象的构象特征和权重进行加权计算,得到加权融合特征;调用所述神经网络模型基于所述加权融合特征确定样本预测结果。

25、在一种可能的实现方式中,所述训练模块,用于基于所述样本预测结果和所述样本标注结果确定第一损失;基于所述各个目标复合体构象的结构数据,确定所述各个目标复合体构象的预测结果,所述目标复合体构象的预测结果是通过预测得到的所述目标复合体构象的结合亲和力;对于任一个目标复合体构象,基于所述样本标注结果和所述任一个目标复合体构象的预测结果,确定所述任一个目标复合体构象对应的第二损失;基于所述第一损失和所述各个目标复合体构象对应的第二损失,对所述神经网络模型进行训练,得到结合亲和力检测模型。

26、在一种可能的实现方式中,所述训练模块,用于获取基准复合体构象的结构数据,所述基准复合体构象是所述样本蛋白质和所述样本药物小分子结合形成的真实结构;基于所述基准复合体构象的结构数据和所述任一个目标复合体构象的结构数据,确定所述任一个目标复合体构象的标注类别,所述任一个目标复合体构象的标注类别用于表征所述任一个目标复合体构象与所述基准复合体构象是否相似;基于所述样本标注结果、所述任一个目标复合体构象的预测结果和标注类别,确定所述任一个目标复合体构象对应的第二损失。

27、在一种可能的实现方式中,所述训练模块,用于若所述任一个目标复合体构象的标注类别用于表征所述任一个目标复合体构象与所述基准复合体构象相似,则基于所述任一个目标复合体构象的预测结果和所述样本标注结果之间的目标差值,确定所述任一个目标复合体构象对应的第二损失;若所述任一个目标复合体构象的标注类别用于表征所述任一个目标复合体构象与所述基准复合体构象不相似,则基于所述目标差值和设定数值之间的最大值,确定所述任一个目标复合体构象对应的第二损失。

28、在一种可能的实现方式中,所述训练模块,用于基于所述样本预测结果和所述样本标注结果确定第一损失;获取各个候选复合体构象的标注类别,所述候选复合体构象的标注类别用于表征所述候选复合体构象与基准复合体构象是否相似;对于任一个候选复合体构象,基于所述任一个候选复合体构象的标注类别和质量指标,确定所述任一个候选复合体构象对应的第三损失;基于所述第一损失和各个候选复合体构象对应的第三损失,对所述神经网络模型进行训练,得到结合亲和力检测模型。

29、另一方面,提供了一种结合亲和力检测装置,所述装置包括:

30、获取模块,用于获取目标蛋白质的结构数据、目标药物小分子的结构数据和结合亲和力检测模型,所述结合亲和力检测模型是按照上述任一项所述的结合亲和力检测模型的训练方法训练得到的;

31、确定模块,用于调用所述结合亲和力检测模型基于所述目标蛋白质的结构数据和所述目标药物小分子的结构数据,确定多个参考复合体构象的结构数据,所述参考复合体构象是通过预测得到的所述目标蛋白质和所述目标药物小分子结合形成的结构;

32、所述确定模块,还用于调用所述结合亲和力检测模型基于所述各个参考复合体构象的结构数据确定目标检测结果,所述目标检测结果是检测出的所述目标蛋白质与所述目标药物小分子之间的结合亲和力。

33、在一种可能的实现方式中,所述确定模块,用于基于所述目标蛋白质的结构数据和所述目标药物小分子的结构数据,生成多个第一复合体构象的结构数据;调用所述结合亲和力检测模型基于各个第一复合体构象的结构数据确定所述各个第一复合体构象的质量指标,所述第一复合体构象的质量指标用于指示所述第一复合体构象的质量;调用所述结合亲和力检测模型基于所述各个第一复合体构象的质量指标,从所述多个第一复合体构象中选择多个参考复合体构象。

34、在一种可能的实现方式中,所述确定模块,用于调用所述结合亲和力检测模型基于所述各个参考复合体构象的构象特征确定所述各个参考复合体构象的权重,任一个参考复合体构象的构象特征是基于任一个参考复合体构象的结构数据确定的;调用所述结合亲和力检测模型基于所述各个参考复合体构象的构象特征和权重确定目标检测结果。

35、另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现上述任一所述的结合亲和力检测模型的训练方法或者实现上述任一所述的结合亲和力检测方法。

36、另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一所述的结合亲和力检测模型的训练方法或者实现上述任一所述的结合亲和力检测方法。

37、另一方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种结合亲和力检测模型的训练方法或者实现上述任一所述的结合亲和力检测方法。

38、本技术提供的技术方案至少带来如下有益效果:

39、本技术提供的技术方案中,任一个目标复合体构象是通过预测得到的样本蛋白质和样本药物小分子结合形成的结构,通过多个目标复合体构象可以提高覆盖样本蛋白质和样本药物小分子结合形成的真实结构的概率,即多个目标复合体构象能更准确地表达出样本蛋白质和样本药物小分子结合形成的真实结构,使得在调用神经网络模型基于各个目标复合体构象的结构数据确定样本预测结果时,样本预测结果的准确性更高,从而使得利用样本预测结果对神经网络模型进行训练得到结合亲和力检测模型时,能提高结合亲和力检测模型的准确性,从而提高了结合亲和力检测结果的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1