本申请实施例涉及机器学习,特别涉及一种蛋白质相互作用的预测方法、装置、设备、介质及产品。
背景技术:
1、蛋白质相互作用的预测旨在判断两个或者更多蛋白质之间是否会发生相互作用。
2、由于蛋白质是由其对应的氨基酸序列信息决定的,因此,在相关技术中,提取蛋白质的氨基酸序列的特征向量,并将提取的特征向量输入至训练完成的神经网络进行预测处理,从而确定蛋白质之间是否会发生相互作用。
3、但相关技术中,由于有限的训练数据量以及训练/测试数据之间的数据分布差异,导致模型学习效果不佳、模型的泛化能力差,即在一些新测试数据或与训练数据数据分布差异较大的测试数据上获取的预测结果的精度较差。
技术实现思路
1、本申请提供了一种蛋白质相互作用的预测方法、装置、设备、介质及产品,所述技术方案如下:
2、根据本申请的一方面,提供了一种蛋白质相互作用的预测方法,所述方法包括:
3、获取至少两个蛋白质分别对应的氨基酸序列;
4、基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整,得到调整后的自适应注意力语言网络,所述自适应调整是指在所述蛋白质相互作用的预测过程中,对所述注意力语言网络的网络参数进行调整;
5、基于所述自适应注意力语言网络对所述至少两个蛋白质分别对应的所述氨基酸序列进行特征提取,得到所述至少两个蛋白质分别对应的氨基酸序列特征;
6、基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测,得到所述至少两个蛋白质对应的预测结果,所述预测结果用于指示所述至少两个蛋白质之间的相互作用结果。
7、根据本申请的一方面,提供了一种相互作用预测模型的训练方法,所述方法包括:
8、获取至少两个样本蛋白质分别对应的样本氨基酸序列、所述至少两个样本蛋白质之间的预测结果标签,所述预测结果标签于指示所述至少两个样本蛋白质之间的真实相互作用结果;
9、基于所述注意力语言网络对所述至少样本两个蛋白质分别对应的所述样本氨基酸序列进行特征提取,得到所述至少两个蛋白质分别对应的氨基酸序列特征;
10、基于所述预测网络对所述至少两个样本蛋白质分别对应的所述样本氨基酸序列特征进行相互作用预测,得到所述至少两个样本蛋白质对应的预测结果,所述预测结果用于指示所述至少两个样本蛋白质之间的相互作用结果;
11、基于所述预测结果和所述预测结果标签进行计算,得到训练损失函数值;
12、基于所述训练损失函数值对所述相互作用预测模型的网络参数进行更新。
13、根据本申请的一方面,提供了一种蛋白质相互作用的预测装置,所述装置包括:
14、获取模块,用于获取至少两个蛋白质分别对应的氨基酸序列;
15、调整模块,用于基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整,得到调整后的自适应注意力语言网络,所述自适应调整是指在所述蛋白质相互作用的预测过程中,对所述注意力语言网络的网络参数进行调整;
16、预测模块,用于基于所述自适应注意力语言网络对所述至少两个蛋白质分别对应的所述氨基酸序列进行特征提取,得到所述至少两个蛋白质分别对应的氨基酸序列特征;
17、所述预测模块,还用于基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测,得到所述至少两个蛋白质对应的预测结果,所述预测结果用于指示所述至少两个蛋白质之间的相互作用结果。
18、根据本申请的一方面,提供了一种相互作用预测模型的训练装置,所述装置包括:
19、获取模块,用于获取至少两个样本蛋白质分别对应的样本氨基酸序列、所述至少两个样本蛋白质之间的预测结果标签,所述预测结果标签于指示所述至少两个样本蛋白质之间的真实相互作用结果;
20、预测模块,用于基于所述注意力语言网络对所述至少样本两个蛋白质分别对应的所述样本氨基酸序列进行特征提取,得到所述至少两个蛋白质分别对应的氨基酸序列特征;
21、所述预测模块,还用于基于所述预测网络对所述至少两个样本蛋白质分别对应的所述样本氨基酸序列特征进行相互作用预测,得到所述至少两个样本蛋白质对应的预测结果,所述预测结果用于指示所述至少两个样本蛋白质之间的相互作用结果;
22、计算模块,用于基于所述预测结果和所述预测结果标签进行计算,得到训练损失函数值;
23、更新模块,用于基于所述训练损失函数值对所述相互作用预测模型的网络参数进行更新。
24、根据本申请的另一方面,提供了一种计算机设备,该计算机设备包括:处理器和存储器,存储器中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行以实现如上方面所述的蛋白质相互作用的预测方法,或如上方面所述的相互作用预测模型的训练方法。
25、根据本申请的另一方面,提供了一种计算机存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行以实现如上方面所述的蛋白质相互作用的预测方法,或如上方面所述的相互作用预测模型的训练方法。
26、根据本申请的另一方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;所述计算机程序由计算机设备的处理器从所述计算机可读存储介质读取并执行,使得所述计算机设备执行如上方面所述的蛋白质相互作用的预测方法,或如上方面所述的相互作用预测模型的训练方法。
27、本申请提供的技术方案带来的有益效果至少包括:
28、通过获取至少两个蛋白质分别对应的氨基酸序列;基于氨基酸序列对注意力语言网络的网络参数进行自适应调整,得到调整后的自适应注意力语言网络;基于自适应注意力语言网络和预测网络对至少两个蛋白质分别对应的氨基酸序列进行相互作用预测,得到至少两个蛋白质对应的预测结果。本申请实施例提供的蛋白质相互作用的预测方法,在蛋白质相互作用的预测过程中,可以将注意力语言网络的网络参数进行适应性调整,提高了相互作用预测模型的泛化能力,同时提高了预测结果的精度。
1.一种蛋白质相互作用的预测方法,其特征在于,所述方法应用于相互作用预测模型,所述相互作用预测模型包括注意力语言网络和预测网络;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整,得到调整后的自适应注意力语言网络,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述注意力语言网络对所述掩码氨基酸序列中的所述掩码位置进行预测处理,得到所述掩码位置对应的预测氨基酸,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过所述注意力语言网络基于所述第二氨基酸特征对所述掩码氨基酸序列中的掩码位置进行预测处理,得到所述掩码位置对应的所述预测氨基酸,包括:
5.根据权利要求3所述的方法,其特征在于,所述获取所述掩码氨基酸序列中的未掩码位置的氨基酸对应的氨基酸特征,包括:
6.根据权利要求1至5任一所述的方法,其特征在于,所述氨基酸序列包括第一氨基酸序列和第二氨基酸序列;
7.根据权利要求6所述的方法,其特征在于,所述通过所述预测网络基于所述第一氨基酸序列特征和所述第二氨基酸序列特征进行相互作用预测,得到所述第一氨基酸序列和所述第二氨基酸序列之间的所述预测结果,包括:
8.一种相互作用预测模型的训练方法,其特征在于,所述方法应用于相互作用预测模型,所述相互作用预测模型包括注意力语言网络和预测网络;所述方法包括:
9.根据权利要求8所述的方法,其特征在于,所述样本氨基酸序列包括第一样本氨基酸序列和第二样本氨基酸序列;
10.根据权利要求9所述的方法,其特征在于,所述通过所述预测网络基于所述第一样本氨基酸序列特征和所述第二样本氨基酸序列特征进行相互作用预测,得到所述第一样本氨基酸序列和所述第二样本氨基酸序列之间的所述预测结果,包括:
11.一种蛋白质相互作用的预测装置,其特征在于,所述装置包括:
12.一种相互作用预测模型的训练装置,其特征在于,所述装置包括:
13.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条计算机程序,至少一条所述计算机程序由所述处理器加载并执行以实现如权利要求1至7中任一项所述的蛋白质相互作用的预测方法,或,如权利要求8至10中任一项所述的相互作用预测模型的训练方法。
14.一种计算机存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行以实现如权利要求1至7中任一项所述的蛋白质相互作用的预测方法,或,如权利要求8至10中任一项所述的相互作用预测模型的训练方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;所述计算机程序由计算机设备的处理器从所述计算机可读存储介质读取并执行,使得所述计算机设备执行如权利要求1至7中任一项所述的蛋白质相互作用的预测方法,或,如权利要求8至10中任一项所述的相互作用预测模型的训练方法。