本申请涉及计算机生物信息,特别是涉及一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法和系统。
背景技术:
1、探索潜在的药物-靶点相互作用是证明药物发现和设计有效性的关键步骤。然而基于生物实验的药物-靶点相互作用预测需要在较大的药物化合物空间中进行实验搜索,费时且昂贵。
2、目前最新的解决方法是基于图的计算方法,该方法依据局部或全局拓扑信息计算药物和靶点之间的相似性,并融合多源数据构建异构网络,进而通过图神经网络算法从异构网络中学习药物和靶点的特征表示用于预测相互作用关系。
3、但是,已有的基于图的计算方法大都简单地关注药物相关和蛋白质相关数据集构建的异构网络,而不是全面地、多角度地挖掘药物关联、蛋白质关联和药物-蛋白质对信息。此外,基于药物-蛋白质异构网络的全局学习方法由于关注的范围域较大,容易忽略邻近位置的关键信息。
技术实现思路
1、有鉴于此,本发明提供了一种药物-靶点相互作用预测方法和系统,多视图网络学习结合子网络学习进行药物-靶点相互作用预测,以实现全面、多角度挖掘药物关联、蛋白质关联和药物-蛋白质对信息。
2、为此,本发明提供了以下技术方案:
3、本发明提供了一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,所述方法包括:
4、获取蛋白质数据、药物数据以及药物-蛋白质相互作用关系数据,构建相互作用关联矩阵;
5、获取药物、蛋白质关联的疾病以及药物副作用信息,结合药物-蛋白质相互作用关联矩阵构建药物-蛋白质关联多源异构网络;
6、基于药物-蛋白质关联多源异构网络提取药物、蛋白质初始特征信息;
7、基于药物-蛋白质关联矩阵和药物、蛋白质初始特征信息,以药物-蛋白质对为节点构建药物-蛋白质对多视图网络;所述多视图网络包括拓扑视图、语义视图和协同视图;
8、基于药物-蛋白质对多视图网络,通过药物-靶点相互作用预测模型进行多视图协同学习,得到药物-蛋白质的相互作用概率预测值;所述药物-靶点相互作用预测模型包括图卷积神经网络、注意力机制和全连接网络层,以多视图为多通道输入,输出药物-蛋白质的相互作用概率预测值。
9、进一步地,基于药物-蛋白质关联多源异构网络提取药物、蛋白质初始特征信息,包括:
10、分别计算药物和蛋白质的邻居矩阵,并通过去噪自编码器从中提取高鲁棒性的低维特征,得到多源邻居特征表示;
11、构建药物和蛋白质的多条元路径,通过元路径信息指导图卷积神经网络对药物-蛋白质关联多源异构网络进行子图学习,提取药物和蛋白质的嵌入属性特征,得到基于元路径的特征表示;
12、结合多源邻居特征表示和基于元路径的特征表示,最终得到药物、蛋白质初始特征。
13、进一步地,构建药物-蛋白质对多视图网络,包括:
14、从药物-蛋白质关联矩阵中提取药物-蛋白质对的拓扑视图,当任意两个药物-蛋白质对中包含相同的蛋白质或药物时,这两个药物-蛋白质对之间存在拓扑连接关系;
15、根据药物、蛋白质的初始特征信息,通过计算药物-蛋白质对之间的距离关系,提取药物-蛋白质对的语义视图;
16、以药物-蛋白质对的拓扑视图和药物-蛋白质对的语义视图为基准,构建药物-蛋白质对的协同视图。
17、进一步地,所述图卷积神经网络用于对多通道输入的视图进行多视图协同学习,获得药物-蛋白质对的多视图属性;
18、所述注意力机制用于对多视图属性进行融合,获得药物-蛋白质对的关联属性;
19、所述全连接网络层用于由药物-蛋白质对的关联属性得到输出药物-蛋白质对的相互作用得分,并利用非线性激活函数输出相互作用的概率值。
20、进一步地,还包括:通过交叉熵损失函数计算真实值与预测值间的损失,优化药物-靶点相互作用预测模型内部的参数。
21、进一步地,还包括:
22、将已知药物-蛋白质相互作用数据作为正样本数据,选取等量的未知相互作用关系的药物-蛋白质对作为负样本数据,生成平衡样本集;
23、利用药物-靶点相互作用预测模型,获得样本集中的样本数据的相互作用关系概率预测值;
24、记录真实样本标签值与模型预测值之间的损失值,以及评估模型分类能力的指标值。
25、本发明还提供了一种多视图网络学习结合子网络学习的药物-靶点相互作用预测系统,所述系统包括:
26、初始特征提取模块,用于获取蛋白质数据、药物数据以及药物-蛋白质相互作用关系数据,构建相互作用关联矩阵;获取药物、蛋白质关联的疾病以及药物副作用信息,结合药物-蛋白质相互作用关联矩阵构建药物-蛋白质关联多源异构网络;基于药物-蛋白质关联多源异构网络提取药物、蛋白质初始特征信息;
27、多视图网络构建模块,用于基于药物-蛋白质关联矩阵和药物、蛋白质初始特征信息,以药物-蛋白质对为节点构建药物-蛋白质对多视图网络;所述多视图网络包括拓扑视图、语义视图和协同视图;
28、多视图属性融合模块,用于基于药物-蛋白质对多视图网络,通过药物-靶点相互作用预测模型进行多视图协同学习,得到药物-蛋白质的相互作用概率预测值;所述药物-靶点相互作用预测模型包括图卷积神经网络、注意力机制和全连接网络层,以多视图为多通道输入,输出药物-蛋白质的相互作用概率预测值。
29、本发明的优点和积极效果:
30、本发明提供的技术方案从药物、蛋白质的邻居信息及子图出发,提取药物、蛋白质的初始特征,与现有通过全局信息进行属性挖掘的方法不同,更多地关注药物、蛋白质周围的局部信息,提高了特征的质量及有效性。与常规地以药物、蛋白质为节点构建异构网络的方法相比,本发明通过药物-蛋白质对构建多视图网络,将药物-蛋白质对看成一个整体进行全面、多角度地信息挖掘,获得药物-蛋白质对的整体特征表示,充分地考虑了药物-蛋白质之间的结合关系,并且可以将未知的药物或蛋白质添加进网络中,进而对其进行学习预测。本发明方法有助于提高药物-蛋白质预测准确度,这对发掘潜在的药物-蛋白质相互作用关系是十分有意义的,对于实际疾病诊断与治疗以及后续药物的研发存在一定价值。
1.一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,基于药物-蛋白质关联多源异构网络提取药物、蛋白质初始特征信息,包括:
3.根据权利要求1所述的一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,构建药物-蛋白质对多视图网络,包括:
4.根据权利要求1所述的一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,所述图卷积神经网络用于对多通道输入的视图进行多视图协同学习,获得药物-蛋白质对的多视图属性;
5.根据权利要求1所述的一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,还包括:通过交叉熵损失函数计算真实值与预测值间的损失,优化药物-靶点相互作用预测模型内部的参数。
6.根据权利要求1所述的一种多视图网络学习结合子网络学习的药物-靶点相互作用预测方法,其特征在于,还包括:
7.一种多视图网络学习结合子网络学习的药物-靶点相互作用预测系统,其特征在于,所述系统包括: