本发明涉及药物-靶标关联预测,具体涉及一种应用对比学习充分融合超图图结构和药物-靶标图结构的药物与靶标特征信息以用于药物-靶标关联预测方法。
背景技术:
1、药物-靶标关联预测旨在已知的药物靶标关联预测任务基础上,进一步探索未知和潜在的药物-靶标相互作用关系。这对于利用已知药物治疗疾病、加速药物研发过程以及降低药物研发成本都有重要的意义。然而,传统的生物湿实验方法(如靶标质谱、细胞系实验以及原位杂交等技术),存在高开发成本和长研发周期缺陷。因此,利用计算的方法有效解决药物靶标关联预测问题,将极大促进相关科研人员准确地选择潜在的药物靶标,提高药物研发的成功率。然而,目前基于计算方法的药物-靶标相互作用预测方法面临着数据稀疏、预测精度低下以及融合特征不充分挑战,且它们普遍只考虑了药物-靶标图结构信息、未充分考虑融合药物-靶标超图结构特征信息等问题。而基于对比学习方法在融合特征信息同时有效对比两种图结构信息增益差,本发明提出一种应用对比学习充分融合特征用于药物-靶标关联预测方法。
技术实现思路
1、本发明的目的是为了解决上述药物-靶标相互作用预测领域所存在的困难,提供一种应用对比学习充分融合特征用于药物-靶标关联预测方法,在利用对比学习方法对比图结构差异同时,并且将图结构信息充分融合到药物及靶标特征中、丰富药物-靶标特征表示,进一步帮助科研工作者完成药物-靶标关联预测任务。本发明的技术方案如下:
2、a、基于已知药物-靶标相互作用关联构建药物超图和靶标超图。
3、b、基于药物超图和靶标超图,进一步构建基于超图的药物-药物相似性和靶标-靶标相似性,利用对比学习方法分别获取药物和靶标的特征表示。
4、c、基于全连接神经网络实现对药物-靶标关联预测。
5、d、基于自适应矩估计反向传播优化算法训练参数。
6、根据权利a所述的基于已知药物-靶标相互作用关联构建药物超图和靶标超图。本发明从drugbank(version 6.0)数据库中收集并下载药物-靶标相互作用数据作为原始数据。基于药物-靶标相互作用关联数据,将每种靶标作为一条超边连接所有(一种或多种)与其作用的药物节点,构建出药物超图。同理,在构造的靶标超图中每种药物作为一条超边连接对应靶标节点。
7、根据权利b所述的基于药物超图和靶标超图,进一步构建基于超图的药物-药物相似性和靶标-靶标相似性,利用对比学习方法分别获取药物和靶标的特征表示。基于构建的药物超图和靶标超图,考虑到不同药物或靶标对彼此亲和力影响程度的差异表现,每条超边被赋予单独权重值,以进一步构建基于超图的药物-药物相似性和靶标-靶标相似性。利用对比学习算法在药物-药物相似性和药物-靶标关联中综合学习药物特征表示、在靶标-靶标相似性和药物-靶标关联中综合学习靶标特征表示。
8、根据权利c所述的基于全连接神经网络实现对药物-靶标关联预测。本发明将学习到的药物综合特征表示与靶标综合特征表示拼接作为药物-靶标的最终特征,并将其投入全连接神经网络,引入dropout操作防止过拟合、完成药物-靶标的关联预测任务。
9、根据权利d所述的基于自适应矩估计反向传播优化算法训练参数。本发明使用结合了动量梯度下降和rmsprop算法的自适应矩估计优化算法,该优化算法综合了梯度的一阶和二阶矩估计,通过自适应地调整每个参数的学习率,在训练过程中适应不同参数的梯度变化。自适应矩估计反向传播优化算法入了动量项,在梯度更新中保留一些历史信息、保留了训练惯性,加快全连接神经网络的训练速度同时减少噪声或稀疏梯度的状况。
1.一种应用对比学习充分融合特征用于药物-靶标关联预测方法,包括以下部分:
2.根据权利要求1所述的基于已知药物-靶标相互作用关联构建药物超图和靶标超图。本发明从drugbank(version 6.0)数据库中收集并下载药物-靶标相互作用数据作为原始数据。基于药物-靶标相互作用关联数据,将每种靶标作为一条超边连接所有(一种或多种)与其作用的药物节点,构建出药物超图。同理,在构造的靶标超图中每种药物作为一条超边连接对应靶标节点。
3.根据权利要求1所述的基于药物超图和靶标超图,进一步构建基于超图的药物-药物相似性和靶标-靶标相似性,利用对比学习方法分别获取药物和靶标的特征表示。基于构建的药物超图和靶标超图,考虑到不同药物或靶标对彼此亲和力影响程度的差异表现,每条超边被赋予单独权重值,以进一步构建基于超图的药物-药物相似性和靶标-靶标相似性。利用对比学习算法在药物-药物相似性和药物-靶标关联中综合学习药物特征表示、在靶标-靶标相似性和药物-靶标关联中综合学习靶标特征表示。
4.根据权利要求1所述的基于全连接神经网络实现对药物-靶标关联预测。本发明将学习到的药物综合特征表示与靶标综合特征表示拼接作为药物-靶标的最终特征,并将其投入全连接神经网络,引入dropout操作防止过拟合、完成药物-靶标的关联预测任务。
5.根据权利要求1所述的基于自适应矩估计反向传播优化算法训练参数。本发明使用结合了动量梯度下降和rmsprop算法的自适应矩估计优化算法,该优化算法综合了梯度的一阶和二阶矩估计,通过自适应地调整每个参数的学习率,在训练过程中适应不同参数的梯度变化。自适应矩估计反向传播优化算法入了动量项,在梯度更新中保留一些历史信息、保留了训练惯性,加快全连接神经网络的训练速度同时减少噪声或稀疏梯度的状况。