一种应用对比学习充分融合特征用于药物-靶标关联预测方法

文档序号：37658651发布日期：2024-04-18 20:32阅读：12来源：国知局

本发明涉及药物-靶标关联预测，具体涉及一种应用对比学习充分融合超图图结构和药物-靶标图结构的药物与靶标特征信息以用于药物-靶标关联预测方法。

背景技术：

1、药物-靶标关联预测旨在已知的药物靶标关联预测任务基础上，进一步探索未知和潜在的药物-靶标相互作用关系。这对于利用已知药物治疗疾病、加速药物研发过程以及降低药物研发成本都有重要的意义。然而，传统的生物湿实验方法(如靶标质谱、细胞系实验以及原位杂交等技术)，存在高开发成本和长研发周期缺陷。因此，利用计算的方法有效解决药物靶标关联预测问题，将极大促进相关科研人员准确地选择潜在的药物靶标，提高药物研发的成功率。然而，目前基于计算方法的药物-靶标相互作用预测方法面临着数据稀疏、预测精度低下以及融合特征不充分挑战，且它们普遍只考虑了药物-靶标图结构信息、未充分考虑融合药物-靶标超图结构特征信息等问题。而基于对比学习方法在融合特征信息同时有效对比两种图结构信息增益差，本发明提出一种应用对比学习充分融合特征用于药物-靶标关联预测方法。

技术实现思路

1、本发明的目的是为了解决上述药物-靶标相互作用预测领域所存在的困难，提供一种应用对比学习充分融合特征用于药物-靶标关联预测方法，在利用对比学习方法对比图结构差异同时，并且将图结构信息充分融合到药物及靶标特征中、丰富药物-靶标特征表示，进一步帮助科研工作者完成药物-靶标关联预测任务。本发明的技术方案如下：

2、a、基于已知药物-靶标相互作用关联构建药物超图和靶标超图。

3、b、基于药物超图和靶标超图，进一步构建基于超图的药物-药物相似性和靶标-靶标相似性，利用对比学习方法分别获取药物和靶标的特征表示。

4、c、基于全连接神经网络实现对药物-靶标关联预测。

5、d、基于自适应矩估计反向传播优化算法训练参数。

6、根据权利a所述的基于已知药物-靶标相互作用关联构建药物超图和靶标超图。本发明从drugbank(version 6.0)数据库中收集并下载药物-靶标相互作用数据作为原始数据。基于药物-靶标相互作用关联数据，将每种靶标作为一条超边连接所有(一种或多种)与其作用的药物节点，构建出药物超图。同理，在构造的靶标超图中每种药物作为一条超边连接对应靶标节点。

7、根据权利b所述的基于药物超图和靶标超图，进一步构建基于超图的药物-药物相似性和靶标-靶标相似性，利用对比学习方法分别获取药物和靶标的特征表示。基于构建的药物超图和靶标超图，考虑到不同药物或靶标对彼此亲和力影响程度的差异表现，每条超边被赋予单独权重值，以进一步构建基于超图的药物-药物相似性和靶标-靶标相似性。利用对比学习算法在药物-药物相似性和药物-靶标关联中综合学习药物特征表示、在靶标-靶标相似性和药物-靶标关联中综合学习靶标特征表示。

8、根据权利c所述的基于全连接神经网络实现对药物-靶标关联预测。本发明将学习到的药物综合特征表示与靶标综合特征表示拼接作为药物-靶标的最终特征，并将其投入全连接神经网络，引入dropout操作防止过拟合、完成药物-靶标的关联预测任务。

9、根据权利d所述的基于自适应矩估计反向传播优化算法训练参数。本发明使用结合了动量梯度下降和rmsprop算法的自适应矩估计优化算法，该优化算法综合了梯度的一阶和二阶矩估计，通过自适应地调整每个参数的学习率，在训练过程中适应不同参数的梯度变化。自适应矩估计反向传播优化算法入了动量项，在梯度更新中保留一些历史信息、保留了训练惯性，加快全连接神经网络的训练速度同时减少噪声或稀疏梯度的状况。

技术特征：

1.一种应用对比学习充分融合特征用于药物-靶标关联预测方法，包括以下部分：

2.根据权利要求1所述的基于已知药物-靶标相互作用关联构建药物超图和靶标超图。本发明从drugbank(version 6.0)数据库中收集并下载药物-靶标相互作用数据作为原始数据。基于药物-靶标相互作用关联数据，将每种靶标作为一条超边连接所有(一种或多种)与其作用的药物节点，构建出药物超图。同理，在构造的靶标超图中每种药物作为一条超边连接对应靶标节点。

3.根据权利要求1所述的基于药物超图和靶标超图，进一步构建基于超图的药物-药物相似性和靶标-靶标相似性，利用对比学习方法分别获取药物和靶标的特征表示。基于构建的药物超图和靶标超图，考虑到不同药物或靶标对彼此亲和力影响程度的差异表现，每条超边被赋予单独权重值，以进一步构建基于超图的药物-药物相似性和靶标-靶标相似性。利用对比学习算法在药物-药物相似性和药物-靶标关联中综合学习药物特征表示、在靶标-靶标相似性和药物-靶标关联中综合学习靶标特征表示。

4.根据权利要求1所述的基于全连接神经网络实现对药物-靶标关联预测。本发明将学习到的药物综合特征表示与靶标综合特征表示拼接作为药物-靶标的最终特征，并将其投入全连接神经网络，引入dropout操作防止过拟合、完成药物-靶标的关联预测任务。

5.根据权利要求1所述的基于自适应矩估计反向传播优化算法训练参数。本发明使用结合了动量梯度下降和rmsprop算法的自适应矩估计优化算法，该优化算法综合了梯度的一阶和二阶矩估计，通过自适应地调整每个参数的学习率，在训练过程中适应不同参数的梯度变化。自适应矩估计反向传播优化算法入了动量项，在梯度更新中保留一些历史信息、保留了训练惯性，加快全连接神经网络的训练速度同时减少噪声或稀疏梯度的状况。

技术总结
本发明提供了一种应用对比学习充分融合特征用于药物‑靶标关联预测方法，涉及生物信息学、深度学习以及关联预测领域。首先，我们整合并下载相关药物‑靶标关联作为初始数据，利用靶标和药物作为超边分别构建药物超图和靶标超图。然后，基于构建的药物超图和靶标超图提取药物‑药物相似性信息和靶标‑靶标相似性信息，并利用对比学习的方法将其与药物‑靶标关联图结构信息充分融合到药物特征和靶标特征。最终将充分融合的药物特征与靶标特征拼接作为药物‑靶标特征表示，输入到全连接神经网络中实现药物‑靶标关联预测任务。使用自适应矩估计反向传播优化算法优化整体模型参数，通过不断迭代提升药物‑靶关联预测的准确率。

技术研发人员：刘英业,王淑栋,任传儒,韩雪敏,王锐乾,李恒霄
受保护的技术使用者：中国石油大学（华东）
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘英业,王淑栋,任传儒,韩雪敏,王锐乾,李恒霄
技术所有人：中国石油大学（华东）
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。