基于知识增强超图对比学习的癌症辅助决策方法

文档序号:41175928发布日期:2025-03-07 11:51阅读:19来源:国知局
基于知识增强超图对比学习的癌症辅助决策方法

本发明涉及智能医疗,特别是涉及一种基于知识增强超图对比学习的癌症辅助决策方法。


背景技术:

1、药物协同关系对于提高癌症治疗效果至关重要。癌症的复杂机制给有效治疗带来了重大挑战,药物治疗即使初期有效,最终也可能会出现耐药性。研究表明,传统的单一化合物靶向单一分子的治疗方法并不总是有效。因此,预测药物协同关系对临床进行辅助决策具有重大意义。

2、预测药物协同关系是一项复杂且艰巨的任务。考虑到通过临床试验和高通量筛选选择有效的药物组合既耗时又费力,因此这种方法是不切实际的。计算方法已成为一种可行的替代方案,主要包括数学方法和机器学习方法。尽管数学方法因其对大数据集的处理能力有限且依赖于先验知识而受到阻碍,但传统的机器学习方法,如随机森林、支持向量机和逻辑回归,能够取得相对不错的结果。然而,这些方法仍落后于基于表型的前沿深度学习方法。这些方法通过在细胞系中训练模型来预测药物协同关系,通常将两个药物、一个细胞系和一个协同关系标签作为一个四元组来表示样本。然而,这些方法通常只是简单地将这四条信息连接在一起,可能忽略了它们之间复杂的相互关系。近年来,基于图模型的方法在捕捉药物组合与细胞系之间的高阶依赖关系方面展现了其有效性。超图为建模药物协同关系数据提供了一个天然适合的框架。

3、但是现有基于超图的药物协同关系预测方法面临着标签稀疏的问题,这导致训练时所用超图的超边稀疏,限制了模型效果。


技术实现思路

1、本发明的目的在于提供一种基于知识增强超图对比学习的癌症辅助决策方法,考虑到药物、细胞系之间的高阶依赖关系,得到良好的表征更好地用于预测协同关系,为临床辅助决策提供良好的基础。

2、一种基于知识增强超图对比学习的癌症辅助决策方法,其包括:

3、s1,获取包括若干个样本数据的原始药物协同关系数据集,所述样本数据为药物-药物-细胞系-实际协同关系的四元组数据;

4、s2,基于各所述样本数据构建训练超图,并对所述训练超图进行增强操作得到第一增强视图和第二增强视图,基于所述训练超图、所述第一增强视图和所述第二增强视图对图卷积网络、全连接网络、超图神经网络和预测网络进行对比训练,得到训练好的所述图卷积网络、所述全连接网络、所述超图神经网络和所述预测网络;

5、s3,基于训练好的所述图卷积网络对待测数据集中的药物进行特征提取,得到若干个待测药物分子表征;基于训练好的所述全连接网络对待测数据集中的若干个细胞系进行特征提取,得到若干个待测细胞系分子表征;基于训练好的所述图卷积网络对各所述样本数据的药物进行特征提取,得到若干个样本药物分子表征;基于训练好的所述全连接网络对各所述样本数据中的细胞系进行特征提取,得到若干个样本细胞系分子表征;

6、s4,以各所述样本药物分子表征和各所述样本细胞系分子表征为样本顶点构建样本超图,以各所述待测药物分子表征和各所述待测细胞系分子表征为待测顶点更新到所述样本超图中,得到待测超图;

7、s5,将所述待测超图输入到训练好的所述超图神经网络中得到各所述待测顶点的嵌入表示;

8、s6,将各所述待测顶点的嵌入表示输入到训练好的所述预测网络中得到所述待测数据集中各药物的协同关系。

9、可选地,所述s2包括:

10、s21,使用图卷积网络对所述样本数据中的药物进行特征提取,得到若干个训练药物分子表征;使用全连接网络对各所述样本数据中的细胞系进行特征提取,得到若干个训练细胞系分子表征;

11、s22,以各所述训练药物分子表征和各所述训练细胞系分子表征为训练顶点,在具有拮抗作用的药物所对应的训练药物分子表征之间添加边,得到药物关系矩阵,在相似性大于相似设定值的细胞系所对应的训练细胞系分子表征之间添加边,得到细胞系相似性矩阵,在协同关系大于关系阈值所对应的训练药物分子表征和训练细胞系分子表征之间添加超边,得到超边矩阵和所述训练超图,并对所述训练超图进行增强操作得到所述第一增强视图和所述第二增强视图;

12、s23,基于所述超图神经网络得到所述训练超图中各训练顶点的嵌入表示、所述第一增强视图中各训练顶点的嵌入表示和所述第二增强视图中各训练顶点的嵌入表示;

13、s24,将各所述样本数据对应的所述训练超图中各所述训练顶点的嵌入表示作为一个集合,得到若干个训练嵌入集合,将各所述训练嵌入集合输入到所述预测网络中,得到若干个训练预测协同关系;基于投影头对所述第一增强视图中各训练顶点的嵌入表示和所述第二增强视图中各训练顶点的嵌入表示进行转换,得到第一对比学习参考数据和第二对比学习参考数据;

14、s25,基于所述训练预测协同关系、所述第一对比学习参考数据和所述第二对比学习参考数据获得目标损失函数值,并基于所述目标损失函数值对所述图卷积网络、所述全连接网络、所述超图神经网络、所述预测网络和所述投影头进行优化更新;

15、s26,重复执行s21-s25,得到训练好的所述图卷积网络、训练好的所述全连接网络、训练好的所述超图神经网络和训练好的所述预测网络。可选地,药物的分子图表示为,其中代表药物分子中个原子的维特征向量集合,代表原子之间的连接矩阵,表示药物分子中的原子键,表示实数集;细胞系使用651个基因表达;可选地,所述图卷积网络包括k层更新层和最大池化层;所述更新层表达式为:;

16、式中:表示第个药物,表示第个药物的第个原子,为更新层的激活函数,表示第个药物的第个原子在第层更新层的更新特征,表示第个药物的第个原子在第层更新层的更新特征,为第个药物在第层更新层的参数矩阵,,为第个药物的度数矩阵,所述最大池化层表达式为:;

17、式中:表示第个药物的药物分子表征,表示第个药物第个原子在第层更新层的更新特征;;

18、式中:

19、细胞系分子表征表达式为:表示第个细胞系的细胞系分子表征,为全连接网络的激活函数,表示651个基因表达,表示全连接网络第0层的参数矩阵,表示全连接网络第层的参数矩阵,为全连接网络的层数。

20、可选地,所述超图神经网络包括若干个超边卷积层;

21、当所述待测超图中的顶点为样本顶点时,所述超边卷积层表达式为:;

22、当所述待测超图中的顶点为待测顶点时,所述超边卷积层表达式为:;

23、式中:表示第层超边卷积层,表示待测超图的顶点在第层超边卷积层的分子表征,表示超图的顶点在第层超边卷积层的分子表征,是超边矩阵,表示超边度数矩阵,表示顶点度数矩阵,表示超边权重矩阵,表示第层超边卷积层的特征提取矩阵,为转置。

24、可选地,所述训练嵌入集合包括两个训练药物嵌入表示和一个训练细胞系嵌入表示,两个所述训练药物嵌入表示对应所述样本数据中的两个药物,将两个所述训练药物嵌入分别定义为第一训练药物嵌入表示和第二训练药物嵌入表示;

25、所述预测网络表达式为:;

26、式中:表示训练预测协同关系,表示第一训练药物嵌入表示,表示第二训练药物嵌入表示,表示训练细胞系嵌入表示,表示预测网络的权重矩阵,表示预测网络的激活函数,表示预测网络的第一偏置,表示预测网络的第二偏置。可选地,所述目标损失函数值表达式为:;

27、式中:为目标损失函数值,为权重参数,为药物对比学习损失值,为细胞系对比学习损失值,为预测网络损失值。

28、可选地,预测网络损失值表达式为:;

29、式中:为训练嵌入集合的数量,表示第个训练嵌入集合对应的训练预测协同关系,表示第个训练嵌入集合对应的实际协同关系。

30、可选地,所述第一对比学习参考数据包括第一药物对比学习参考数据和第一细胞系对比学习参考数据,所述第二对比学习参考数据包括第二药物对比学习参考数据和第二细胞系对比学习参考数据;

31、药物对比学习损失值表达式为:;;式中,表示细胞系对比损失函数,为细胞系集合,为各所述样本数据中包含的细胞系的总数量,表示第一细胞系对比学习参考数据中第i个值,为第i个细胞系对应的第一个对比的值,表示第二细胞系对比学习参考数据中第i个值,为第i个细胞系对应的第二个对比的值,为细胞系相似矩阵中第行第列的值,代表第个细胞系和第个细胞系的相似性是否大于相似设定值。本发明的效果如下:

32、本发明基于知识增强超图对比学习的癌症辅助决策方法,考虑到药物、细胞系之间的高阶依赖关系,使用超图进行建模,得到良好的表征更好地用于预测协同关系。

33、本发明基于知识增强超图对比学习的癌症辅助决策方法,在超图的基础上引入对比学习,可以依赖知识引导超图对比学习缓解数据稀疏问题,有利于得到好的药物组合与细胞系的嵌入表示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1