一种基于图卷积神经网络的RNA分层嵌入聚类方法

文档序号:35289996发布日期:2023-09-01 11:21阅读:来源:国知局

技术特征:

1.一种基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:在步骤s1中,采用python包中的scanpy对单细胞rna测序的读取计数数据进行预处理,先过滤掉在任何细胞中都没有表达计数值的基因,再根据库大小对计数矩阵进行归一化并计算大小因子,后读取计数进行对数变换和缩放,使计数值遵循零均值和单位方差。

3.根据权利要求1所述的基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:在步骤s2中,zinb的表达式为下面的公式:

4.根据权利要求1所述的基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:在步骤s2中,降噪自编码器的结构为编码层、瓶颈层、解码层,编码层和解码层神经网络结构关于瓶颈层对称,且都是全连接的神经网络层,采用relu作为每层神经网络的激活函数。

5.根据权利要求4所述的基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:在步骤s2中,模型的编码层采用的每层神经元结构为d-256-54-32,其中d为输入数据的维度,32为瓶颈层的神经元个数,解码层结构从左到右的结构为32-54-256-d,d为输出数据的维度,与编码层结构对称,降噪自编码器训练过程中选择的批大小为256,在编码层引入的高斯噪声强度为2.5,利用adam优化算法对模型优化。

6.根据权利要求1所述的基于图卷积神经网络的rna分层嵌入聚类方法,其特征在于:在步骤s4中,训练图卷积自编码器使公式(4)的损失函数lr最小化,交替训练使训练得到的神经网络参数作为第二阶段参数优化的初始化,训练阶段的损失函数定义为l,该损失同时支配图自编码器的损失lr和聚类损失lc;


技术总结
本发明涉及生物信息学技术领域,具体涉及一种基于图卷积神经网络的RNA分层嵌入聚类方法,包括以下步骤:S1、数据预处理,S2、数据降噪,S3、数据降维,S4、数据聚类,本发明在降噪中使用零膨胀负二项分布的负对数似然函数作为降噪自编码器的损失函数,用来处理数据中的dropout噪声,在降维任务中使用双解码图卷积自编码器来获取数据的低维特征,在聚类任务利用KL散度函数作为聚类的损失函数进行深度嵌入聚类,促进聚类精度的提升,具有更好的聚类效果。

技术研发人员:鲁大营,刘化社,孔晨曦,鲁克,曹鲁成,柴华,樊稳稳,刘原
受保护的技术使用者:曲阜师范大学
技术研发日:
技术公布日:2024/1/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1