一种基于参数与特征迁移的胃肿瘤CT图像分类方法

文档序号:35476852发布日期:2023-09-16 18:24阅读:32来源:国知局
一种基于参数与特征迁移的胃肿瘤CT图像分类方法

本发明属于ct图像分类方法,具体涉及一种基于参数与特征迁移的胃肿瘤ct图像分类方法。


背景技术:

1、胃癌与原发性胃淋巴瘤为胃最常见的两种恶性肿瘤,在影像学上表现极其相似,但两种恶性肿瘤的治疗方法及预后迥异,因此,术前准确诊断胃癌或胃淋巴瘤至关重要,是制定正确治疗计划的前提,计算机断层扫描即ct,可以根据人体不同组织对x射线的吸收与透过率的不同进行组织图像重建,是胃肿瘤的主要检查手段,由于原发性胃淋巴瘤病灶常位于粘膜下层,而医生主要依据ct主观征象进行胃肿瘤的初步诊断,其诊断存在主观差异,敏感度及特异度相对不高,具有一定的局限性,迫切需要引入新方法对胃肿瘤进行辅助化评估,近年来,随着医学影像技术和计算机技术的发展,计算机辅助诊断备受关注,胃癌的辅助诊断主要分为传统的放射组学和深度学习两大类,传统放射组学方面,是利用逻辑回归方法构建放射学标签预测胃癌的复发概率,在内外测试集中诊断性能分别为0.840和0.730,另外一种是基于荧光高光谱成像技术结合支持向量机对早期胃癌患者进行诊断,还有一种是利用极限学习机进行胃癌和卵巢癌的诊断,在胃癌和卵巢癌影像上显示出较好的聚类性能,但需指出,传统方法采用人工定义的较低阶的放射学特征构建模型,需要医生精确勾画病灶,工作量大且存在主观性,导致构建的模型诊断精度和泛化性较差,相比于上述方法,深度学习因其不需要医生精确勾画病灶,通过对打框的病灶图像进行卷积操作来提取特征,能自动学习到与任务更相关的高阶特征的优势,不断有学者展开研究,基于深度学习对胃癌淋巴结转移问题展开研究,开发胃癌术前ct图像分类系统,显示出较好的预测性能(准确率为0.876),还有一种是利用vgg16卷积神经网络对胃癌的浸润程度进行预测,在测试集上准确率达到0.851,基于常见的深度学习框架进行胃癌诊断,研究表明基于densenet121网络框架的分类效果最佳,然而,深度学习方法的应用基于两个前提:第一个前提为训练数据和测试数据服从同分布;第二个前提为目标诊断数据量充足,但在临床实践中,受限于疾病发生率,仪器扫描参数不统一等问题,导致医学影像有效数据集小,训练数据和测试数据分布存在差异。因此,有必要寻找一种有效的数据整合算法,解决医学图像数据量不足以及特征差异问题,提高小数据集下模型的性能。


技术实现思路

1、本发明的目的在于提供一种基于参数与特征迁移的胃肿瘤ct图像分类方法,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:一种基于参数与特征迁移的胃肿瘤ct图像分类方法,包括如下步骤:

3、s1:基于densenet121网络进行卷积特征提取;

4、s2:基于mmd对提取的特征进行特征分析;

5、s3:通过正则化极限学习机分类算法对分析后的特征进行分类,生成诊断模型。

6、优选地,所述基于densenet121网络进行卷积特征提取步骤具体包括:

7、s11:将imagenet预训练的密集连接卷积神经网络作为公共特征提取器,基于公共特征提取器分别对胃部ct动静脉期病灶图像进行特征提取。

8、优选地,所述将imagenet预训练的密集连接卷积神经网络作为公共特征提取器,基于公共特征提取器分别对胃部ct动静脉期病灶图像进行特征提取步骤之后包括:

9、s12:假设前l-1层的输出特征为[f0,f1,...,fl-1],则第l层的特征输出fl为:

10、fl=zl([f0,f1,...,fl-1]);其中,为zl(*)复合函数,包括3×3和1×1的卷积、池化、批量归一化以及非线性激活函数四种运算;

11、s13:通过kde对源域和目标域特征数据的概率密度函数差异进行估计。

12、优选地,所述通过正则化极限学习机分类算法对分析后的特征进行分类,生成诊断模型的步骤具体包括:

13、s31:假设动脉期影像是满足p分布的源领域静脉期影像是满足q分布的目标领域令h为rkhs,那么x(s)和x(t)在rkhs中的mmd为:

14、

15、其中sup表示求上界,ep和eq表示期望,f(*)表示映射函数,h表示rkhs,在此空间内,概率分布p的平均嵌入表示为μ(p),则μ(p)是空间h中的唯一元素,则有:

16、ep[f(x(s))]=<f(x(s),μ(p)>h;

17、eq[f(x(t))]=<f(x(t),μ(q)>h;

18、s32:令d(p,q)表示数据分布p和q之间的mmd,则此距离的平方等价于两个分布的平均嵌入距离,即:

19、

20、由于μ(p)和μ(q)无法直接获取,这里采用均值作为其无偏估计的结果,则公式转换为:

21、

22、上式中,n表示源域样本数,m表示目标域数据的样本数,f(*):x→h表示原始特征空间映射到rkhs的映射函数,满足<f(x),f(y)>=k(x,y),该文选取k(x,y)为径向基核函数,即:

23、k(x,y)=exp(-||x-y||2/δ2);

24、其中δ表示高斯核大小,使用多个径向基核函数加权平均得到最终结果;

25、s33:假设dmmd=[d2(x(s),x(t))1,d2(x(s),x(t))2,...,d2(x(s),x(t))m]表示动静脉期影像特征mmd值的集合,其中m表示特征总维数,对应m=11264,然后选取所有的特征的mmd的均值为阈值σ,即:

26、

27、其中i表示第i维特征;

28、s34:基于上述阈值,mmd小于σ的特征为相似度更高的更有效的特征,分别选出对应的动脉期更有效的特征和静脉期更有效的特征。

29、优选地,所述基于上述阈值,mmd小于σ的特征为相似度更高的更有效的特征,分别选出对应的动脉期更有效的特征和静脉期更有效的特征步骤之后包括:

30、s35:对于n个病例u=(xi,ti)∈[rm,rn](i=1,2,...,n),具有k个隐含层神经元的elm输出表达式为:

31、

32、其中ti是第i个病例的期望输出,ak=(ak1,ak2,...,akm)t为输入层神经元与第k个隐含层神经元的连接权值向量,bk为第k个隐含层神经元的偏置,βk=(βk1,βk2,...,βkn)t为第k个隐含层神经元与输出神经元的连接权重向量,ak·xi表示ak与xi的内积,g(*)为隐含层的激活函数,即

33、公式的矩阵表示为:

34、hβ=t;

35、其中h表示隐含层节点的输出,β是输出层权重,t是神经网络的期望输出:

36、

37、β=(β1,β2,...,βk)k×n;

38、

39、s36:基于动脉期共享特征数据,随机设定输入层权重和隐含层偏置后,计算输出层的连接权重β,可以通过式hβ=t的极小2-范数最小二乘解,即

40、

41、其中为h的广义逆矩阵,

42、s37:通过l1范数正则化对输出权重矩阵进行稀疏约束,elm求解如下所示:

43、

44、对应公式转换为:

45、

46、其中λ为正则化系数,i为单位矩阵。

47、优选地,所述通过l1范数正则化对输出权重矩阵进行稀疏约束,elm求解如下所示:

48、

49、对应公式转换为:

50、

51、其中λ为正则化系数,i为单位矩阵步骤之后包括:

52、s38:获取源网络elm network 1的输入层权重及隐含层偏置,然后将源网络参数迁移到目标网络elm network 2,最后利用静脉期更有效的特征求解目标网络输出层权重,得到诊断模型。

53、优选地,所述rkhs为再生核希尔伯特空间。

54、优选地,所述kde为概率密度函数的非参数估计方法核密度估计方法。

55、优选地,所述mmd为最大均值差异。

56、与现有技术相比,本发明的有益效果是:

57、本发明通过将迁移学习思想和elm算法相结合,提出基于最大均值差异的迁移极限学习机的深度特征分类算法,为减少源域数据和目标域数据特征的分布差异,获取更有效的特征,本发明采用最大均值差异方法衡量动脉期和静脉期深度学习特征的概率分布,剔除冗余信息,选取分布差异更小的特征进行迁移;针对小样本数据下elm模型泛化性差的问题,本发明结合迁移学习思想,将源域网络模型参数迁移到目标网络中,融合两期图像的有效信息,得到泛化能力强、鲁棒性高的胃ct影像识别模型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1