一种医学图像分割中的难样本处理算法

文档序号:35421644发布日期:2023-09-13 08:45阅读:67来源:国知局
一种医学图像分割中的难样本处理算法

本发明涉及一种医学图像分割中的难样本处理算法,属于医学图像处理领域。


背景技术:

1、在面对图像语义分割的任务时,可以按照学习的难度进行区分,训练集可以分为难样本和简单样本。难样本一般是难以学习的样本,对应着不平衡样本,一般表现为损失函数的值较大以及分割出来的样本各类指标较差。在建立模型的时候,如果难样本在训练集中占据比例很小,那么它们对于损失函数和梯度下降贡献都比较小,所以损失函数需要对这些不同的困难样本有着不同的特殊处理,例如权重分配、系数等。对于心脏mri图像来说,从设备的角度上显示的图像是扫描断层,所以一定会存在扫描层的最后几张图像,这些图像一般是心脏的尖端,待分割区域会表现的很小。对于心脏mri图像的难样本的定义是像素级难样本。

2、解决难样本问题的具体思路有着较多的方法。其中包括(1)难样本数据增强。难样本数据增强有两点好处,第一和上面的扩大数据量一致,使得难样本绝对数量增加;第二是可以缩小简单样本和难样本比例,使得每个batch,难样本对梯度影响更大,训练效果偏向于难样本。(2)损失函数的改进。所有应对难样本的损失函数改进核心出发点是增大损失函数大的样本对梯度的贡献。可以选择减少其他样本的权重或对难样本进行特殊项处理等。例如focal loss在损失函数上就可以使得难样本在损失函数中贡献更大,从而使得训练效果对难样本学的更好。(3)在线难样本挖掘策略。在线难样本挖掘策略核心思想是,训练模型的过程中,每过几个epoch,计算每个样本的损失函数的值,然后加入更多的难样本。实际中除了训练数据外还有一个数据池,用于存放额外的数据,并用来筛选难样本的数据池。当然也可以采用一种类似于重采样的做法,训练中的数据和和数据池中的数据一样,每次从数据池中选择难样本放入训练中的数据集中,用于最终的训练。


技术实现思路

1、本发明目的是提供一种医学图像分割中的难样本处理算法,解决了存在难样本的心脏mri图像数据集中的难以分割目标区域的问题。

2、为实现上述目的,本发明提供了一种医学图像分割中的难样本处理算法,包括以下步骤:

3、步骤1:划分数据集,将数据集按照4:3:3划分为训练集、验证集和测试集;

4、步骤2:确定正样本为待分割区域,负样本为背景,确定数据集中待分割区域较小的样本图像为难样本;

5、步骤3:利用非侵入目标区域cutout算法预处理方法对分割的mri图像进行数据扩增处理,获得与待分割区域相关度高的初始的训练模型;将得到的裁剪之后的图像,划分数据集,得到训练集数据、验证集数据和测试集数据;

6、步骤4:将基于对比学习的医学图像分割网络的损失函数部分加入难样本召回损失函数,并利用所述医学图像分割网络对所述mri图像数据集进行训练,获得最终的训练模型;如果训练任务中存在半监督任务或者其他下游任务中,在基于自训练的框架下,利用伪标签对无标签的数据集进行训练并获得最终的训练模型。

7、作为本发明的进一步改进,所述步骤3具体包括:

8、步骤31:通过非侵入目标区域的cutout算法确定训练集中的最近切割点,所述最近切割点由所有训练集的待分割区域中面积最大的一块决定的,是该区域中距离图像边缘最近的点;

9、步骤32:以最近切割点为顶点,与图像边缘一起形成矩形,不侵入前景区域,对所述的矩形进行切割,剩余部分即为经非侵入目标区域cutout算法得到的增强数据;

10、步骤33:将切割后的训练集放入所述初始的训练模型中训练,让所述初始的训练模型在不影响模型学习待分割区域的位置信息和特征纹理的情况下,减少对冗余区域的特征的学习。

11、作为本发明的进一步改进,所述步骤4中的所述难样本召回损失函数如下所示:

12、

13、其中,tp代表了被模型预测正确的正样本,fn代表了被模型预测错误的正样本。

14、作为本发明的进一步改进,所述步骤4还包括:

15、在使用难样本召回损失函数时,当正样本为小目标时,通过二值交叉损失函数与难样本损失函数相加,共同指导模型梯度下降,所述难样本召回损失函数与所述二值交叉损失函数的结合公式如下所示:

16、ltotal=lbce+lrecall;

17、其中,lbce代表二值交叉损失函数,lrecall代表难样本召回损失函数。

18、与现有技术相比,本发明的医学图像分割中的难样本处理算法,关注到难样本下的小目标区域并有效定位,通过非侵入目标区域cutout算法在保证待分割区域不被侵入受损的前提下,减少冗余区域的特征像素,减轻模型对于冗余区域的分割压力,从而提升模型的可靠性,在一定程度上解决了心脏医学图像数据集中难样本的分割问题,更好地提高心脏医学图像分割上的准确性。



技术特征:

1.一种医学图像分割中的难样本处理算法,应用于对特定组织结构mri图像中的难样本进行分割,其特征在于,包括以下步骤:

2.根据权利要求1所述的医学图像分割中的难样本处理算法,其特征在于,所述步骤3具体包括:

3.根据权利要求1所述的医学图像分割中的难样本处理算法,其特征在于,所述步骤4中的所述难样本召回损失函数如下所示:

4.根据权利要求3所述的医学图像分割中的难样本处理算法,其特征在于,所述步骤4还包括:


技术总结
本发明提供一种医学图像分割中的难样本处理算法,包括以下步骤:对待分割的医学图像进行预处理,通过标签得到前景与背景,将前景作为正样本,背景作为负样本;利用基于对比学习的医学图像分割网络模型以及后处理算法对医学图像数据集进行训练;利用难样本召回损失函数和非侵入目标区域Cutout算法对图像中的难样本进行特殊的处理。难样本召回损失函数能够关注到难样本下的小目标区域并有效定位,非侵入目标区域Cutout算法能够在保证待分割区域不被侵入受损的前提下,减少冗余区域的特征像素,减轻模型对于冗余区域的分割压力,从而提升模型的可靠性,在一定程度上解决了心脏医学图像数据集中难样本的分割问题,更好地提高心脏医学图像分割的准确性。

技术研发人员:朱恩嵘,胡晓飞,赵昊宸,吴佳芸
受保护的技术使用者:南京邮电大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1