本发明属于数字图像处理,尤其涉及一种基于无监督域适应的胃癌病理图像分割方法。
背景技术:
1、病理活检是目前诊断胃癌的“金标准”,它是指病理学家对采集得到的胃癌病理切片样本在显微镜下用肉眼进行观察,对大量细胞和组织区域进行分析识别从而做出诊断。但是这种方法不仅费时费力、还会因为病理学家的主观经验差异导致患者诊断结果不准确。因此,为了帮助病理学家建立一套客观统一的病理样本分析标准,基于全玻片数字化扫描技术(wholeslideimaging,wsi)的数字化病理分析在病理学领域得到了应用与发展。基于全玻片数字化扫描技术,将病理切片进行扫描得到高分辨率的数字病理图像,而后利用基于深度学习算法的图像处理技术对病理图像进行分类、检测、分割等分析,辅助病理学家进行进一步的组织分级或量化分析。
2、目前深度学习算法在数字化病理分析的三大主流任务之一—图像分割任务,能够帮助病理学家准确高效地识别与定位感兴趣区域,降低病理学家阅片难度,辅助病理学家进行癌症分化等级,评估治疗效果,实现预后评估。然而,目前的病理图像分割方法仍然高度依赖于大量具有像素级标注的数据。医学图像数据的人工标注需要由专业人员来进行,并且像素级标注过程费时费力,收集带有大量标注的数据集来训练深度学习模型难度非常大。
3、除此之外,在病理切片样本的制备过程中,必不可少的环节之一是组织染色,添加染色成分可以使自然透明的组织元素变得更容易区分。然而,染色过程以及扫描仪设备的差异均会导致数字化病理图像中的组织呈现出不同的颜色外观和亮度。不同患者的组织形态比如癌细胞形态、粘连程度、面积大小等也可能出现明显差异。即使是相同组织类型的病理图像数据,所述的颜色外观、亮度以及组织形态等差异不仅会影响病理学家的分析评估,还会降低深度学习分割算法的泛化性能。
技术实现思路
1、本发明的目的是提供一种基于无监督域适应的胃癌病理图像分割方法,该方法能够利用现有的胃癌病理图像的标注信息,实现对不同来源的胃癌病理图像的像素级标注。
2、为实现上述目的,本发明提供了一种基于无监督域适应的胃癌病理图像分割方法,包括以下步骤:
3、获取胃癌病理的源域图像和目标域图像,并构建源域图像数据集和目标域图像数据集;
4、对所述源域图像数据集进行判断,并基于所述源域图像数据集进行预训练,获取分割网络的预训练模型;
5、基于所述分割网络的预训练模型构建第二mean-teacher训练模型,实现基于所述第二mean-teacher训练模型的无监督域适应分割训练,获取训练好的分割网络模型;
6、采用所述训练好的分割网络模型对所述目标域图像进行预测,获取所述目标域图像数据集的像素级标注,实现基于无监督域适应的胃癌病理图像分割。
7、可选的,获取所述胃癌病理的源域图像和目标域图像,并构建所述源域图像数据集和所述目标域图像数据集包括:
8、将带有像素级标注的胃癌病理图像作为所述胃癌病理的源域图像,基于若干所述胃癌病理的源域图像构建所述源域图像数据集;
9、将无标注的胃癌病理图像数据作为所述胃癌病理的目标域图像,基于若干所述胃癌病理的目标域图像构建所述目标域图像数据集。
10、可选的,对所述源域图像数据集进行判断,并基于所述源域图像数据集进行预训练,获取所述分割网络的预训练模型包括:
11、若所述源域图像数据集的像素级标注无噪音,则基于所述源域图像数据集对分割网络模型进行预训练,获取所述分割网络的预训练模型;
12、若所述源域图像数据集的像素级标注有噪音,构建第一mean-teacher训练模型并基于所述源域图像数据集进行预训练,获取所述分割网络的预训练模型。
13、可选的,基于所述源域图像数据集对所述分割网络模型进行预训练,获取所述分割网络的预训练模型包括:
14、将所述胃癌病理源域图像输入所述分割网络模型,计算所述分割网络模型的输出和所述源域图像标注的损失函数;
15、所述分割网络模型利用所述源域图像标注的损失函数进行训练,并基于所述源域图像数据集对所述分割网络模型进行预训练,直至在所述目标域图像集上预测效果最好,获取所述分割网络的预训练模型。
16、可选的,构建所述第一mean-teacher训练模型并基于所述源域图像数据集进行预训练,获取所述分割网络的预训练模型包括:
17、构建若干个结构相同的所述分割网络模型;
18、基于若干个所述结构相同的分割网络模型,构建所述第一mean-teacher训练模型,所述第一mean-teacher训练模型包括第一教师模型和第一学生模型;
19、利用所述源域图像数据集对所述第一学生模型进行训练,并利用噪声标注校正方法对源域噪声标注进行校正,预训练获取所述分割网络的预训练模型。
20、可选的,利用所述源域图像数据集对所述第一学生模型进行训练,并利用噪声标注校正方法对所述源域噪声标注进行校正,预训练获取所述分割网络的预训练模型包括:
21、基于所述源域图像数据集,获取所述源域噪声标注;
22、将所述源域图像数据集输入所述第一教师模型进行预测,获取所述源域图像数据集的分割概率图;
23、采用噪声标注校正法,基于所述分割概率图估计获取所述源域噪声标注的二值化错误掩膜;
24、利用所述二值化错误掩膜对所述源域噪声标注进行校正,获取校正后的标注;
25、所述校正后的标注对所述第一学生模型进行预训练,直至获取所述目标域图像数据集的验证集上预测效果最好的第一学生模型;
26、所述预测效果最好的第一学生模型为所述分割网络的预训练模型。
27、可选的,基于所述分割网络的预训练模型构建所述第二mean-teacher训练模型,实现基于所述第二mean-teacher训练模型的无监督域适应分割训练,获取所述训练好的分割网络模型包括:
28、将所述分割网络的预训练模型作为第二教师模型,构建与所述分割网络的预训练模型结构相同的第二学生模型;
29、基于所述第二教师模型和所述第二学生模型,构建所述第二mean-teacher训练模型;
30、引入动态自适应染色变换,对所述源域图像和所述目标域图像进行跨染色风格增强,获取具有目标域图像染色风格的源域图像和目标域图像;
31、利用所述具有目标域图像染色风格的源域图像和目标域图像对所述第二学生模型进行无监督域适应分割训练,实现基于所述第二mean-teacher训练模型的无监督域适应分割训练,获取所述目标域图像数据集上分割效果最好的第二学生模型;
32、所述分割效果最好的第二学生模型为所述训练好的分割网络模型。
33、可选的,所述第二mean-teacher训练模型包括所述第二学生模型和所述第二教师模型;
34、所述第二学生模型采用随机初始化进行权重初始化;
35、所述第二教师模型采用所述分割网络的预训练模型进行权重初始化。
36、可选的,采用所述训练好的分割网络模型对所述目标域图像进行预测,获取所述目标域图像数据集的像素级标注包括:
37、采用所述训练好的分割网络模型对目标域图像进行预测,评估所述分割网络模型性能,获得目标域图像数据集的像素级标注。
38、本发明具有以下有益效果:
39、本发明所提出的一种基于无监督域适应的胃癌病理图像分割方法,可以通过采用噪声标注校正策略减轻标注噪声对分割网络模型带来的负面影响,利用动态自适应染色变换融合不同数据集的染色信息,提高分割网络模型对染色差异的鲁棒性,同时在训练过程中根据样本分割的难易程度调整图像对网络模型训练的贡献度,提高了胃癌病理图像分割算法的分割准确性;本发明充分利用了无监督域适应训练方法,提升了算法对病理图像染色外观差异和细胞形态差异的鲁棒性,实现对不同来源以及不同批次的胃癌病理图像的准确分割,减轻了深度学习算法对人工标注的工作需求。