本发明属于医疗影像,尤其涉及一种二阶精细化颞骨ct图像分割方法。
背景技术:
1、颞骨属于颅骨中的脑颅骨,是人体最小最复杂的骨头之一,医生通过分析病人颞骨的形态与结构,能够对耳鼻喉相关疾病进行更精确的病理分析、医疗诊断和手术定位。受限于ct扫描图像的分辨率,医生很难在十分细小的结构上做出准确快速的判断,而基于神经网络的颞骨ct分割算法能够帮助医生对病灶进行初步的定位与分析,大大提高医生的诊断精度和效率。
2、现有算法(fully automated segmentation in temporal bone ct with neuralnetwork: a preliminary assessment study[j]. bmc medical imaging, 2021, 21(1):1-11.)提出的颞骨ct分割算法直接把整张脑部ct图用作模型训练,由于颞骨仅占脑部ct图中较小的一个区域,正样本前景像素数量远小于负样本背景的像素数量,现有的模型很难快速收敛,分割算法不能精准地定位到颞骨,无法对十分细小的结构进行精准分割。此外,脑部ct图中存在许多与颞骨形状、纹理相类似的脑组织结构,分割模型直接对整张脑部ct图进行训练,会产生许多的假阳性预测结果,极大影响模型的精度。
3、为了克服用整张脑部ct图训练对模型精度与分割效果的影响,我们提出了新的技术方案:一种二阶精细化颞骨ct图像分割方法。
技术实现思路
1、本发明的目的在于提供一种二阶精细化颞骨ct图像分割方法,旨在解决所述背景技术中存在的在颞骨ct分割任务中,由于直接训练整张脑部ct图存在无法精确定位颞骨区域,正负样本不均衡导致模型难以收敛等问题问题。为实现所述目的,本发明采用的技术方案是:
2、步骤s201:对87例病人的数据集进行清洗,通过检查同一例病人的标注结果是否连续,判断是否存在错误标注,若存在错误标注则进行剔除,减少数据集存在的标注噪声;
3、步骤s202:利用python中的cv2库函数,找到颞骨标注区域的边界框,并转换为json数据集格式;
4、步骤s203:将数据集根据4:1的比例,划分训练集和测试集,划分后训练集的病例数为70,测试集的病例数为17;
5、步骤s204:根据步骤s203划分好的数据集,对颞骨不同的功能区单独训练第一阶段的目标检测模型,对功能区进行精准定位;
6、步骤s205:根据步骤s204定位的颞骨区域,计算出功能区最大的边界框。设置初始的裁剪膨胀系数为1,边界框的长宽与膨胀系数相乘,得到裁剪框的大小;算法自适应地增大膨胀系数,直到能精确地裁剪出颞骨的相关区域;其中,对功能区对哒边界框利用自适应算法进行调整裁剪,算法自适应的具体步骤为:设目标检测定位的边界框长和宽分别为w和h,设置裁剪膨胀系数为α,初始膨胀系数为1;
7、标注区域的最大包围框长和宽分别为p和z,其中p>w且z>h,设置包围框膨胀系数为β,初始膨胀系数为1.6;
8、裁剪膨胀系数α以从初始值开始逐步增大,直到满足公式:p<w*α<p*β,z<h*α<z*β,自适应地精准裁剪出功能区的相关区域。
9、步骤s206:根据步骤s205裁剪出的图片块,裁剪出的图片块,生成语义分割的二值化标注模板,背景像素值为0,前景像素值为1;根据二值化标注模板训练语义分割模型;
10、步骤s207:根据步骤s206的二值化标注模板训练语义分割模型,语义分割模型为在swin transformer基础上构建的,该模型的骨干包含了四层,分别为stage1、stage2、stage3和stage4,每层的骨干分别设计了2、2、6和2个特征提取模块;网络参数由在imagenet数据集上预训练的swin transformer-base模型初始化,以便充分利用在imagenet上学习的提取深层次特征的能力;
11、步骤s208:根据步骤s207得到的语义分割模型在测试集上进行推理,并对结果进行可视化,得到颞骨ct不同结构的分割结果。
12、本发明的有益效果:
13、1.在第一阶段采用高精度的目标检测算法,对颞骨相关区域进行精准定位。
14、2.根据颞骨不同结构的大小,自适应地裁剪出合适的图片块,用于第二阶段的分割算法,优化正负样本不均衡的问题,加快模型训练和收敛的速度。
1.一种二阶精细化颞骨ct图像分割方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种二阶精细化颞骨ct图像分割方法,其特征在于:所述s1具体包括为:对n例病人的数据集进行清洗,通过检查同一例病人的标注结果是否连续,判断是否存在错误标注,若存在错误标注则进行剔除,减少数据集存在的标注噪声。
3.根据权利要求1所述的一种二阶精细化颞骨ct图像分割方法,其特征在于:所述s2中对格式的转换为利用python中的cv2库函数,找到颞骨标注区域的边界框,并转换为json数据集格式;将数据集根据4:1的比例,划分训练集和测试集,划分后训练集的病例数为4/5n,测试集的病例数为1/5n;根据前述划分好的数据集,对颞骨不同的功能区单独训练第一阶段的目标检测模型,对功能区进行精准定位。
4.根据权利要求3所述的一种二阶精细化颞骨ct图像分割方法,其特征在于:所述s3具体包括为:对训练第一阶段的目标检测模型定位的颞骨区域,计算出功能区最大的边界框;利用自适应算法进行调整裁剪,算法自适应的具体步骤为:设目标检测定位的边界框长和宽分别为w和h,设置裁剪膨胀系数为α,初始膨胀系数为1;
5.根据权利要求4所述的一种二阶精细化颞骨ct图像分割方法,其特征在于:所述s4具体包括为:将s3裁剪出的图片块,生成语义分割的二值化标注模板,背景像素值为0,前景像素值为1;根据二值化标注模板训练语义分割模型;根据得到的语义分割模型在测试集上进行推理,并对结果进行可视化。
6.根据权利要求5所述的一种二阶精细化颞骨ct图像分割方法,其特征在于:所述语义分割模型为在swin transformer基础上构建的,该模型的骨干包含了四层,分别为stage1、stage2、stage3和stage4,每层的骨干分别设计了2、2、6和2个特征提取模块;网络参数由在imagenet数据集上预训练的swin transformer-base模型初始化,以便充分利用在imagenet上学习的提取深层次特征的能力。