一种基于卷积神经网络的肺结节假阳性筛选方法与流程

文档序号:14837288发布日期:2018-06-30 12:57阅读:1429来源:国知局
一种基于卷积神经网络的肺结节假阳性筛选方法与流程
本发明属于图像处理领域,具体涉及一种基于卷积神经网络的肺结节假阳性筛选方法。
背景技术
:深度学习方法在图像处理领域取得了巨大的成就,这也为医疗图像数据应用深度学习技术识别特征部位提供了可能。目前,以深度学习为基础的CAD(computeraideddiagnosis)系统,在识别并分割CT图像中的器官、特征区域等方面具有广泛的应用。现有的机器学习方法对肺部CT图像的肺结节识别结果中,包含较大比例的假阳性结果,即将不具备肺结节特征的区域预测为肺结节阳性,导致降低检测结果准确率的降低。技术实现要素:本发明的发明目的是提供一种基于卷积神经网络的肺结节假阳性筛选方法,该方法能够将肺结节假阳性筛选出来,提升肺结节特征区域预测的准确性。为实现上述发明目的,本发明提供以下技术方案:一种基于卷积神经网络的肺结节假阳性筛选方法,包括以下步骤:(1)肺结节检测模型输出的肺结节检测结果(坐标x,直径r,概率p),每个检测结果对应一个真实标签(坐标X,直径R);(2)对肺结节检测结果进行标记生成样本(坐标x,直径r,标签Y);(3)将样本(坐标x,直径r,标签Y)与原始肺部CT图像进行组合,形成数据对(坐标x,直径r,标签Y,原始肺部CT图像),组成数据集合;(4)将数据集合中的每个数据对的坐标x进行8个方向的随机偏移,偏移尺度为0.5X;(5)对于数据集合中的每个数据对,根据坐标x,直径r,从原始肺部CT图像中以坐标x为中心,裁剪出尺寸分别为32*32*32、64*64*64、96*96*96的CT切片,作为训练样本,并对训练样本进行增广处理;(6)构建卷积神经网络,所述卷积神经网络包括依次连接的5个卷积层、1个池化层、1个全连接层以及SoftMax函数层;(7)利用尺寸为32*32*32的训练样本对卷积神经网络进行训练,获得第一肺结节假阳性筛选模型;利用尺寸为64*64*64的训练样本对卷积神经网络进行训练,获得第二肺结节假阳性筛选模型;利用尺寸为96*96*96的训练样本对卷积神经网络进行训练,获得第三肺结节假阳性筛选模型;(8)将待测肺部CT图像分别裁剪为32*32*32、64*64*64、96*96*96尺寸的CT切片,分别将不同尺寸的CT切片输入到与尺寸对应的第一肺结节假阳性筛选模型、第二肺结节假阳性筛选模型以及第三肺结节假阳性筛选模型,得到第一预测结果、第二预测结果以及第三预测结果,对三个预测结果求平均值,获得最终预测结果。其中,步骤(2)的具体步骤为:(2-1)去掉概率p<0.7的肺结节检测结果;(2-2)对于每一个概率p≥0.7的肺结节检测结果,若坐标x与坐标X的距离<2R,则该肺结节检测结果为正样本,否则为负样本。步骤(2)的具体步骤为:(2-1’)将真实标签对应的肺结节检测结果作为正样本;(2-2’)对于每一个概率p≥0.7的肺结节检测结果,若坐标x与坐标X的距离≥2R,则该肺结节检测结果为负样本。具体地,正负样本比例为3:1。具体地,所述对训练样本进行增广处理包括:对训练样本进行随机反转、随机旋转、以及随机缩中一种或多种处理。与现有技术相比,本发明具有的有益效果为:利用多个尺度的输入信息,获得更加丰富的结节特征,综合每个模型的分类结果,使最终的假阳性筛选结果召回率更高。附图说明图1是实施例提供的基于卷积神经网络的肺结节假阳性筛选方法的流程示意图;图2是实施例提供的肺结节检测模型的结构示意图;图3是实施例提供的残差单元I的结构示意图;图4是实施例提供的残差单元II的结构示意图;图5是实施例提供的卷积神经网络的结构示意图。具体实施方式为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。图1是实施例提供的基于卷积神经网络的肺结节假阳性筛选方法的流程示意图。如图1所示,本实施例提供的肺结节假阳性筛选方法包括以下步骤:S101,获得肺结节检测模型输出的肺结节检测结果(坐标x,直径r,概率p)。每个检测结果对应一个真实标签(坐标X,直径R);肺结节检测模型可以为现有的任何形式的模型,只要能够对肺结节进行检测,输出检测结果(坐标x,直径r,概率p)就可以。本实施例中,采用的肺结节检测模型如图2所示,包括所述肺结节分割网络包括依次连接的128*128*24卷积单元201、64*64*32残差卷积单元202、32*32*64残差卷积单元203、16*16*64残差卷积单元204、8*8*64残差卷积单元205、16*16*64残差卷积单元206,16*16*64残差卷积单元206的输出特征图与16*16*64残差卷积单元204输出特征图按照通道拼接后输入至32*32*64残差卷积单元207,32*32*64残差卷积单元207输出特征图与32*32*64残差卷积单元203输出特征图按照通道拼接后,输入至RPN网络208以实现对输入图的肺结节检测。128*128*24卷积单元201与所有的残差卷积单元均用于对输入图进行特征提取。图2中,R代表拼接操作,即32*32*64残差卷积单元207输出特征图与32*32*64残差卷积单元203输出特征图按照通道进行拼接操作。64*64*32残差卷积单元202中包含三个依次连接的32维输入的残差单元I,如图3所示,每个残差单元I包括依次连接的32维输入、8维输出、卷积核为1×1的卷积层,8维输入、8维输出、卷积核为3×3的卷积层,8维输入、32维输出、卷积核为1×1的卷积层,每个卷积层均用于特征提取,三个卷积层级联的输出特征图和输入特征图间相加后,再经过RELU函数激活。32*32*64残差卷积单元203、16*16*64残差卷积单元204、8*8*64残差卷积单元205均包括三个依次连接的64维输入的残差单元II。如图4所示,每个残差单元II包括依次连接的64维输入、16维输出、卷积核为1×1的卷积层,16维输入、16维输出、卷积核为3×3的卷积层,16维输入、64维输出、卷积核为1×1的卷积层,每个卷积层均用于特征提取,三个卷积层级联的输出特征图和输入特征图间相加后,再经过RELU函数激活。16*16*64残差卷积单元206和32*32*64残差卷积单元207均包括两个依次连接的64维输入的残差单元II。上述形如m*m*n均表示输入和输入图片尺寸为m*m,通道数为n。例如:128*128*24卷积单元表示输入和输出图片尺寸为128*128,通道数为24。RPN(RegionProposalNetworks)网络208为区域建议网络,由2个连续的卷积层构成,用于提取针对目标问题的高置信度区域。RPN网络208用于对输入的特征图进行计算,输出矩形目标建议框的集合以及每个建议框的预测得分。对于本实施例,RPN网络208对输入的肺结节特征图进行计算,输出预测的肺结节坐标,直径以及概率,实现对输入图片的分类和回归。每个检测结果对应一个真实标签(坐标X,直径R)是原始CT图像的真实标签,是训练肺结节检测模型所需的真实输出。S102,对肺结节检测结果进行标记生成样本(坐标x,直径r,标签Y)。具体地,使用两种方法生成样本:第一种方法:去掉概率p<0.7的肺结节检测结果,在剩下的数据中,对于每一个概率p≥0.7的肺结节检测结果,若坐标x与坐标X的距离<2R,则该肺结节检测结果为正样本,否则为负样本;第二种方法:将真实标签对应的肺结节检测结果作为正样本;对于每一个概率p≥0.7的肺结节检测结果,若坐标x与坐标X的距离≥2R,则该肺结节检测结果为负样本,正负样本比例为3:1;按照1:1的比例混合第一种方法生成的样本和第二种方法生成的样本。S103,根据样本和原始肺部CT图像构建数据集合。具体地,将样本(坐标x,直径r,标签Y)与原始肺部CT图像进行组合,形成数据对(坐标x,直径r,标签Y,原始肺部CT图像),组成数据集合。S104,将数据集合中的每个数据对的坐标x进行8个方向的随机偏移,偏移尺度为0.5X。S105,对数据集合中的每个数据对,根据样本对原始肺部CT图像进行裁剪,获得不同尺寸的训练样本,并对训练样本进行增广处理。具体地,对于每个数据对,根据坐标x,直径r,从原始肺部CT图像中以坐标x为中心,裁剪出尺寸分别为32*32*32、64*64*64、96*96*96的CT切片,该切片即为卷积神经网络的训练样本,用于筛除肺结节假阳性。获得训练样本后,采用随机反转、随机旋转、以及随机缩中一种或多种处理,对训练样本进行数据增广,以丰富训练集内容。S106,构建卷积神经网络,如图5所示,卷积神经网络包括依次连接的卷积层501、卷积层502、卷积层503、卷积层504、卷积层505、全局平均池化层(globalaveragepooling)506、全连接层(Fc)507以及SoftMax函数层508。具体地,卷积层501的尺寸为图片为128*128*128、通道数为24,卷积层502的尺寸为图片为64*64*64、通道数为32,卷积层503的尺寸为图片为32*32*32、通道数为64,卷积层504的尺寸为图片为16*16*16、通道数为64,卷积层505的尺寸为图片为8*8*8、通道数为64。网络内部的卷积操作均使用残差卷积模式操作,每个卷积层均用于特征提取,这样的卷积层尺寸的设置能够增加特征提取的丰富性,提升特征提取性能。卷积层505的输出特征图通过一个全局平均池化层506对数据进行子抽样,最后通过全连接层507以及SoftMax函数层508输出预测结果。S107,利用3中尺寸的训练样本对卷积神经网路进行训练,获得三个肺结节假阳性筛选模型。具体地,利用尺寸为32*32*32的训练样本对卷积神经网络进行训练,获得第一肺结节假阳性筛选模型;利用尺寸为64*64*64的训练样本对卷积神经网络进行训练,获得第二肺结节假阳性筛选模型;利用尺寸为96*96*96的训练样本对卷积神经网络进行训练,获得第三肺结节假阳性筛选模型。网络的收敛条件:连续的3个epoch的损失函数平均值均低于前一个epoch的损失函数值。S108,利用肺结节假阳性筛选模型对待测样本进行预测,输出预测结果。具体地,首先,将待测肺部CT图像分别裁剪为32*32*32、64*64*64、96*96*96尺寸的CT切片。然后,将32*32*32的CT切片输入到第一肺结节假阳性筛选模型,经计算获得第一预测结果;将64*64*64的CT切片输入到第二肺结节假阳性筛选模型,经计算获得第二预测结果;将96*96*96的CT切片输入到第三肺结节假阳性筛选模型,经计算获得第三预测结果。最后,对三个预测结果求平均值,获得最终预测结果。同时由于肺结节的大小不一致情况明显,本发明使用三种不同大小尺度的CT切片来进行网络训练,获得三个尺度的肺结节假阳性筛选模型。这样为假阳性的筛选提供了多尺度的依据,进一步提升了筛选准确度。表1为不同尺寸训练样本对模型的影响比对表。表1合并3种尺寸32*32*3264*64*6496*96*96召回率95%85%88%92%收敛所需epoch数60807570从表可以得到:单独尺寸的训练样本对网络训练的效果均没有合并3种尺寸的训练样本优,合并3种尺寸的训练样本训练得到的模型的召回率为95%,能够发明更多的肺结节,提取能力强,且收敛所需epoch数为60,收敛速度快,预测效果好。以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1