一种基于深度学习的糖尿病视网膜图像病变分类方法与流程

文档序号:17549701发布日期:2019-04-30 18:11阅读:776来源:国知局
一种基于深度学习的糖尿病视网膜图像病变分类方法与流程

本发明是糖尿病视网膜图像分类方法,适用于机器学习、生物医学和图像处理领域。



背景技术:

近年来,随着科学技术的进步和医学成像采集设备的不断完善,以及图像处理、模式识别、机器学习、深度学习等学科的不断发展,多学科交叉的医学图像处理与分析领域(medicalimageprocessingandanalysis)取得了丰硕的成果。糖尿病是一组以高血糖为特征的代谢性疾病,易导致各种组织如眼睛、心脏、脑部、血管等发生病变,是一种具有特异性改变的眼底病变。糖尿病视网膜病变,是糖尿病性微血管病变中最重要的表现,是一种主要的致盲疾病。目前,该病在临床诊断中主要依赖于眼科医生对眼底图像进行详细地筛查,然后对患者的病情进行评估给出结论。但待筛查的糖尿病患者数量巨大,并且部分地区医疗资源匮乏,绝大多数的糖尿病视网膜病变患者不能得到及时的诊断和治疗,从而错过了最佳的治疗机会,最终造成不可逆转的视力损伤乃至失明的后果。人工诊断的效果极度依赖于临床医生的诊治经验,可能患者不及时就医、病变较轻和医生经验不足等原因会造成误诊、漏诊,严重时还可能会让患者错过最佳治疗时期而导致失明。这表明,仅仅依靠医生进行糖尿病视网膜病变的筛查面临着巨大的挑战,因此,一个自动的高效的糖尿病性视网膜图像分类模型对于医生和患者都具有十分重大的意义。



技术实现要素:

本发明的目的在于针对背景技术中的问题,提出一种基于深度学习的糖尿病视网膜图像病变分类方法。

本发明采用的技术方案是:一种基于深度学习的糖尿病视网膜图像病变分类方法,包括以下步骤:

a、在kaggle网站上下载糖尿病视网膜图像数据集;

b、对所得糖尿病视网膜图像数据集进行色彩平衡调整、亮度调整、对比度调整、缩放裁剪等预处理;

c、在vgg网络模型的基础上,搭建新的vgg-l网络分类模型;

d、采用预处理后的图像数据集对所搭建的模型进行训练;

e、采用糖尿病视网膜图像测试集对训练后模型进行分类准确度判断。

优选的,所述步骤a中糖尿病视网膜图像数据集取得方法如下:

a、在竞赛平台kaggle中的diabeticretinopathydetection比赛中获取糖尿病视网膜图像数据集;

b、获取按照病变程度将视网膜图像分成了正常、轻微病变、中度病变、重度病变、增生性病变五类的标注表格。

优选的,所述步骤b中图像预处理方法如下:

a、对于色偏、过饱和或饱和度不足的彩色糖尿病视网膜眼底图像,采用pil工具中的imageenhance模块,进行色彩平衡调整、亮度调整、对比度调整;

b、对于有黑色背景多的糖尿病视网膜图像,进行裁剪;

c、由于原始图片相当大(例如,平均为3000*2000像素),因此使用正常双线性重新缩放,破坏原始宽高比的办法对糖尿病视网膜图像进行缩放。

优选的,所述步骤c中搭建模型方法如下:

a、基于深度学习中的卷积神经网络,搭建vgg网络模型,并在此基础上进行改进;

b、使用代价敏感学习,通过修改目标函数来减轻不均衡数据对模型的影响,避免产生类别不均衡特征的学习;

c、采用交叉熵损失函数估量模型预测值与真实值的不一致程度,因为损失函数是经验风险函数的核心部分,也是结构风险函数的重要组成部分,能使模型的鲁棒性变好;

d、采用relu激活函数,增加神经网络模型的非线性,解决gradiantvanishing问题,使计算速度变快;

e、采用dropout作用在layer上面,防止过拟合,降低节点之间的耦合度,使节点对于其他节点不再那么敏感,使模型学到更加鲁棒的特征;

f、采用batchnorm对数据做归一化,不仅能减小图像之间的绝对差异,突出相对差异,提升模型训练速度,大大加快收敛速度,还能增加分类效果;

g、增加模型的卷积层,把其中一层的最大池化层改为随机池化层,并重新设置每层的过滤器大小和步长;

h、最后采用softmax层,对糖尿病视网膜图像进行五分类。

优选的,所述步骤d中训练模型方法如下:

a、在电脑上安装ubuntu16.04系统;

b、安装显卡驱动、cuda、cudnn加速库、anaconda2函数库;

c、搭建theano框架,配置训练环境;

d、编写python程序。

优选的,所述步骤e中评价模型方法如下:

a、采用混淆矩阵,观察算法的效果,以及样本的预测分类和真实分类;

b、基于混淆矩阵,用kappa系数进行一致性检验,衡量标注结果的吻合程度;

c、计算训练后模型的准确度。

附图说明

图1为本发明步骤框图。

图2为本发明各个类别的糖尿病视网膜图像。

图3为本发明卷积神经网络。

图4为本发明vgg-l模型。

图5为本发明kappa评价标准。

图6为本发明准确度曲线。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的模型算法进行清楚、完整地描述,显然,所描述的仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种算法:一种基于深度学习的糖尿病视网膜图像病变分类方法,包括以下步骤:

a、在kaggle网站上下载糖尿病视网膜图像数据集;

b、对所得糖尿病视网膜图像数据集进行色彩平衡调整、亮度调整、对比度调整、缩放裁剪等预处理;

c、在vgg网络模型的基础上,搭建新的vgg-l网络分类模型;

d、采用预处理后的图像数据集对所搭建的模型进行训练;

e、采用糖尿病视网膜图像测试集对训练后模型进行分类准确度判断。

本发明中,步骤a糖尿病视网膜图像数据集获取的方法如下:

a、在竞赛平台kaggle中的diabeticretinopathydetection比赛中获取糖尿病视网膜图像数据集,一共有35126个图像;

b、获取按照病变程度将视网膜图像分成了正常、轻微病变、中度病变、重度病变、增生性病变五类的标注表格,0-4各个类别的糖尿病视网膜图像如图2所示。

本发明采用的糖尿病视网膜图像数据集来自kaggle比赛,由多家医院提供,并且每一张图像都是由数个权威医师共同标注的标签的五类病变程度,数据集可信度高,病变程度等级标签可靠,可以用于后续的模型训练。

本发明中,五分类评价标准如下:

a、糖尿病视网膜图像无病变判为类别0;

b、眼底图像出现微血管瘤,距离黄斑中心较远处部分有视网膜增厚或硬性渗出判为类别1;

c、除了微血管瘤和视网膜增厚或硬性渗出外还伴有较少视网膜内出血,但未涉及到黄斑中心,判为类别2;

d、视网膜内出血多于20处,并在两个以上象限有静脉串珠样改变,另外有显著的视网膜内微血管异常及视网膜增厚或硬性渗出并且已涉及到黄斑中心,判为类别3;

e、除了以上表现外更明显的特征是出现新生血管且占据1个视盘直径范围内,视盘面积大于三分之一,视网膜循环对组织缺氧已不能代偿,判为类别4。

本发明的五分类评价标准是按照英国用于评分dr标准列表进行评价的。

本发明中,步骤b图像预处理的方法如下:

a、对于色偏、过饱和或饱和度不足的彩色糖尿病视网膜眼底图像,采用pil工具中的imageenhance模块,进行色彩平衡调整、亮度调整、对比度调整;

b、对于有黑色背景多的糖尿病视网膜图像,进行裁剪;

c、由于原始图片相当大(例如,平均为3000*2000像素),因此使用正常双线性重新缩放,破坏原始宽高比的办法对糖尿病视网膜图像进行缩放;

d、糖尿病视网膜图像训练集和测试集采用分层抽样的方式按照9:1的比例从数据集中获得。

本发明采用的图像预处理系列过程方法,对于由于医疗设备的差异、拍摄装置的成像原理不同、拍摄图像时不同光照条件等外界环境的差异影响引起视网膜图像光照不匀、亮度不均衡、模糊等,基本能在增强其清晰度的同时,还能保留其纹理信息。

本发明中,步骤c搭建vgg-l分类模型的方法如下:

a、基于深度学习中的卷积神经网络,如图3所示,搭建vgg网络模型,并在此基础上进行改进;

b、采用代价敏感学习,通过修改目标函数来减轻不均衡数据对模型的影响,避免产生类别不均衡特征的学习;

c、采用交叉熵损失函数去估量模型预测值与真实值的不一致程度,增强模型的鲁棒性,因为损失函数是经验风险函数的核心部分,也是结构风险函数的重要组成部分;

d、采用relu激活函数,增加神经网络模型的非线性,解决gradiantvanishing问题,使计算速度变快;

e、采用dropout作用在layer上面,防止过拟合,降低节点之间的耦合度,使节点对于其他节点不再那么敏感,使模型学到更加鲁棒的特征,并且使dropoutlayer层中的每个节点都没有得到充分的训练,避免了对于训练样本的过分学习,并且在测试阶段都用上了dropoutlayer的所有节点,能够有效地克服模型的过拟合;

f、采用batchnorm对数据做归一化,减小图像之间的绝对差异,突出相对差异,不仅能提升模型训练速度,大大加快收敛速度,还能增加分类效果;

g、增加模型的卷积层,并把其中一层的最大池化层改为随机池化层,增加池化的随机性,保留糖尿病视网膜图像最显著的特征,再重新设置每层的过滤器大小和步长;

h、最后采用softmax层,对糖尿病视网膜图像进行五分类。

本发明搭建的对糖尿病视网膜图像进行五分类的vgg-l模型如图4所示。

本发明中,步骤d中训练模型的方法如下:

a、在电脑上安装ubuntu16.04系统;

b、安装显卡驱动、cuda、cudnn加速库、anaconda2函数库;

c、搭建theano框架,配置训练环境;

d、编写python程序。

本发明中,步骤e评价模型的方法如下:

a、采用混淆矩阵,观察算法的效果,以及样本的预测分类和真实分类;

b、基于混淆矩阵,用kappa系数进行一致性检验,衡量标注结果的吻合程度,kappa评价标准如图5所示;

c、计算训练后模型的准确度,其曲线图如图6所示,横坐标为迭代的次数(单位:千次),纵坐标为准确度。

本发明中,用糖尿病视网膜图像测试集对所搭建的vgg-l分类模型进行测试,可靠性高。

综上所述,本发明是一种基于深度学习的糖尿病视网膜图像病变分类方法,通过搭建的新的vgg-l网络分类模型,能够学习到糖尿病视网膜图像的更多特征,且能快速收敛,并将kappa得分提高到0.839。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1