一种基于YOLOV5网络的宫颈细胞分类参数获取方法

文档序号:36259977发布日期:2023-12-05 14:54阅读:68来源:国知局
一种基于

本发明涉及细胞检测,特别涉及一种基于yolov5网络的宫颈细胞分类参数获取方法。


背景技术:

1、早期宫颈细胞图像研究依赖于准确的细胞分割和手工特征提取,再在此基础上构建自动检测模型。使用此类方法设计的模型结构复杂但泛化能力弱、难以提升精度。随着深度学习的发展,卷积神经网络能够准确地提取出图像中的深层特征,模型精度更高、泛化能力更强。

2、基于卷积神经网络的目标检测模型主要分为两阶段检测算法(two-stage)和单阶段检测算法(one-stage)两大类。以faster r-cnn为代表的两阶段检测算法通过rpn层网络生成目标建议框,再利用建议框区域的卷积特征进行分类与更精准的目标框定位;以yolo为代表的单阶段检测算法将目标检测处理为回归问题,在输出层一次性预测目标位置与类别。

3、yixiong liang等人通过获取不同类别单个宫颈细胞的特征信息与faster r-cnn生成的目标建议框区域的卷积特征进行对比学习,从而提升模型精度,但是没有改进检测模型对图像深度特征的提取能力;lei cao等人通过添加注意力机制提升模型精度,但仅对图像内异常细胞进行了识别并没有实现具体类别判断。且这些方法基于faster r-cnn,需要进行rpn与rcnn两个阶段卷积,因此模型检测速度较低。

4、yolo通过设计端到端的一步检测系统,并经历多次版本更迭,速度和精度上都有较好成果,逐渐成为目标检测主流框架。其中,yolov3基于残差网络设计出darknet53网络用于特征提取,并引入特征金字塔实现多尺度预测,改善了单阶段检测算法在小目标检测的缺陷。 yao xiang等人为yolov3模型添加额外的轻量级分类模型,提高对检测出的单细胞图像分类准确性,但丧失单阶段检测算法端到端的便捷性; dongyao jia等人提出了一种基于改进yolov3算法的宫颈细胞检测算法,融合dense block和s3pool改进特征提取网络,并用focal loss和balanced cross entropy改进损失函数,为降低参数量减少了检测层和初始锚框数量,但这使得模型受标签框质量影响较大,模型泛化性能不够。

5、因此,针对现有技术不足,提供一种基于yolov5网络的宫颈细胞分类参数获取方法以解决现有技术不足甚为必要。


技术实现思路

1、本发明的目的在于避免现有技术的不足之处而提供一种基于yolov5网络的宫颈细胞分类参数获取方法。该基于yolov5网络的宫颈细胞分类参数获取方法泛化性能更强且对异常细胞识别与分类更精准、高效。

2、本发明的上述目的通过以下技术措施实现:

3、提供一种基于yolov5网络的宫颈细胞分类参数获取方法,将待测图像输入最优模型中进行识别得到分类参数;

4、所述最优模型的获取方法具体如下:

5、s1、将数据集的每张图像中的细胞按类别进行分类得到应标签,然后再将数据集划分为验证集和训练集;

6、s2、将所述训练集多次输入yolov5网络模型中进行训练得到所述最优模型,且所述训练集在每次输入yolov5网络模型前均进行数据增强处理。

7、所述分类参数为类别和置信度。

8、优选的,上述类别为ascus、asch、lsil、hsil、scc、agc、trich、cand、flora、herps和actinomyces。

9、优选的,上述yolov5网络模型为将yolov5基础网络模型经过改进的改进后yolov5网络模型,改进的方法为将yolov5基础网络模型的backbone部分中最后一个特征提取层替换成bot3模块,并对yolov5基础网络模型的head部分进行解耦。

10、优选的,上述解耦为将目标定位和分类任务视为两个任务,在分类任务和目标定位任务进行回归前各添加一个3*3卷积层,而且在目标定位任务分支的卷积层额外添加一个cbam注意力模块。

11、在所述bot3模块中引入二维位置编码。

12、优选的,上述s2中数据增强处理按如下步骤进行:

13、a.1、对所述训练集中的每个训练图像分别随机生成一个第一rand值,所述第一rand值的范围为大于0且小于1,判断第一rand值的大小,当第一rand值小于0.5时,进入a.2;当第一rand值大于等于0.5时,进入a.3;

14、a.2、对当前训练图像进行mosaic处理,处理完毕后进入a.4;

15、a.3、对当前训练图像进行randon_perspective处理,处理完毕后进入a.6;

16、a.4、随机生成第二rand值,所述第二rand值的范围为大于0且小于1,判断第二rand值的大小,当第二rand值小于0.3时,进入a.5;当第二rand值大于等于0.3时,进入a.6;

17、a.5、对当前训练图像进行mixup处理,处理完毕后进入a.6;

18、a.6、进行albumentations处理,处理完毕后进入a.7;

19、a.7、进行augment处理,处理完毕后进入a.8;

20、a.8、得到数据增强后的训练图像。

21、优选的,上述a.2具体为将当前训练图像及在所述训练集随机抽取另外三张训练图像,将这四张训练图像随机切分不同的画面并拼接在一起作为新的训练图像,然后将新的训练图像作为当前训练图像进入a.4。

22、优选的,上述a.3具体为当前训练图像从前至后依次进行旋转操作、平移操作、缩放操作、剪切操作和透视变换操作。

23、优选的,上述a.5具为将当前训练图像及在所述训练集中随机抽取另外一张训练图像按照比例混合生成新的训练图像,然后将新的训练图像作为当前训练图像进入a.6。

24、优选的,上述a.6具体为当前训练图像以0.5的概率调用模糊处理,以0.4的概率添加高斯噪声,以0.4的概率进行clahe自适应直方图均衡,处理完毕后进入a.7。

25、优选的,上述a.7具体为分别以0.5的概率对当前训练图像调用上下翻转和左右翻转,并在1±0.5范围内对当前训练图像的色相进行处理,在1±0.7范围内对当前训练图像的饱和度进行处理、在1±0.4范围内对当前训练图像的色明度进行处理,处理完毕后进入a.8。

26、优选的,上述旋转操作为在旋转角度库中随机抽取一个旋转角度,然后在0°~5°范围内随机抽到一个随机角度θ,并对当前训练图像进行旋转角度加上随机角度θ旋转,且所述旋转角度库的旋转角度有0°、90°、-90°和180°。

27、优选的,上述平移操作为以当前训练图像的边长进行β倍移动,且0≤β≤0.2。

28、优选的,上述缩放操作为将当前训练图像进行0.5倍~1.5倍范围内的缩放。

29、优选的,上述剪切操作为对当前训练图像的边角在0°~5°范围内随机抽到一个随机角度θ进行裁剪。

30、优选的,上述透视变换操作为以当前训练图像边长的0~0.00005倍范围内进行透视变换。

31、优选的,上述s2中对所述yolov5网络模型训练按如下步骤进行:

32、b1、设置yolov5网络模型的训练参数,将训练次数定义为epoch,令epoch=0进入b2,所述训练参数为batch_size、最大训练次数、学习率和优化器类型;

33、b2、将数据增强后的训练图像进行缩放,并输入yolov5网络模型并通过损失函数进行处理,得到初级模型及模型权重;

34、b3、将所述验证集的图像进行缩放后输入b2得到的初级模型进行精度验证,得到查准率、查全率、均值平均精度map@0.5和不同阈值平均map@.5:.95,通过均值平均精度map@0.5和不同阈值平均map@.5:.95按照1:9的权重计算得到当前精度f并保存;

35、b3、将当前精度f与全局最佳精度fbest进行比较,当当前精度f大于前一次训练的当前精度f或者不存在前一次训练的当前精度f时,将当前精度f定义为全局最佳精度fbest;

36、b4、判断epoch的值,当epoch为最大训练次数时,则进入b7;当否时则进入b5;

37、b5、以当前epoch为起点判断全局最佳精度fbest在之前100次训练中是否一直保持不变,当是则进入b7,否则进入b6;

38、b6、令epoch=epoch+1返回b2;

39、b7、将当前初级模型定义为最优模型,当前模型权重定义为最优模型权重。

40、优选的,上述损失函数为检测框损失 l loc、分类损失 l cls和置信度损失 l conf的加权和,由式ⅰ所示;

41、……式ⅰ;

42、其中,为检测框损失权重,且为0.05;为分类损失权重,且为1.0;为置信度损失权重,为2.0。

43、所述

44、检测框损失 l loc由式ⅱ、式ⅲ、式ⅳ和式ⅴ得到;

45、……式ⅱ;

46、……式ⅲ;

47、……式ⅳ;

48、……式ⅴ;

49、其中 iou为真实目标边界框和预测边界框的交并比,为 iou的优化函数,为预测边界框和真实目标边界框的宽高比一致性参数,为预测边界框的宽, 为预测边界框的高, 为真实目标边界框的宽, 为真实目标边界框的高,为平衡参数, b为预测中心坐标的参数,为真实目标边界框中心坐标的参数,为两个中心点距离。

50、所述分类损失 l cls由式ⅵ和式ⅶ得到;

51、……式ⅵ;

52、……式ⅶ;

53、其中, i表示预测结果中第 i个预测边界框,为真实标签,为预测的类别, n为样本总量, nc为样本, ε为标签平滑参数,且 ε为0.1,为经过标签平滑后新的标签, k为样本类别数。

54、所述置信度损失 l conf由式ⅷ得到;

55、……式ⅷ;

56、其中为预测的置信度,为由式(ⅲ)得到的交并比值即真实置信度。

57、优选的,上述batch_size为16。

58、优选的,上述最大训练次数为300。

59、优选的,上述学习率为0.0001。

60、优选的,上述优化器类型为adam。

61、本发明的一种基于yolov5网络的宫颈细胞分类参数获取方法,将待测图像输入最优模型中进行识别得到分类参数;所述最优模型的获取方法具体如下:s1、将数据集的每张图像中的细胞按类别进行分类得到应标签,然后再将数据集划分为验证集和训练集;s2、将所述训练集多次输入yolov5网络模型中进行训练得到所述最优模型,且所述训练集在每次输入yolov5网络模型前均进行数据增强处理;所述分类参数为类别和置信度。该基于yolov5网络的宫颈细胞分类参数获取方法,通过数据增强处理可能更好地模拟细胞重叠、遮挡等情况,进而让模型学习到异常细胞的深度特征,本发明的泛化性能更强且对异常细胞识别与分类更精准、高效。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1