一种基于图像视觉增强和半监督学习的水下目标检测方法与流程

文档序号:36005541发布日期:2023-11-16 20:50阅读:来源:国知局

技术特征:

1.一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:包括下列步骤:

2.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s1中建立的水下目标检测模型包括三个部分:视觉增强参数预测模块ve-pp、视觉增强模块ve和目标检测器。

3.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强参数预测模块采用轻量级卷积神经网络peleenet,其作用是预测ve模块中的可调节参数,针对不同水下图像生成不同的视觉增强参数,实现水下图像自适应增强。

4.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强模块包括四个图像滤波器:white balance图像滤波器、gamma图像滤波器、contrast图像滤波器和sharpen图像滤波器;以上四个滤波器均可微,以保证ve-pp模块可以通过反向传播进行网络训练;以上四个滤波器中参数都与待处理图像的分辨率无关,使得ve-pp模块的输入图像可以将分辨率缩小到304×304,以节省计算资源;ve-pp模块实际处理的图像分辨率为416×416,与目标检测网络输入图像的分辨率保持一致。

5.根据权利要求4所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述white balance图像滤波器的映射函数为:

6.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述目标检测器使用yolox-nano,yolox-nano中引入了深度可分离卷积,只有0.91m的参数量和1.08g浮点运算量,在coco数据集上ap达到25.3%,在小尺寸模型中表现良好。

7.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s2中训练使用的监督损失为yolox的目标检测损失,其定义为:

8.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s3中教师模型推理得到的伪标注指基于置信度阈值conf过滤后的预测结果,所述conf是基于置信度定义的,置信度定义为:

9.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s4中模型训练过程所使用的数据增强方法为:

10.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s4中模型训练过程所使用的无监督损失和监督损失的加权和定义为:


技术总结
本发明属于计算机视觉技术领域,具体涉及一种基于图像视觉增强和半监督学习的水下目标检测方法,包括下列步骤:建立水下目标检测模型;S2、训练水下目标检测模型得到教师模型,通过最小化监督损失进行模型参数优化;推理无标注数据,得到无标注数据的伪标注;通过最小化无监督损失和监督损失的加权和来优化模型参数。本发明将半监督学习引入水下目标检测,具体来说是将改进的STAC半监督学习框架与目标检测器YOLOX‑Nano结合。该方法可以充分利用无标注数据进行模型训练,很大程度上减弱了基于深度学习的水下目标检测模型对标注数据的依赖,从而显著提高了少量标注数据下水下目标检测的精度和鲁棒性。

技术研发人员:周悦,刘伟,郭彦宗
受保护的技术使用者:周悦
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1