1.一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:包括下列步骤:
2.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s1中建立的水下目标检测模型包括三个部分:视觉增强参数预测模块ve-pp、视觉增强模块ve和目标检测器。
3.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强参数预测模块采用轻量级卷积神经网络peleenet,其作用是预测ve模块中的可调节参数,针对不同水下图像生成不同的视觉增强参数,实现水下图像自适应增强。
4.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述视觉增强模块包括四个图像滤波器:white balance图像滤波器、gamma图像滤波器、contrast图像滤波器和sharpen图像滤波器;以上四个滤波器均可微,以保证ve-pp模块可以通过反向传播进行网络训练;以上四个滤波器中参数都与待处理图像的分辨率无关,使得ve-pp模块的输入图像可以将分辨率缩小到304×304,以节省计算资源;ve-pp模块实际处理的图像分辨率为416×416,与目标检测网络输入图像的分辨率保持一致。
5.根据权利要求4所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述white balance图像滤波器的映射函数为:
6.根据权利要求2所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述目标检测器使用yolox-nano,yolox-nano中引入了深度可分离卷积,只有0.91m的参数量和1.08g浮点运算量,在coco数据集上ap达到25.3%,在小尺寸模型中表现良好。
7.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s2中训练使用的监督损失为yolox的目标检测损失,其定义为:
8.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s3中教师模型推理得到的伪标注指基于置信度阈值conf过滤后的预测结果,所述conf是基于置信度定义的,置信度定义为:
9.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s4中模型训练过程所使用的数据增强方法为:
10.根据权利要求1所述的一种基于图像视觉增强和半监督学习的水下目标检测方法,其特征在于:所述s4中模型训练过程所使用的无监督损失和监督损失的加权和定义为: