本发明涉及半监督学习,尤其涉及一种半监督学习电力设备目标检测模型训练方法、检测方法及装置。
背景技术:
1、对电力设备目标进行快速、精确的检测是实现电力故障智能诊断的基础,现有的电力设备目标检测方法对电力设备位置的人工预标注有很强的依赖性,而在电力设备图像中对电力设备位置进行精确地人工标注需要依赖一定的专业知识,同时需要耗费较高的时间成本和人力成本,因此这种情况不利于生成模型训练所需数据量的标注样本,影响数据模型的训练。
技术实现思路
1、鉴于此,本发明实施例提供了一种半监督学习电力设备目标检测模型训练方法、检测方法及装置,解决了现有技术在训练电力设备位置检测模型时需要耗费大量人力和时间为样本添加人工标注因而影响模型训练效果的问题。
2、本发明的一个方面提供了一种半监督学习电力设备目标检测模型训练方法,该方法包括以下步骤:
3、获取多个第一电力设备图像,所述第一电力设备图像通过人工标注添加电力设备的类别和位置作为真实标签,采用多个所述第一电力设备图像对第一初始神经网络模型进行有监督的训练得到教师模型;
4、获取多个没有标注的第二电力设备图像,对多个所述第二电力设备图像进行弱数据增强,所述弱数据增强包括图像翻转;
5、将弱数据增强后的所述第二电力设备图像输入所述教师模型得到所述第二电力设备图像的伪标签;所述伪标签为所述教师模型对弱数据增强后的第二电力设备图像中电力设备类别和所在位置的预测结果;
6、对所述第二电力设备图像进行强数据增强,所述强数据增强为保留所述第二电力设备图像中电力设备基础上做的反色操作和随机裁剪;
7、将带有真实标签的所述第一电力设备图像和强数据增强后的所述第二电力设备图像合并构建训练样本集,采用所述训练样本集对第二初始神经网络模型进行训练并获取对应的预测值,以所述第一电力设备图像的预测值和相应真实标签构建有监督损失,以强数据增强后的所述第二电力设备图像的预测值和相应所述伪标签构建无监督损失,以所述有监督损失和所述无监督损失构建总体损失,并对所述第二初始神经网络模型进行迭代得到学生模型,将所述学生模型作为电力设备目标检测模型;
8、其中,所述第一初始神经网络模型与所述第二初始神经网络模型结构相同。
9、在一些实施例中,所述第一初始神经网络模型与所述第二初始神经网络模型为faster r-cnn模型,所述faster r-cnn模型由依次连接的主干网络、区域提议网络以及分类头组成,所述分类头包括区域分类器和边界框回归器;所述区域提议网络用于对前景和背景做二分类,所述分类头做关于电力设备的类别分类。
10、在一些实施例中,将弱数据增强后的所述第二电力设备图像输入所述教师模型得到所述第二电力设备图像的伪标签之后,还包括:
11、在进行非极大值抑制的基础上,设置置信度阈值过滤所述教师模型针对所述第二电力设备图像生成伪标签,当生成的伪标签的置信度低于所述置信度阈值时,去除相应伪标签。
12、在一些实施例中,所述方法还包括:采用所述训练样本集对第二初始神经网络模型进行训练并获取对应的预测值,以所述第一电力设备图像的预测值和相应真实标签构建有监督损失,并将所述有监督损失应用于对所述第一初始神经网络模型的有监督训练;
13、所述有监督损失表达式为:
14、
15、其中,表示所述有监督损失,表示所述第一初始神经网络模型的分类损失,表示所述第一初始神经网络模型的边界框回归损失,λ表示回归损失权重,pi表示第i个样本中电力设备的真实类别,表示所述第一初始神经网络模型输出的第i个样本中电力设备的预测类别,ti表示第i个样本中电力设备所在位置的真实框,表示所述第一初始神经网络模型输出的第i个样本中电力设备所在位置的预测框,x表示输入的第一电力设备图像,ncls表示图像数量,nreg表示特征图数量。
16、在一些实施例中,以强数据增强后的所述第二电力设备图像的预测值和相应所述伪标签构建无监督损失,所述无监督损失函数表达式为:
17、
18、
19、其中,和均表示所述无监督损失,s*表示伪标签的目标边界框坐标,xu表示所述所述第二电力设备图像,表示强数据增强后的所述第二电力设备图像,q*表示所述第二初始神经网络模型输出的预测分类,表示所述第二初始神经网络模型输出的预测边界框坐标;表示所述第二初始神经网络模型的分类损失,表示所述第二初始神经网络模型的边界框回归损失,λ表示回归损失权重,qi表示第i个样本中伪标签标记的电力设备类别,表示所述第二初始神经网络模型输出的第i个样本中电力设备的预测类别,表示第i个样本中伪标签标记的电力设备所在位置框,表示所述第二初始神经网络模型输出的第i个样本中电力设备所在位置的预测框,表示强数据增强后的第二电力设备图像,ncls表示图像数量,nreg表示特征图数量。
20、在一些实施例中,以所述有监督损失和所述无监督损失构建总体损失,所述总体损失的表达式为:
21、
22、其中,表示所述总体损失,表示所述有监督损失,表示所述无监督损失,λu表示所述无监督损失的权重。
23、在一些实施例中,所述方法还包括:采用一致性正则损失对所述学生模型进行参数调节。
24、另一方面,本发明还提供一种半监督学习电力设备目标检测方法,包括:
25、获取待检测的电力设备图像;
26、将所述待检测的电力设备图像输入如上述半监督学习电力设备目标检测模型训练方法中的电力设备目标检测模型中,得到电力设备类别及位置识别结果。
27、另一方面,本发明还提供一种电子设备,包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该装置实现上述方法的步骤。
28、另一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
29、本发明的有益效果至少是:
30、本发明所述半监督学习电力设备目标检测模型训练方法、检测方法及装置,采用教师-学生的半监督学习模型,通过少量带真实标签的电力设备图像训练第一初始神经网络模型得到教师模型,利用教师模型对无标签图像添加伪标签,以扩展训练数据的规模,减少人工添加标签的工作量,通过混合伪标签和真实标签的图像训练第二初始神经网络模型得到检测能力更强的学生模型,通过学生模型对待检测电力设备图像进行电力设备类型和位置的识别和标注,提高了电力设备图像检测的效率和精确度。
31、进一步地,对无标签电力设备图像进行数据增强,提高了学生模型对无标签电力设备图像进行标注时的泛化能力和鲁棒性。
32、进一步地,引入置信度阈值筛选非极大值抑制后的的伪标签,减少了对于重叠区域的重复检测,同时使得教师模型可以稳定地输出质量较高的伪标签。
33、进一步地,采用一致性正则损失对学生模型进行参数调节,提高了学生模型输出结果的准确性。
34、本领域普通技本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
35、本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。