本发明涉及故障电弧检测领域,尤其涉及一种基于卷积神经网络的故障电弧检测方法。
背景技术:
1、现有故障电弧检测技术主要有两种思路。第一种是人工提取电弧电流特征并通过模型进行分类。主要做法是先从电流信号中人工提取电流时频域特征得到特征向量,然后利用数据驱动模型进行分类或检测。这种方法计算复杂度较低、计算速度较快同时也易于理解,可操作性强。
2、第二种是直接以电流信号为输入的故障电弧检测算法。主要做法是将采集到的电流波形直接输入到神经网络模型中,由神经网络模型自动依据电流波形特点完成模型训练。这种做法最大的优点在于不需要手工进行特征提取,减少了人为干预,提升了算法的精确度。
3、对于人工提取电弧电流特征并通过模型进行分类的方法,由于引入了人为干预,因此提取的电流特征具有主观性和局限性,在一定程度上存在数据集之间可移植性差、泛化能力不佳,相对的抗干扰能力较弱,在进行故障电弧检测时容易误判或漏判。
4、对于直接以电流信号为输入的故障电弧检测算法,虽然能够避免人为干预,但是现有的算法要么所采用的模型不能适用于大规模数据,检测性能不佳;要么参数量和计算复杂度大,不具有实用性;要么需要分阶段训练,多模块训练目标不一致,积累误差较大。
5、考虑到以上两种方案都具有局限性,探索一种新型的故障电弧检测算法是非常有必要的。
技术实现思路
1、本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于卷积神经网络的故障电弧检测方法,以达到兼顾检测的精确度和实用性的目的。为此,本发明采取以下技术方案。
2、一种基于卷积神经网络的故障电弧检测方法,包括以下步骤:
3、1)获取数据,并将获取的数据输入训练好的卷积神经网络中,具有层级结构的卷积神经网络通过学习多个卷积核,自动提取不同层级的多种特征;
4、2)残差连接处理,通过位于每个卷积核中的残差结构,解决网络退化和梯度消失问题,并简化网络的学习过程,增强网络的泛化能力;
5、3)卷积注意力处理,通过位于每个卷积核中的卷积注意力模块,把注意力放在与故障电弧关联紧密的信息上,对与故障电弧关联度低的信息投入少的注意力,以在不同的情况下,关注不同的电流信号频段;
6、4)多尺度特征融合,基于多尺度特征,先采用特征拼接(concat)操作或特征向量相加(add)操作融合多层特征,然后基于融合后的特征训练预测器,融合卷积神经网络的低层特征和高层特征;
7、5)全局池化处理,以减少参数数量,防止过拟合;
8、6)全连接处理,数据经全局池化之后的结果输入到全连接层,为最后二分类处理做准备;
9、7)二分类判断,由全连接层最终输出二分类结果,得到是否检测到电弧信息的结果。
10、过深的神经网络会带来网络退化、梯度消失的问题,因此本方法通过“跳层连接”的残差结构来解决这两个问题,残差结构构造了一个天然的恒等映射,使得网络的主要学习内容变为相对容易学习的残差,同时增强网络的泛化能力。
11、本技术方案可以自动提取不同层级的多种特征,无需手动设计特征,从而减少了人工干预。卷积神经网络能够高效地处理高维数据,效率高;残差连接处理:通过残差结构解决了网络退化和梯度消失等问题,简化了网络训练过程,并增强了网络的泛化能力;卷积注意力处理:考虑了与故障电弧更紧密相关的信息,在不同的情况下能够关注不同的电流信号频段,提高了模型的适应性和鲁棒性;多尺度特征融合:通过融合不同尺度的特征,可以更好地捕捉数据的多样性,从而提高了模型的表达能力;全局池化处理:减少了模型的参数数量,防止过拟合,同时能够提高模型的计算速度。
12、各步骤相互配合,从而达到兼顾检测的精确度和实用性的目的。
13、作为优选技术手段:在步骤2)中,经一个卷积层进行简单的特征提取处理后,使用“跳层连接”构造恒等映射。有利于解决深度卷积神经网络中的梯度弥散和梯度爆炸问题,在训练过程中增加了网络的稳定性和可靠性。可以降低模型训练的难度和时间成本,使得更深层数量的网络可以训练。同时由于残差结构的引入,可以降低网络的复杂度。提高了网络的泛化能力,减少过拟合的风险,更好地适应不同的数据集和场景。
14、作为优选技术手段:在步骤3)中,卷积注意力模块包括通道注意力模块和空间注意力模块;卷积注意力模块将通道注意力模块和空间注意力模块的融合。通道注意力模块可以通过自适应地学习权重值,对输入特征图的不同通道进行加权融合,使得重要的特征通道被赋予更大的权重,从而提高了特征的辨别能力和丰富性。空间注意力模块可以通过计算不同位置处特征图元素之间的相似度,将更多的注意力集中在与目标区域相关的元素上,从而提高了目标区域的响应概率和特征表达精度。将通道注意力模块和空间注意力模块的输出进行融合,可以综合考虑不同通道和位置的信息,进一步提高了网络的分类准确性和鲁棒性。
15、作为优选技术手段:通道注意力模块先分别逐通道进行最大池化和平均池化,得到池化结果mc和ac,再分别将mc和ac输入一个较小的全连接神经网络得到输出,最后将二者之和经过sigmoid函数归一化得到通道注意力。
16、作为优选技术手段:空间注意力模块首先对输入特征做基于通道的最大池化和平均池化,结果为ms和as,然后对池化结果做拼接操作得到[ms,as],再对拼接结果做卷积操作,卷积结果经sigmoid函数归一化后得到空间注意力。最大池化和平均池化操作可以有效地捕捉每个通道内元素的激活程度,得到mc和ac两个张量,分别表示最大激活值和平均激活值。经过全连接神经网络的处理,可以自适应地学习每个通道的权重,从而强化重要通道的信息,减弱无关通道的影响,同时也保留了原始输入中的有效信息。sigmoid函数可以将输出归一化到0到1之间的范围内,进一步加强网络对不同通道特征的区分能力和抑制作用,从而提高特征表达和分类性能。
17、作为优选技术手段:输入特征经过通道注意力模块得到通道注意力,再将输入特征与通道注意力相乘,即不同通道特征赋予不同注意力权重得到新特征,再将新特征输入空间注意力模块得到空间注意力,最后将新特征与空间注意力相乘得到最终输出特征。通过通道注意力模块得到不同通道的权重,使得重要特征通道被赋予更大的权重,有利于网络关注目标区域对分类结果的贡献更大的特征。将输入特征与通道注意力相乘,可以使得不同通道的特征在不同程度上被强化或削弱,增加了特征表达的灵活性和多样性。空间注意力模块能够自适应地学习不同位置的特征之间的相关性和重要性,进一步提高了特征表达和分类性能。最终输出特征是经过通道注意力和空间注意力共同调整之后的特征,既保留了图像中所有信息,又强化了与目标区域相关的特征,有效地提高了网络的准确率和鲁棒性。卷积神经网络中的通道注意力模块和空间注意力模块的组合有效提高网络对目标区域的关注程度和提取特征的能力,从而在目标检测、图像分类等任务中取得更好的性能。
18、有益效果:
19、(1)数据直接输入到卷积神经网络,避免人工选取故障电弧特征值,减少工作量。同时层级结构的卷积神经网络通过学习多个卷积核,能够自动提取不同层级的多种特征,基于多尺度特征,有效融合卷积神经网络的低层特征和高层特征,模型性能得到显著改善,减少了人为干预,提升故障电弧检测的准确性。
20、(2)引入残差连接对模型进行了优化。考虑到卷积层数量较少,本发明在设计残差结构单元时,对经典的残差结构单元做了一些简化。经过简化之后不仅减小了算法计算量和复杂度,适用于大规模数据检测,检测性能好;减少参数量和计算复杂度、更具有实用性;而且残差结构简化网络学习过程,增强模型泛化能力,提高抗干扰能力,降低在进行故障电弧检测时的误判率或漏判率。
21、(3)引入卷积注意力模块对模型进行优化。卷积注意力模块采用的是通道注意力模块和空间注意力模块的融合,相比传统的只选择其中一个注意力模块,进一步提升故障电弧检测精确度。