一种基于强化学习和Transformer的电力缺陷检测方法与流程

文档序号：30959540发布日期：2022-07-30 12:09阅读：来源：国知局

技术特征：
1.一种基于强化学习和transformer的电力缺陷识别方法，其特征在于，包括以下步骤：步骤1、采集电力巡检航拍图像集并使用深度卷积生成对抗网络进行数据增强，得到扩充后的图像数据集，再对扩充后的图像数据集进行标准化处理后，再对每张标准化后的图像标注目标检测框，从而得到训练数据集；步骤2、构建用于筛选前景区域和背景区域的强化学习模块，并将所述训练数据集输入所述强化学习模块中进行训练，得到所述训练数据集中第i幅图像的前景区域特征向量集合f
i,f
和背景区域向量集合f
i,b
；步骤3、根据所述第i幅图像的前景特征向量集合f
i,f
和背景区域向量集合f
i,b
，使用双线性池化层对所述背景区域向量集合f
i,b
中的非关键区域进行信息压缩，得到数量为m的特征向量集合f
i,c
，再与所述前景特征向量集合f
i,f
进行连接后，得到新向量组合f
i*
；步骤4、将所述第i幅图像的新向量组合f
i*
输入transformer模块中进行特征提取，得到特征图t
i
后再使用全连接层对所述特征图进行处理，并输出预测结果，从而根据预测结果与真实结果构建损失函数，用于训练transformer模块的参数，并最终得到训练好的transformer模块用于对电力缺陷进行识别。2.根据权利要求1所述的电力缺陷识别方法，其特征在于，所述步骤2包括：步骤2.1、构建强化学习模块，包括：detnet特征提取的主干网络、dqn网络；并随机初始化强化学习模块的参数；所述主干网络是基于空洞卷积构建的卷积神经网络，并包含x个卷积块；其中，第x级卷积块依次由卷积核大小为c1的普通卷积层、卷积核大小为c2的空洞卷积层和卷积核大小为c2的普通卷积层组成，其中，每一个卷积块后连接有一个批量归一化层和一个relu激活函数；所述dqn网络组成由全连接网络组成；步骤2.2、根据训练数据集中的图片数量设定经验池d的空间，并初始化经验池d；步骤2.3、所述训练数据集中第i幅带有目标检测框的图像输入所述提取主干网络中进行特征提取，得到尺寸为c
×
n
×
n的特征图f
i
；c表示特征图f
i
的通道数，n表示特征图f
i
的长或宽；步骤2.4、将所述特征图f
i
分为大小相等的n
×
n块单位区域，每块单位区域代表一个动作选择，从而得到动作空间记为a
i
＝{a
i,1
,a
i,2
,,...,a
i,t
,...,a
i,n
×
n
}，a
i,t
表示在第i幅图像中选择第t个单位区域的动作；步骤2.5、利用式(1)计算在第i幅图像中第t个动作所选择的单元区域的奖励分数r
i,t
，从而得到所述特征图f
i
的奖励函数j
i
＝{j
i,1
,j
i,2
,,...,j
i,t
,...,j
i,n
×
n
}；式(1)中，δ
i,t
表示在第i幅图像中第t个单位区域中所包含目标物体像素数量；δ
i,all
表示在第i幅图像中第t个单位区域的总像素数量；步骤2.6、设置所述特征图f
i
的状态空间s
i
；步骤2.7、将状态空间输入所述dqn网络中，并获得动作空间中每个动作的评分，使用贪
婪策略选取其中得分最高的k个动作，并由状态空间s
i
及其k个动作组成q值表q(s
i
,a
i
)；并根据奖励函数r计算当前k个动作下所获得的k个奖励值，从而k个奖励值和q值表q(s
i
,a
i
)所组成的第i个元组存入经验池d中；步骤2.8、按照步骤2.3-步骤2.7的过程对所述训练数据集中所有图像依次进行处理，从而将所述经验池d填满；步骤2.9、在经验池d中随机挑选g组元组，并使用反向传播算法更新一次强化学习模块中的参数；步骤2.10、按照步骤2.3到步骤2.9的过程进行z1次更新后保存最终的强化学习模块，并将训练数据集中的图像输入最终的强化学习模块中，第i幅图像输出最终的特征图f
′
i
，选择所述特征图f
′
i
中奖励值最高的k个单位区域作为前景区域特征向量集合f
i,f
＝{f
i,f,l
,|l＝1,...,k}，剩余单位区域作为背景区域向量集合f
i,b
＝{f
i,b,r
，|r＝1,...,n
×
n-k}；其中，f
i,f,l
表示第i幅图像中第l个前景区域的特征向量，f
i,b,r
表示第i幅图像中第r个背景区域的特征向量。3.根据权利要求1所述的电力缺陷识别方法，其特征在于，所述步骤3包括：步骤3.1、利用式(2)得到第i幅图像中第r个背景区域向量对应的聚合权重向量a
i,r
：a
i,r
＝f
i,b,r
w
a
ꢀꢀꢀ
(2)式(2)中，w
a
表示一个维度为c
×
m的权值矩阵；a
i,r
＝{a
i,r,m
|m＝1,...,m}，m代表压缩后的向量维度；a
i,r,m
是聚合权重向量a
i,r
中的第m个元素，表示在第i幅图像中第r个背景区域特征向量对应的第m个聚合权重；步骤3.2、利用式(3)再对所述第i幅图像中第r个背景区域特征向量对应的第m个聚合权重a
i,r,m
进行标准化处理，得到第i幅图像中第r个背景区域特征向量对应的第m个标准化后的聚合权重a'
i,r,m
：式(3)中，a
i,r',m
表示在第i幅图像中第r'背景区域特征向量对应的第m个聚合权重，表示在第i幅图像中所有背景区域特征向量的第m个聚合权重之和；步骤3.2、利用式(4)得到第i幅图像中第r个特征投影向量f
′
i,r
：f
′
i,r
＝f
i,r
w
v
ꢀꢀꢀꢀꢀ
(4)式(4)中，w
v
表示一个维度为c
×
c的权值矩阵；步骤3.3、利用式(5)得到第i幅图像中第m个压缩后的特征向量f
i,m
，从而得到压缩后背景区域特征向量集合f
i,c
＝{f
i,m
，|m＝1,...,m}：式(5)中，*表示向量间卷积。4.根据权利要求1所述的电力缺陷识别方法，其特征在于，所述步骤4具体包括步骤：步骤4.1、构建transformer模块，包括：transformer特征提取网络、端到端检测器；并并随机初始化所述transformer模块的参数；所述transformer特征提取网络分支是基于transformer-encode构建的y个transformer块，其中，第y个transformer块依次由第一层归一化层、多头自注意力机制层、
第二层归一化层以及多层感知机组成，其中，第一层归一化层的输入与所述多头注意力机制层的输出进行跳跃连接，第二层归一化层的输入与所述多层感知机的输出进行跳跃连接；所述端到端检测器由全连接网络组成；步骤4.2、将所述第i幅图像的新向量集合f
i*
送入所述transformer特征提取网络中，并依次经过y个transformer块的特征提取后，得到信息高度浓缩的特征图t
i
，再将所述特征图t
i
输入所述端到端检测器中进行预测，获得预测结果。

技术总结
本发明公开了一种基于强化学习和Transformer的电力缺陷识别方法，其步骤包括：1无人机航拍采集原始数据集，并通过深度卷积生成对抗网络增广数据集合；2使用强化学习模块提取图像特征搜索出前景区域；3通过Transformer模块对背景区域特征向量压缩并进一步进行特征提取，并最终经过全连接层获得最终预测结果。本发明利用深度学习实现了对电力缺陷区域的检测，从而减少了人力成本，且不受天气、背景等外部因素的影响，并提高了检测效率和检测精度。率和检测精度。率和检测精度。

技术研发人员：李帷韬侯建平胡平路管树志杨盛世张雪松李奇越孙伟刘鑫常文婧李卫国王刘芳董翔宇黄杰
受保护的技术使用者：国网安徽省电力有限公司超高压分公司
技术研发日：2022.05.05
技术公布日：2022/7/29

完整全部详细技术资料下载

当前第2页1 2