在无人机航拍图像中对输电线路绝缘子的识别定位方法
【技术领域】
[0001] 本发明设及一种基于Gabor特征的半监督学习随机森林算法实现在无人机航拍图 像中对输电线路绝缘子的识别定位方法,属于图像处理技术领域。
【背景技术】
[0002] 输电线路作为国家电力系统中的重要组成部分,其安全状态关乎大众安全。输电 线路中使用最多的电力设备是绝缘子,它的作用是防止电流回地,其性能好坏直接决定电 力输送系统的可靠性。
[0003] 目前,绝缘子运行状态的检测方法主要有超声波检测法、红外测溫法、脉冲电流法 等,运些方法大多存在操作复杂、成本高、危险性大、受气候影响大等缺点。近年来,随着计 算机图像处理技术的发展和无人机巡检技术的日益成熟,绝缘子检测方法有了新的突破。
[0004] 由于基于无人机输电线路航拍图像的绝缘子不良状态检测结果受背景影响较大, 问题复杂,成果较少,目前研究还处在发展阶段,其很大程度上依赖于输电线路图像中绝缘 子的准确识别和定位。因此如何有效区分背景和绝缘子,从复杂背景图像中准确识别绝缘 子成为检测工作的难点。
[0005] 近年来许多学者致力于研究利用数字图像处理技术从航拍图像中提取绝缘子图 像,主要从边缘检测方法,基于阔值分割方法W及利用绝缘子楠圆特性的化U曲变换方法定 位绝缘子。但由于航拍图像通常背景复杂,基于边缘检测的方法会引入大量干扰边缘,检测 精度不高;基于阔值分割方法利用绝缘子颜色特性能粗略检出疑似绝缘子的目标区域,但 当光照或背景变化时,检测算法鲁棒性低;基于绝缘子楠圆特性的方法受图像中绝缘子状 态影响,对于遮挡、连续排列的绝缘子检测效果差。
[0006] 此外,随机机器学习技术的推广,一些学者提出利用监督学习的卷积神经网络进 行绝缘子图像的识别,运种算法依赖无穷多的样本数,计算代价高;当样本数较少时检测准 确率低。
【发明内容】
[0007] 本发明所要解决的技术问题是:提出一种在无人机航拍图像中对输电线路绝缘子 的识别定位方法,解决传统技术中对绝缘子的识别算法检测精度不高、鲁棒性低、容易受样 本数影响的问题。
[000引本发明解决上述技术问题所采用的方案是:
[0009]在无人机航拍图像中对输电线路绝缘子的识别定位方法,包括W下步骤:
[0010] A、构建样本训练数据集;
[0011] B、采用半监督学习随机森林算法对步骤A中的样本训练数据集进行训练,获得绝 缘子识别模型;
[0012] C、采用步骤B中训练获得的绝缘子识别模型对无人机航拍图像中输电线路绝缘子 进行识别及定位。
[0013] 作为进一步优化,步骤A中,所述构建样本训练数据集的方法具体包括:
[0014] 将无人机航拍图像转换为灰度图像,从灰度图像中提取用于训练的样本图像,抽 取样本图像Gabor特征组成训练数据集。
[0015] 作为进一步优化,为保证不同样本图像所提取的Gabor特征维数一致,在提取完训 练样本图像之后要将所有样本图像统一变换至同一尺寸,且将提取的训练样本图像中已知 类别(是绝缘子和不是绝缘子两类)的图像分为带标签的样本图像和不带标签的样本图像 (样本类别未知)。
[0016] 作为进一步优化,在提取样本图像Gabor特征时,采用不同方向和尺度Gabor核组 成一组Gabor小波基,分别与样本图像做卷积,得到多个与样本大小相同的特征矩阵,再将 运些特征矩阵按列与列之间相连接,组成一个多维特征矢量用来描述该样本图像;最后分 别将带标签样本的特征矢量和不带标签样本的特征矢量对应归类到带标签样本训练数据 集和不带标签样本训练数据集中。
[0017] 作为进一步优化,步骤B中,所述采用半监督学习随机森林算法对步骤A中的样本 训练数据集进行训练,获得绝缘子识别模型的具体方法包括:
[0018] B1、训练参数初始化:设定更新标记样本集合的置信度阔值0、随机森林中所含决 策树个数n、每棵决策树所用训练数据子集的选择方式和数据子集所含样本数、决策树所需 特征属性个数、决策树节点分裂准则;
[0019] B2、对带标签样本训练数据集进行训练得到初始随机森林分类器:通过一定的样 本抽取方式在带标签样本数据集中提取n个数据子集,并用一定的抽取算法选择特征属性 子集进行训练得到含有n个决策树的随机森林分类器:H=化l,h2, . . .,hn};
[0020] B3、对无标签样本数据集预测,更新每个数据子集:对于分类器集合H中的每个决 策树hi,其余n-1个决策树所组成的分类器集合,称为hi的对等分类器集合,记做出;使用对 等分类器集合出对无标签数据集Xu中的样本执行多数投票的方式进行预测,使用标签的一 致性表示样本的置信度,选择置信度大于默认阔值0的无标签样本,复制到分类器hi的数据 子集中,实现每个决策树的训练集更新;
[0021] B4、使用更新的数据子集依次训练对应决策树,直到模型趋于稳定即可得到最终 的随机森林分类器模型作为绝缘子识别模型。
[0022] 作为进一步优化,步骤C中,所述采用步骤B中训练获得的绝缘子识别模型对无人 机航拍图像中输电线路绝缘子进行识别及定位,具体包括:
[0023] CU将输入航拍图像转换为灰度图并获得对应多尺度图;
[0024] C2、用与样本图像大小一致的检测窗口从左到右,从上到下遍历不同尺度下的航 拍图像,得到图像块;
[0025] C3、提取图像块的Gabor特征,送入绝缘子识别模型进行识别,标记并保存识别到 的绝缘子候选框的中屯、点坐标;
[0026] C4、重复步骤C2和C3,直到所有尺度下的航拍图像都遍历完成;
[0027] C5、将不同尺度下检测到的绝缘子候选框根据尺度变换因子转换到原始尺度下, 采用非极大值抑制最终锁定并标记航拍图像中的绝缘子。
[002引本发明的有益效果是:
[0029] 1)二维Gabor小波是对高级脊椎动物视觉平层中神经元的良好逼近,基于Gabor滤 波器的特征比较接近于人眼观察到的特征,可W根据Gabor滤波器的不同频率和方向对图 像滤波结果提取某些参数作为其纹理特征,从而达到纹理分析的目的;本发明通过Gabor函 数提取绝缘子在不同尺度、不同方向上的特征,可W很好地描述无人机在不同拍摄视角下 得到的不同姿态的绝缘子,进一步提高绝缘子的识别率。
[0030] 2)采用半监督学习随机森林的机器学习算法,通过有放回地获得数据子集和随机 抽取特征属性地方式在训练过程中引入随机性,使得每棵决策树之间保持独立性,并且它 能在不进行特征选择或特征删除等降维处理情况下,直接进行大规模高维数据的处理,且 具有良好的性能。此外,半监督学习的随机森林算法,利用带标签样本训练得到分类器,然 后对无标签数据进行预测,将置信度高的样本加入到训练集合中,然后利用新的训练数据 重新进行分类器的训练,通过有标签和无标签两类数据集和综合利用,克服了非监督学习 的盲目性和监督学习的数据类别标记困难的问题,通过决策树间的并行预测可W有效提高 分类效率。
【附图说明】
[0031 ]图1为航拍图像在单一尺度下绝缘子检测识别流程图;
[0032] 图2为数据子集更新流程图。
【具体实施方式】
[0033] 本发明旨在提出一种在无人机航拍图像中对输电线路绝缘子的识别定位方法,解 决传统技术中对绝缘子的识别算法检测精度不高、鲁棒性低、容易受样本数影响的问题。
[0034] 由于无人机航拍图像中绝缘子的角度、大小会随着无人机拍摄视角和高度的不同 而异,传统的特征描述子无法适应不同角度的绝缘子检测。本发明通过提取绝缘子图像不 同尺度和方向的Gabor特征,使提取的特征向量对绝缘子尺度和角度变换不敏感,适用于不 同姿态的绝缘子检测。此外,本发明采用半监督学习的随机森林算法,相比于监督学习,本 发明可有效减少准备带标签样本的工作量;相比于非监督学习,本发明能有效干预模型训 练过程,不需要无穷多个样本,计算代价相对较低。
[0035] 本发明利用不同尺度和不同方向的一组Gabor小波基与训练样本图像做卷积,形 成一组特征矢量W准确描述样本图像纹理特征;采用半监督学习方式的随机森林机器学习 算法训练已知类别和未知类别的样本数据集,得到绝缘子识别模型。通过从左到右从上到 下的方式,用与训练样本大小一致的检测窗口遍历不同尺度下的输入图像,并结合识别模 型检测和定位不同尺度下的输入图像中绝缘子的位置;再利用非极大值抑制方法最终确定 绝缘子在输入图像原始尺度下的准确位置。
[0036] 在具体实现上,本发明中的对输电线路绝缘子的识别定位方法步骤如下:
[0037] 步骤一:准备训练数据集:将无人机航拍图像转换为灰度图像,从灰度图像中提取 用于训练的样本图像,抽取样本图像Gabor特征组成训练数据集;为保证不同样本图像所提 取的Gabor特征维数一致,在提取完训练样本图像之后要将所有样本图像统一变换至同一 尺寸,运些样本中应包含部分已知类别(是绝缘子和不是绝缘子两类)的正负样本;在提取 样本图像Gabor特征时,我们用不同方向和尺度Gabor核组成一组Gabor小波基,分别与样本 图像做卷积,得到多个与样本大小的特征矩阵,再将运些特征矩阵按列与列之间相连接组 成一个多维特征矢量来描述样本图像。所有样本图像的特征矢量即可组成训练数据集。
[0038] 设Kx, y)是一幅样本图像,用Gabor基对其进行特征抽取的过程就是一个卷积运 算,即:
[0039] Omv(Z) = I(Z)帥",V(Z)
[0040] 其中,Z为图像坐标(x,y),恥,V(Z)表示Gabor小波核函数,其表示形式如下:
kmax表不最大义样频 率。y和V分别表示Gabor小波的方向和尺度因子,且ii、v为整数,O为高斯窗口的宽度与正弦 波的波长的比率。
[0043] 此时再将运些卷积之后得到的图像特征矩阵按列与列之间相连接组成一个1*M的 多维特征矢量(M大小与y、v、样本图像大小有关):
[0044] X = (〇〇'〇T, 〇〇, 1了,. . .,0",yT)
[0045] 步骤二:利用半监督学习随机森林算法对步骤一数据集中的数据进行训练,得到 绝缘子识别模型。
[0046] 1)训练参数初始化:设定更新标记样本集合的置信度阔值0、随机森林中所含决策 树个数