本发明涉及一种基于奇异值分解的手写电气元件符号识别方法,属于机器学习和模式识别的技术领域。
背景技术:
随着计算机技术的不断发展,计算机的计算处理能力不断增强,计算机已经可以应用到许多领域当中。在电气工程方面,随着技术的发展和时代的进步,采用计算机对电力工程图进行绘制已经成为了必然,然而,现存的电力工程图中依然有大量的手绘图纸,如果对这些手绘图纸中的元件采用人工的方式录入计算机,将会大大提升录入成本,且耗费时间巨大。同时,由于工作量巨大且十分精细,一旦人员录入出现错误,对于一项工程的影响将是不可估计的。因此,对电力工程图中的电气元件进行识别成为了一项必要的课题,有利于提高手绘图纸录入计算机的效率,对于电力工程图的自动化起到推动作用,同时为电网、研究院等相关单位的数据统计、数据挖掘分析等奠定基础。
奇异值分解是线性代数领域的一种十分重要的矩阵分解过程,是矩阵分析中正规矩阵酉对角化的推广,在数字信号处理、数据统计等领域有着重要的应用。奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似,然而这两种矩阵分解尽管有其相关性,但还是有明显的不同。对称阵特征向量分解的基础是谱分析,而奇异值分解则是谱分析理论在任意矩阵上的推广。在机器学习和模式识别领域,奇异值分解常被应用于样本集合的训练,对样本特征进行降维,从而提取出更加重要的特征,对分类识别起到促进作用。
技术实现要素:
针对现有技术存在的不足,本发明提供一种基于奇异值分解的手写电气元件符号识别方法。本发明通过机器学习与模式识别的相关知识,利用奇异值分解的思想对手写的电气元件符号进行识别,有利于对手写电力工程图纸的有效利用,提高电力工程图纸的自动化效率,有利于之后相关工作的开展。
发明概述:
一种基于奇异值分解的手写电气元件符号识别方法,包括图像预处理、元件标准化、特征提取和元件分类四个步骤。图像预处理主要是通过数字图像处理的相关知识以及滤波等操作对图像进行预处理,对所研究对象中的冗余信息进行剔除,并对图像的形式与特性进行规范;元件标准化就是将所要识别的元件按照一定的标准对其大小、格式等特征进行统一,为后续的识别分类过程做好准备;特征提取就是根据奇异值分解的相关思想,将手写电气元件与标准电气元件相联系,提取特征,从而有利于手写电气元件的特征识别;元件分类过程,采用最近邻分类器对样本进行分类,判断识别方法的准确性。
本发明的技术方案如下:
一种基于奇异值分解的手写电气元件符号识别方法,包括训练部分和测试部分;所述训练部分包括步骤如下:
1-1)对电力工程图进行二值化及去噪处理;
1-2)对经步骤1-1)处理后的图像中的元件以及手写电气元件符号进行切割与标准化;
1-3)利用奇异值分解思想训练出奇异值分解模型;
所述测试部分包括步骤如下:
2-1)对手写电气元件符号进行切割与标准化;
2-2)对经步骤2-1)处理后的元件通过训练出的奇异值分解模型进行识别。
根据本发明优选的,所述步骤1-1)中,所述二值化处理的方法为:通过对手写元件图像及电力工程图像的第三维进行平方开方运算,将三维矩阵降至二维灰度图像矩阵,之后通过选择恰当的阈值(对于本领域技术人员来说,此处选择阈值一般为经验调节,是按照现有技术可以实现的),将二维的灰度图像矩阵转变为只有0、1的矩阵;对于电气元件来说,颜色信息以及灰度信息在识别上属于冗余信息,同时,手写电气元件的扫描图由于扫描环境的关系也会存在一定冗余信息,因此,在预处理阶段,对手写元件图像及电力工程图像进行二值化处理;
所述去噪处理的方法为:通过高斯滤波以及抗椒噪声的均值滤波对二值化后的矩阵进行滤波,有效去除噪声干扰。由于原始图像扫描环境以及二值化时所选择阈值的影响,二值化矩阵中不可避免地会出现噪声,即引入一些错误的像素点,因此引入本去噪处理,至此图像预处理过程完毕。
根据本发明优选的,在步骤1-1)中,还包括:对二值化后的矩阵进行反转操作。由于人眼对白色像素点的敏感度高于黑色像素点,因此对二值化后的矩阵进行反转操作,使得元件信息能够更加容易被人眼观察。
根据本发明优选的,在步骤1-2)中,所述切割与标准化的方法包括,选取手写元件以及电气工程元件的重心作为标准化图像的中心,对原始图像进行相应放大、缩小,将图形规格标准化至100*100,即每一个元件图形保证为正方形,边长为100像素,共10000像素点。元件标准化过程的目的是将手写元件的图像与电力工程图元件图像的大小与规格相匹配,为之后奇异值分解做准备,达到标准化的效果。此处所述的重心为元件的几何中心。
根据本发明优选的,在步骤1-3)中利用奇异值分解思想利用奇异值分解思想训练出奇异值分解模型的具体方法包括:
我们的目标是训练出奇异值分解模型,因此,假设手写电气元件为probe样本,电力工程图元件为gallery样本,在模型训练过程中,假设Xm、Ym为m维的特征,其中Xm为电力工程图元件原始特征,Ym为手写电气元件原始特征;probe样本与gallery样本之间存在一定的不同,奇异值分解便是将二者通过一定的手段进行结合,此处将gallery样本与probe样本相结合,共同组合为训练样本,达到二者相联系的目的;假设gallery样本和probe样本分别有N个样本,假定训练矩阵如下:
其中矩阵中的每一行代表特征,每一列代表特征的样本数;训练矩阵M,gallery样本和probe样本的特征会被投影到一个共同的子空间;
利用奇异值分解的思想,训练矩阵M将会被分解为如下三个矩阵:
其中为共同子空间中的串联特征,d代表了每一个样本的特征维数,是一个对角矩阵,代表M矩阵的奇异值,表示了子空间的标准正交基。
U包括两种不同的特征,两种特征是相互独立的,U被如下分解:
其中,Rx和Ry分别代表gallery和probe样本特征子矩阵,即分别为电力工程图元件特征子矩阵和手写电气元件特征子矩阵;
假设x表示gallery特征即电力工程图元件特征,y表示probe特征即手写电气元件特征:
令K=SVT,km为K的第m行向量,那么,子空间上的一点λ被表示为
那么电力工程图元件特征通过点λ将被投影到手写电气元件特征的空间,如下,
至此奇异值分解模型训练完毕,两种不同的特征被投影到了共同的空间中,为后续的分类提供了良好的基础。
根据本发明优选的,所述步骤2-1)中对手写电气元件符号进行切割与标准化的方法包括:选取手写元件的重心作为标准化图像的中心,对原始图像进行相应放大、缩小,将图形规格标准化至100*100,即每一个元件图形保证为正方形,边长为100像素,共10000像素点。此处所述的重心为元件的几何中心。
根据本发明优选的,所述步骤2-2)中对经步骤2-1)处理后的元件通过训练出的奇异值分解模型进行识别方法如下:
给定gallery样本集即电力工程图元件特征样本集,通过样本xi计算点λ,从而得到点那么手写电气元件特征即probe样本特征被如下分类,
πi其中
其中πi为样本的分类标签。
本发明的有益效果是:
一种基于奇异值分解的手写电气元件符号识别方法,包括训练和测试,所述训练包括,对电力工程图进行二值化及去噪处理、对元件以及手写电气元件符号进行切割与标准化;利用奇异值分解思想训练出奇异值分解模型;所述测试包括,对手写电气元件符号进行切割与标准化;对元件通过训练出的奇异值分解模型进行识别。图像预处理主要是通过数字图像处理的相关知识以及滤波等操作对图像进行预处理,对所研究对象中的冗余信息进行剔除,并对图像的形式与特性进行规范;元件标准化就是将所要识别的元件按照一定的标准对其大小、格式等特征进行统一,为后续的识别分类过程做好准备;特征提取就是根据奇异值分解的相关思想,将手写电气元件与标准电气元件相联系,提取特征,从而有利于手写电气元件的特征识别;元件分类过程,采用最近邻分类器对样本进行分类,判断识别方法的准确性。本发明通过机器学习及模式识别等方法,利用奇异值分解的思想,对手写电气元件进行检测与识别,有利于对手写电力工程图纸的有效利用,提高电力工程图纸的自动化效率,有利于之后相关工作的开展。
附图说明
图1本发明所述方法的流程图;
图2本发明中所述的电力工程图示意图;
图3手写电气元件示意图。
具体实施方式
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
如图1-3所示。
实施例、
一种基于奇异值分解的手写电气元件符号识别方法,包括训练部分和测试部分;所述训练部分包括步骤如下:
1-1)对电力工程图进行二值化及去噪处理;
所述步骤1-1)中,所述二值化处理的方法为:通过对手写元件图像及电力工程图像的第三维进行平方开方运算,将三维矩阵降至二维灰度图像矩阵,将二维的灰度图像矩阵转变为只有0、1的矩阵;
所述去噪处理的方法为:通过高斯滤波以及抗椒噪声的均值滤波对二值化后的矩阵进行滤波,有效去除噪声干扰;
在步骤1-1)中,还包括:对二值化后的矩阵进行反转操作;
1-2)对经步骤1-1)处理后的图像中的元件以及手写电气元件符号进行切割与标准化;
在步骤1-2)中,所述切割与标准化的方法包括,选取手写元件以及电气工程元件的重心作为标准化图像的中心,对原始图像进行相应放大、缩小,将图形规格标准化至100*100,即每一个元件图形保证为正方形,边长为100像素,共10000像素点;
1-3)利用奇异值分解思想训练出奇异值分解模型;
在步骤1-3)中,利用奇异值分解思想利用奇异值分解思想训练出奇异值分解模型的具体方法包括:
在模型训练过程中,假设Xm、Ym为m维的特征,其中Xm为电力工程图元件原始特征,Ym为手写电气元件原始特征;假设gallery样本和probe样本分别有N个样本,假定训练矩阵如下:
其中矩阵中的每一行代表特征,每一列代表特征的样本数;训练矩阵M,gallery样本和probe样本的特征会被投影到一个共同的子空间;
利用奇异值分解的思想,训练矩阵M将会被分解为如下三个矩阵:
其中为共同子空间中的串联特征,d代表了每一个样本的特征维数,是一个对角矩阵,代表M矩阵的奇异值,表示了子空间的标准正交基。
U包括两种不同的特征,两种特征是相互独立的,U被如下分解:
其中,Rx和Ry分别代表gallery和probe样本特征子矩阵,即分别为电力工程图元件特征子矩阵和手写电气元件特征子矩阵;
假设x表示gallery特征即电力工程图元件特征,y表示probe特征即手写电气元件特征:
令K=SVT,km为K的第m行向量,那么,子空间上的一点λ被表示为
那么电力工程图元件特征通过点λ将被投影到手写电气元件特征的空间,如下,
所述测试部分包括步骤如下:
2-1)对手写电气元件符号进行切割与标准化;
所述步骤2-1)中,对手写电气元件符号进行切割与标准化的方法包括:选取手写元件的重心作为标准化图像的中心,对原始图像进行相应放大、缩小,将图形规格标准化至100*100,即每一个元件图形保证为正方形,边长为100像素,共10000像素点;
2-2)对经步骤2-1)处理后的元件通过训练出的奇异值分解模型进行识别;
在所述步骤2-2)中,对经步骤2-1)处理后的元件通过训练出的奇异值分解模型进行识别方法如下:
给定gallery样本集即电力工程图元件特征样本集,通过样本xi计算点λ,从而得到点那么手写电气元件特征即probe样本特征被如下分类,
πi其中
其中πi为样本的分类标签。