专利名称:字符识别方法
技术领域:
本发明属于光学字符识别领域,涉及一种光学字符识别法。
背景技术:
在字符识别过程,字符特征提取是至关重要的一步。特征提取可以看作对原始字符关键信息的抽取,所以特征要尽可能的体现不同字符间的差异,换句话说,不同类字符特征之间的距离要尽可能大。如果特征选取不当,无论选择什么样的分类器也无法达到很好的识别率。识别一个字符通常是提取字符的边缘或者提取字符的骨架,然后再在边缘或者骨架上再提取特征。现有方法在描述边缘或者骨架上的点时,仅仅是考虑到当前点本身的信息。如用(X,y, f (X,y))作为边缘或者骨架上的一点P的特征,其中X,y表示点P坐标,f(x, y)表示亮度值,这样提取出来的特征具有局部性,如果两个字符局部形态相近(如Q和O),那么这两个字符提取出来的特征具有很大的相似性,这样就不利于区分这两个字符,导致系统识别率下降。因此,提供一种新的特征提取方法,用另外一个思路来描述字符边缘或者骨架上的点,扩大字符特征的差异,从而提高字符的识别率,非常重要。
发明内容
本发明的目的在于提供一种字符识别方法,通过扩大不同字符间特征的差异,提高字符识别率。该字符识别方法包括步骤1:读入字符图像;步骤2 图像预处理;步骤3:字符切割;步骤4 :边缘提取;运用边缘检测算子检测出字符的边缘点;步骤5 :特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(Plk,P2k…Put)表示,因此每一字符的特征向量用矩阵(P21 Pn …Pm )
权利要求
1.一种字符识别方法,包括步骤1:读入字符图像;步骤2:图像预处理;步骤3 :字符切割;步骤4 :边缘提取,运用边缘检测算子检测出字符的边缘点;步骤5 :特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(Plk,P2k…PMk)表示,因此每一字符的特征向量用矩阵
2.如权利要求1所述的字符识别方法,其特征在于,步骤6中将特征向量(Plk,P2k-PMk) 映射到一个矩阵T中的步骤具体包括步骤61,设字符边缘上的任意一点的特征向量的一个分量Pij = (Iij, Θ Jj), Iij e [O, L],Θ u e [O, 2 Ji ],将区间
分为u个等份,将区间
分为ν个等份, 形成一区块矩阵,根据Iu和Θ u的值,将任一点的特征向量里的每一个分量都投影到该区块矩阵中;步骤62,规定T的分量为特征分量Pu投影到第i行、第j个块中特征分量的个数,则任一点的特征向量(Plk,P2k…Put)均转化为类似如下形式大小为uXv的矩阵
3.如权利要求1所述的字符识别方法,其特征在于,该步骤2中图像预处理包括三个部分图像去噪、图像旋转纠偏和图像二值化。
4.如权利要求1所述的字符识别方法,其特征在于,该步骤3中字符切割具体是对二值化后的字符图像进行水平垂直投影,切割出每一个字符。
全文摘要
本发明涉及一种该字符识别方法,其包括步骤1读入字符图像;步骤2图像预处理;步骤3字符切割;步骤4边缘提取;运用边缘检测算子检测出字符的边缘点;步骤5特征提取,每一字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,用特征向量(P1k,P2k…PMk)表示;步骤6特征处理,将特征向量(P1k,P2k…PMk)映射到一个矩阵T中,使得所有字符的特征向量维度相同;步骤7,模板匹配识别。由于字符的每一边缘点的特征都用该字符其他边缘点到该边缘点的距离表达,从整个字符保证了特征的全局性,扩大了不同字符间特征的差异,从而提高了字符识别率。
文档编号G06K9/60GK103049750SQ20131001207
公开日2013年4月17日 申请日期2013年1月11日 优先权日2013年1月11日
发明者梁添才, 王锟, 王卫锋, 刘思伟 申请人:广州广电运通金融电子股份有限公司