一种基于重建的车牌汉字识别方法

文档序号:6588265阅读:477来源:国知局
专利名称:一种基于重建的车牌汉字识别方法
技术领域
本发明属于计算机软件领域,涉及图像识别与模式处理技术,特别是一种基于重建的车牌汉字识别方法。
背景技术
我国的车牌中不仅有英文字母和阿拉伯数字,还包含笔划繁杂的汉字,其识别难度比字母、数字大的多。国内部分道路条件差,车牌污染比较严重;而且实际运行的车辆号牌会受到泥、油、漆等影响,车牌字符往往会有断裂、遮挡等现象;同时号牌制作工艺的不规范也会出现字符变浅、变模糊;车辆拍摄位置不固定,也导致字符图像产生各种形变。这些因素导致车牌汉字识别的难度比普通的汉字识别大的多。这也是国内现有的车牌识别系统识别率不够高的主要原因。因此准确识别车牌中的汉字字符,成为目前国内车牌识别系统的难点。现有技术的车牌汉字识别方法主要有三大类:(I)模板匹配识别方法(2)特征识别方法(3)神经网络识别方法。模板匹配识别方法的基本原理是根据采样得到的汉字样本生成标准的汉字灰度模板图像。在识别时把切分得到的待识别对象大小归一化,灰度归一化之后与标准汉字模板进行一定的匹配计算,匹配度最高的结果即为识别结果。不同的模板生成方式,不同的匹配度计算方法,可以得到对应的各种改进的模板匹配方法。例如文献《基于模板匹配的车牌汉字识别方法及判别函数》(《电子科技》2011年12期谷秋頓白艳萍)披露了一种改进的模板匹配方法。特征识别方法的基本原理是提取待识别字符的某些固有特征形成特征向量,再根据一定的分类规则对提取的特征向量进行分类判决,从而确定汉字识别结果。根据不同的特征,比如结构特征、SIFT特征、PCA特征等;或者不同的分类规则,比如贝叶斯分类器、KNN分类器、支持向量机等,可以得到对应的各种不同的特征识别方法,例如专利号为CN201110082300的《车牌字符识别方法》和专利号为CN201110164726的《基于F P G A多核的车牌识别系统》分别公开了一种应用于车牌识别的特征识别方法。神经网络识别方法的基本原理是收集大量的字符样本或者样本特征,把样本(或特征)送入构造好的神经网络进行训练,直到网络达到设定的稳定标准。识别时,把待识别样本(或特征)送入训练好的神经网络即可得到识别结果。根据不同的神经网络的输入,以及选择不同的神经网络结构,可以得到不同的神经网络识别方法,已有相关公开文献。例如刊登在《中国人民公安大学学报(自然科学版)》2009年03期中的《基于神经网络的车牌汉字识别方法》(杨大力刘舒)。上述三种算法各自有其缺陷。模板匹配方法的主要缺陷:模板匹配对于车牌字符定位的准确性要求较高,如果在一定范围进行滑动匹配,又会带来较大的时间复杂度。模板匹配方法对于字符形变敏感。虽然可以通过一些技术来对倾斜以及透视投影造成的畸变进行校正,但是形变对识别的影响还是较大。特征识别方法的主要缺陷:特征提取的效果受车牌质量的影响较为严重。车牌容易受到污损、遮挡等,使其质量退化。这种情况下汉字字符特征提取容易出现较大的偏差,从而影响识别。神经网络识别方法的主要缺陷:神经网络的结构复杂,不易确定。在训练中受噪声的干扰较大,容易陷入局部极值,影响识别效果。

发明内容
现有技术中模板匹配对车牌字符定位准确性要求高,形变影响大;特征识别对车牌外观整洁要求较为苛刻;而神经网络算法方法复杂,易受噪声干扰,容易陷入局部极值。为克服上述现有技术各自存在的缺陷,本发明提供一种基于重建的车牌汉字识别方法。本发明所述一种基于重建的车牌汉字识别方法,包括如下步骤:
步骤A.对每一车牌汉字,获取M张不同的车牌汉字图像,M为正整数;对这些车牌汉字图像进行缩放至统一像素大小Z的灰度图像,求取缩放至统一像素大小的每张图片的图像向量,得到各个汉字对应的参照样本向量集;
步骤B.对各个车牌汉字的参照样本向量集求取特征值及特征值对应的图像特征系数向量,利用图像特征系数向量构造特征系数向量矩阵U,每个不同的汉字对应一个不同的特征系数向量矩阵U;
步骤C.将待识别汉字图像缩放至与步骤A中车牌汉字图像缩放的统一像素大小Z相同的像素大小,求取其图像向量f,利用F=U * Ut 得出重建图像向量F,其中UtSU的转置矩阵;
步骤D.比较F和f相关性I,相关性I最大时使用的特征系数向量矩阵Ui对应的汉字即为待识别汉字图像所对应的识别结果。优选的,所述Z为30*60像素大小。

具体的,所述步骤B包括如下步骤:
B1.利用及=构造产生矩阵B,^为参照样本向量集中第i个样本
-O-3
的图像向量为参照样本向量集的平均图像向量;
B2:求取各个汉字产生矩阵5的特征值与特征向量,并且按特征值从大到小排序;
B3:对于步骤B2得到的特征值与特征向量,选取前N个特征值对应的特征向量作为特
W
征系数向量;N满足兹!一 ;其中z力产生矩阵B所选出的前N个特征值,下标表示不 Σ岑f
Λ-43Ι
同的特征值;NN为产生矩阵B的特征值总个数,α为预先设定的选择系数;
Β4.利用Β3中选出的N个特征向量,构造特征系数向量矩阵K…;其
中 < 为第i个汉字的特征系数向量;螞为第i个汉字的特征系数向量的个数,Ui为第i
个汉字的特征系数向量矩阵。进一步的,所述M=1000。进一步的,所述α =90%。
优选的,所述步骤D中计算相关性I的方法为
权利要求
1.一种基于重建的车牌汉字识别方法,包括如下步骤: 步骤A.对每一车牌汉字,获取M张不同的车牌汉字图像,M为正整数;对这些车牌汉字图像进行缩放至统一像素大小Z的灰度图像,求取缩放至统一像素大小的每张图片的图像向量,得到各个汉字对应的参照样本向量集; 步骤B.对各个车牌汉字的参照样本向量集求取特征值及特征值对应的图像特征系数向量,利用图像特征系数向量构造特征系数向量矩阵U,每个不同的汉字对应一个不同的特征系数向量矩阵U; 步骤C.将待识别汉字图像缩放至与步骤A中车牌汉字图像缩放的统一像素大小Z相同的像素大小,求取其图像向量f,利用F= U * Ut *f得出重建图像向量F,其中UtSU的转置矩阵; 步骤D.比较F和f相关性I,相关性I最大时使用的特征系数向量矩阵U对应的汉字即为待识别汉字图像所对应的识别结果。
2.如权利要求1所述的基于重建的车牌汉字识别方法,其特征在于:所述Z为30*60像素大小。
3.如权利要求2所述的基于重建的车牌汉字识别方法,其特征在于:所述步骤B包括如下步骤: B1.利用
4.如权利要求2或3所述的基于重建的车牌汉字识别方法,其特征在于:所述M=1000。
5.如权利要求3所述的基于重建的车牌汉字识别方法,其特征在于:所述α=90%。
6.如权利要求1所述的基于重建的车牌汉字识别方法,其特征在于:所述步骤D中计算相关性I的方法为
7.如权利要求1所述的基于重建的车牌汉字识别方法,其特征在于:所述步骤A和/或步骤C中缩放图像的方法为双线性插值法。
8.如权利要求1所述的基于重建的车牌汉字识别方法,其特征在于:所述步骤A和/或步骤C中缩放图像后的图像灰阶度为2`56阶。
全文摘要
一种基于重建的车牌汉字识别方法,包括步骤A中得到各个汉字对应的参照样本向量集,步骤B中得到特征系数向量矩阵U,步骤C中对待识别图像向量利用U得到重建图像向量F,步骤D中计算相关性,得到待识别图像对应的汉字。采用本发明所述的基于重建的车牌汉字识别方法,车牌汉字图像特征提取方式简单易行,参数设定少,易于调整;采用重建图像与原始图像的相关性分析技术,分类器结构简单,计算复杂度低。本发明通过主成份特征重建样本的方法来进行汉字字符识别,提供了一种简单、快速、鲁棒性高、识别率高的新型车牌汉字字符识别方法。
文档编号G06K9/00GK103106402SQ201310072000
公开日2013年5月15日 申请日期2013年3月7日 优先权日2013年3月7日
发明者黄山, 蒋欣荣, 周欣 申请人:成都威路特软件科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1