基于lvq神经网络的光学字符识别方法
【专利摘要】本发明涉及一种基于LVQ神经网络的光学字符识别方法,所述方法包括以下步骤:对待识别字符图像进行预处理,包括图像去噪、字符切分、二值化以及特征提取;将单个字符特征送入LVQ神经网络的输入层,根据竞争算法找到获胜的竞争层神经元并进行拒判检验;将符合判别条件的字符特征输入LVQ神经网络的竞争层进行识别,输出识别结果。本发明方法适应对误判率有严格要求的小字符集自动识别领域。
【专利说明】基于LVQ神经网络的光学字符识别方法
【技术领域】
[0001]本发明涉及一种基于学习向量量化(LVQ, Learning Vector Quantization)神经网络的光学字符识别方法,主要用于对错识率有严格要求的小字符集智能识别。
【背景技术】
[0002]光学字符识别(Optical Character Recognition, OCR)通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。在过去的几十年里,光学字符识别已经成为许多研究者的研究目标,它在许多不同的领域,如银行,航运,商业,通信以及国防等都有重要影响。
[0003]德国科学家Tausheck于1929年正式提出OCR的概念,但电子计算机诞生后才得以真正实现。现代商品化OCR系统分为三代:第一代OCR出现在1960年到1965年,最早为IBM公司的IBM1418。此产品识别字符少,需经过特殊指定。第二代OCR产品出现在60年代中期到70年代初期,典型系统为IBM1287。日本东芝公司首先实现了手写邮政编码识别的信函自动分拣系统。第三个时期开始于上世纪70年代中期。这一时期,人们已经把目光投向了解决质量较差的字符识别,以及大字符集的识别,例如汉字识别,高精度手写体数字识别。近年来也出现了能够识别印刷体、手写体的汉字、韩文、日文、数字、英文等多种字符的系统。而银行票据自动处理系统也成为了手写体字符识别系统中的热点。
[0004]我国的OCR技术,基本上起步于上述第三个时期,商业OCR产品的识别率最高己经可以达到99%以上,并且可以识别多种字体。但是目前还没有针对国防科技领域,例如遥控码表、航天器弹道以及其他特殊文件的识别与验证等对错识率有严格要求的小字符集智能识别方法及相关产品。
【发明内容】
[0005]本发明的目的在于克服上述不足,提供一种基于LVQ神经网络的光学字符识别方法,可以显著降低错识率,对印刷质量较好的小字符集识别效果达到零错识率。
[0006]本发明的目的是这样实现的:一种基于LVQ神经网络的光学字符识别方法,所述LVQ神经网络分为输入层、竞争层和输出层,所述方法包括以下步骤:
步骤A、对待识别字符图像进行预处理,包括图像去噪、字符切分、二值化以及特征提取。其中图像去噪处理是去除字符图像在采样、数据传输过程中产生的墨点、折痕等噪声信号;字符切分处理是对整个字符图像进行行列划分,获取每个字符的大小与位置;图像二值化处理可以减少大量冗余信息,将单个字符图像转化为一个二维像素矩阵,O表示白色像素,I表示黑色像素;特征提取过程是对单个字符的二维像素矩阵进行某种运算,提取可用于分类的关键特征。本方法提取的特征为网格特征,网格特征体现了字符整体形状的分布,具有平移和缩放不变性,有较强的容错能力和区分相似字符的能力。网格特征的计算方法如下:将字符图像均分为Fxli的网格,记第i个网格的中黑色像素的数量与总像素的比值为Xk,网格的总数为.则字符特征可用向量表示为:
【权利要求】
1.一种基于LVQ神经网络的光学字符识别方法,其特征在于所述方法包括以下步骤: 步骤A、对待识别字符图像进行预处理,包括图像去噪、字符切分、二值化以及特征提取,本方法提取的特征为网格特征,将字符图像均分为Ixf的网格,统计每个网格中的字符像素所占的面积比例,记字符特征向量为;
2.根据权利要求1所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于: 在步骤C中,所述竞争规则为:根据式(4)计算每个竞争层神经元与输入向量的距离,距离最小的竞争层神经元为获胜神经元,其次为次获胜神经元,序号分别记为Kl和K2
3.根据权利要求2所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤D中,拒判条件为
4.根据权利要求2所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤D中,拒判条件为
5.根据权利要求1所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于: 在步骤C中,所述竞争规则为:根据式(6)计算每个竞争层神经元与输入向量的相似度,相似度最大的竞争层神经元为获胜神经元,其次为次获胜神经元,
6.根据权利要求5所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤D中,拒判条件为
7.根据权利要求5所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤D中,拒判条件为
8.根据权利要求1至7所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤E中的学习速率-随着训练次数t根据式(7)进行同步调整,
9.根据权利要求1至7所述的一种基于LVQ神经网络的光学字符识别方法,其特征在于:在步骤E中的学习速率-随着训练次数t根据式(8)进行同步调整:
【文档编号】G06K9/60GK103745213SQ201310709595
【公开日】2014年4月23日 申请日期:2014年2月28日 优先权日:2014年2月28日
【发明者】张煜昕, 李永刚, 何剑伟, 周琳琦, 郭力兵, 李祥明, 茅文浩, 李清梅, 胡上成, 张龙 申请人:中国人民解放军63680部队