基于特征匹配的国际音标字体识别方法

文档序号:6519234阅读:638来源:国知局
基于特征匹配的国际音标字体识别方法
【专利摘要】本发明一种基于特征匹配的国际音标字体识别方法,涉及字体识别【技术领域】。包括:对统一尺寸的国际音标图像进行预处理。即对每一副国际音标图像进行细化处理,在保证不干扰字体像素连续性的情况下,逐行扫描图像中的字体部分,进而去除多余的像素点,得到预处理的国际音标字体图像;特征点提取;使用每个训练字体样本的特征点建立模板库;对输入的字体图像进行测试,匹配特征点,并得出测试结果。利用本发明,进行特征点的匹配就可以进行能正确识别国际音标字体的识别,简单而高效,而且该方法同样能使用在其他语言的字体识别中,通用性好。
【专利说明】基于特征匹配的国际音标字体识别方法
【技术领域】
[0001]本发明涉及字体识别【技术领域】,具体指一种基于特征提取国际音标字体识别的方法。
【背景技术】
[0002]目前,印刷文本的分析涉及到内容的字体识别,虽然光学字符识别技术已经很成熟,但是都很少考虑处理多字体的文本。将字体识别模块加入到光学字符识别设备当中,能很好地改善文本的识别效率和分类结果。针对国际音标的广泛使用,并且光学字符系统缺少识别国际音标字体的功能模块,因此,提出一种简单并且正确率高的方法来实现字体的识别,显得非常有必要。
[0003]现有技术方案中,大多数采用纹理特征以及排版特点进行特征分析。通过纹理提取的特征,其过程复杂,需要对整块文字区域进行处理,并且移除文字间空白区域作为特征提取的预处理操作,进而使用Gabor滤波器、小波变换或其他技术进行特征提取,过程较繁琐。通过排版特点提取的特征,虽然可以代表字体的特性,但是对抗噪声性能不高,并需要在非常高的扫描分辨率下获取字体图像,因此可移植性差,不能很好的应用在国际音标字体识别中。近年来,也有一些其他的字体特征提取的方法,但是没有针对国际音标字体识别的具体方法,识别过程耗时长,提取的特征很复杂,识别率低,而且只是针对个别语种进行识别,通用性不高。

【发明内容】

[0004]本发明的主要目的是解决现有技术存在的缺失和不足,提供一种特征匹配国际音标的字体进行识别。该方法包括:
[0005]步骤1:对不同大小的不同国际音标字体图像进行预处理,即集统一图像尺寸,使用大津法进行二值化操作,再进行细化操作。
[0006]步骤2:行操作和列操作。
[0007]步骤3:对样本图像进行特征点提取。
[0008]步骤4:各个国际音标字符的不同字体特征点图像建立特征模板库。
[0009]步骤5:对输入的国际音标字体进行测试,匹配特征点,并得出测试结果。
[0010]从上述技术方案可以看出,本发明具有以下优点:
[0011]利用本发明,进行特征点的匹配就可以进行字体的识别,简单而高效,本发明能正确国际音标字体,而且能使用在其他语言中,通用性好。
【专利附图】

【附图说明】
[0012]图1基于特征匹配的国际音标字体识别方法流程框图;
[0013]图2本发明实施例国际音标β的原始图像;
[0014]图3本发明实施例国际音标$的原始图像;[0015]图4本发明实施例国际音标β的二值化图像;
[0016]图5本发明实施例国际音标?的二值化图像;
[0017]图6本发明实施例像素值为3的窗口标记;
[0018]图7本发明实施例像素值为4的窗口标记;
[0019]图8本发明实施例国际音标^图片的细化结果;
[0020]图9本发明实施例国际音标?图片的细化结果;
[0021]图10行操作和列操作流程框图;
[0022]图11本发明实施例国际音标β的行操作效果图;
[0023]图12本发明实施例国际音标β的列操作效果图;
[0024]图13本发明实施例国际音标:£的行操作效果图;
[0025]图14本发明实施例国际音标S的列操作效果图;
[0026]图15本发明实施例国际音标β的各个字体特征点匹配结果;
[0027]图16本发明实施例国际音标?的各个字体特征点匹配结果;
图17本发明实施例国际音标字体识别结果。
【具体实施方式】
[0028]以下结合附图和实施例对本发明进一步描述
[0029]本发明的实验测试是在CPU为Intel (R) Core (TM) 3.40GHz的电脑上完成,Matlab的版本为 MatlabR2011b。
[0030]下面按附图1的流程图详细给出本发明技术方案中所涉及的各个步骤的细节作出说明:
[0031]步骤1:对国际音标字体图像进行预处理。不同的扫描分辨率和字号会对形成不同大小的国际音标图像,为了得到稳定的国际音标结构信息,应使同一国际音标的不同字体图片调整到相同尺寸,选用两个国际音标图像作为演示,得到原字体图像(如附图2和附图3),然后使用大津法对图像进行二值化处理(如附图4和附图5),接下来进行细化操作:
[0032]一、将二值化图像中的黑色像素的值赋为1,白色像素的值赋为O ;
[0033]二、将像素值为I的黑色像素值全部重新赋值为2,且在2*2的窗口内与相邻非零像素一起构成三角形状的非零像素的值赋为3 (如附图6);
[0034]三、采用3*3窗口,将该窗口在图像上扫描,把其中满足附图7的黑色背景处的像素赋值为4,周围相邻的灰色背景表示像素值非零,白色背景表示像素值为零。
[0035]四、删除像素值为4的点。
[0036]五、按行扫描图像,在不干扰像素连续性的情况下,删除像素值为2和3的点。
[0037]六、将图像中剩余的像素重新赋值为1,再按二至五操作图像中的像素。
[0038]以上便是图像细化的原理,最后得到的细化结果如图8和图9所示。
[0039]步骤2:
[0040]首先提前阐述 以下两个操作的原理:
[0041]一、行操作:查找各行中连续像素数大于8的部分,此时保留其两端像素而删除中间像素,如附图10(a)所示,其效果如附图11和附图13。
[0042]二、列操作:查找各列中连续像素数大于8的部分,此时保留其两端像素而删除中间像素,如附图10(b)所示,其效果如附图12和附图14。
[0043]明白两个操作的具体细节,接下来对附图8和附图9的细化结果图片进行处理:
[0044]三、对由步骤I得到的细化图像先进行行操作然后进行列操作,得到的结果像素矩阵为Al。
[0045]四、对由步骤I得到的细化图像先进行列操作然后进行行操作,得到的结果像素矩阵为A2。
[0046]步骤3:
[0047]Al表示由步骤2中第三步得到的像素矩阵,A2表示由步骤2中第四步得到的像素矩阵,采用特征匹配算法公式,当Al和A2在同一位置都含有黑色像素,则对新的像素矩阵的同样位置赋值为1,否则赋值为0,由此得到的结果像素矩阵为A0。
[0048]
【权利要求】
1.一种基于特征匹配的国际音标字体识别方法,其特征在于,包括步骤:a.国际音标字体图像预处理;b.行操作和列操作;c.特征提取;d.建立特征模板库;e.国际音标字体测试。
2.如权利要求1所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述a.国际音标字体图像预处理,包括步骤: a.1扫描字体图像时,确保同一国际音标的不同字体图像尺寸都相同,得到原字体图像; a.2使用大津法进行二值化处理; a.3细化操作。
3.如权利要求1所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述b.行操作和列操作,包括步骤: b.1行操作:查找各行中连续像素个数大于8的部分,保留两端的两个像素,删除该行中间所有像素,扫描后得到行操作图像; b.2列操作:查找各列中连续像素数大于8的部分,保留两端的两个像素,删除该列中间所有像素,扫描后得到列操作图像; b.3进行细化结果图像处理。
4.如权利要求1所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述c.特征提取,包括步骤: C.1扫描由步骤b得到的图像,如果两幅图像在相同位置都含有像素,那么保留该像素,否则删除该位置的像素; C.2将两幅图像合并得到一幅新的图像; c.3滤波操作:选用一个含有奇数个像素的滑动窗口,将该窗口在图像上扫描,合并其中所含的像素点,并重新在被合并的像素点的重心位置赋一个新的像素点,最终得到特征点。
5.如权利要求1所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述d.建立特征模板库,包括步骤: 按步骤a、b和c操作,将各个国际音标的字体特征点矩阵合并成一个元胞数组,然后使用save函数将这个元胞数组转换为一个综合模板库文件。
6.如权利要求1所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述e.国际音标字体测试,包括步骤: e.1将字体图像的尺寸统一设为63*63像素,然后使用大津法进行二值化; e.2运用canny算子提取图像边缘,将这个边缘图像和特征模板库中的特征点进行匹配; e.3若某一个字体的特征点不被包含在边缘图像的内部,则判别此字体不为正确字体,继续选择同一国际音标的其他字体特征点进行测试,直到某一个字体特征点都被包含在边缘图像的内部为止,则此待测国际音标字体为拥有这个特征点的字体,进而输出正确结果。
7.如权利要求2所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述a.3细化操作,包括步骤: a.3.1将二值化图像中的黑色像素的值赋为1,白色像素的值赋为O ;a.3.2将像素值为I的黑色像素值全部重新赋值为2,且在2*2的窗口内与相邻非零像素一起构成三角形状的非零像素的值赋为3 ; a.3.3采用3*3窗口,将该窗口在图像上扫描,把其中含有2到4个相邻的连续黑色像素的非零像素的值赋为4 ; a.3.4删除像素值为4的点;a.3.5按行扫描图像,在不干扰像素连续性的情况下,删除像素值为2和像素值为3的占.a.3.6将图像中剩余的像素重新赋值为1,继续按照步骤a.3.2至a.3.5所示操作一遍,得到细化图像; a.3.7再按b至e操作图像中的像素。
8.如权利要求3所述的基于特征匹配的国际音标字体识别方法,其特征在于,所述b.3进行细化结果图片处理,包括步骤: b.3.1对由步骤a得到的细化图像先进行行操作然后进行列操作,得到的结果像素矩阵为Al ; b.3.2对由步骤a得到的细化图像先进行列操作然后进行行操作,得到的结果像素矩阵为A2 ; b.3.3采用特征匹配算法公式:
【文档编号】G06K9/62GK103632163SQ201310574560
【公开日】2014年3月12日 申请日期:2013年11月15日 优先权日:2013年11月15日
【发明者】黄继风, 陈洁, 邱立松, 潘晓声 申请人:上海师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1