专利名称:一种车票自动检票方法
技术领域:
本发明属于一种车票自动检票方法。
背景技术:
目前的车票检票手段主要基于人工识别等手段,其缺点是依赖于人的经验和专业技能的培训,其识别手段和技巧很难被普通人掌握,并且增加了检票工作人员的重复工作量,在大量重复工作下容易出现各种疏忽和纰漏,而且随着现代技术的进步,使的假票在外观和各个特征上与真票相差无几,仅仅依赖人的经验,很难甄别出假票。随着模式识别,图像处理,数据库技术的蓬勃发展,现代技术手段给我们在车票检票领域开辟了新的研究方向和方法。
发明内容
本发明的目的在于设计出一种车票自动检票方法,主要使用图像处理,模式识别等手段实现车票信息的自动识别,车票的自动检票。该方法可以实现对车票上三种主要文本信息的识别,通过识别结果实现车票的自动检票。该方法具有信息识别准确,识别速度快等特点,实现了机器自动检票功能。本发明解决上述问题的技术方案是使用图像处理,模式识别,数据库等技术将车票文本信息的主要内容字符(非汉字字符)串、条码、汉字等加以识别,通过识别出的信息完成对车票的检票。上述车票检票方法包括以下步骤1.本方法将一张车票图像的文本信息主要分为三类字符串,条码,汉字信息,先通过预处理手段分割出车票上的这三种信息;在对各信息识别过程中,这三种信息之间是可以相互验证的,可以对应判断每种信息的识别是否准确。2.字符串信息主要包括车次、时间以及条码的译码字符串等,其中字符串多为粘连断裂字符串。本识别方法采用垂直差分投影算法,基于识别的分割,利用先验知识等方法完成粘连断裂字符串的分割,并在分割的基础上采用BP神经网络进行识别。3.车票条码的特点是比较模糊,本方法采用一种新的基于先验知识的条码二值化算法;对1 码的标准译码算法进行改进并联合使用相关译码算法进行译码。4.综合利用字符的识别结果,数据库技术,图像匹配技术实现车票的汉字信息的识别。本发明的优点是通过图像处理,模式识别的手段可以准确的识别出车票信息,而通过识别出的车票信息可以实现电脑或机器的自动检票,省去了大量的人力劳动,避免了不必要的人为错误疏忽;并可以自动对车票验票,能有效的打击制假售假票的行为。本发明方法能有效的实现车票文本信息的识别,识别率较高,识别速度快;可以快速的得到车票的各种文本信息,快速实现车票的检票。
图1为整个识别方法的流程图。图2为基于先验知识的条码二值化算法流程图。
具体实施例方式本方法将其文本信息主要分为三类字符串,条码,汉字信息,先通过预处理手段分割出车票上的这三种信息,进而对分割结果进行相应的处理和识别。在识别过程中,这三种信息之间是可以相互验证的,可以对应判断每种信息的识别是否准确。车票是一个二维图像,具有X和y两个方向,对于扫描进来的图像先通过倾斜校正,去噪,灰度处理等手段得到校正后的灰度图,首先将校正的灰度图沿y轴方向投影,投影图的最小值点位可能得分割点,然后结合车票各行文本高度所占比例的先验知识实现车票文本信息的分割。对分割出的三类文本信息,采用图1所示的算法流程图,分别进行处理和识别。对于印刷体粘连断裂字符串首先要对其分割,本方法采用基于识别和先验知识的分割;首先是字符串的预处理,分割前的预处理主要包括锐化,二值化,去噪等。预处理中重要的一个环节是二值化。本方法采用局部二值化方法Niblack算法,其性能表现好而且稳定,不像使用全局二值化算法会进一步扩大相邻字符的粘连程度,不利于分割。对于得到的二值化图使用垂直差分投影分析,投影值为极小的点为可能的切分点,对于粘连字符串的分割要首先确定一个准确的分割点(也就是第一个分割点),然后以此分割点为基础利用先验知识(平均宽度avl和字符数η等)分割余下的字符,本方法采用结合识别的方法,对第一个字符进行分割识别,用识别可信度最高的结果作为第一个字符,并得到第一个分割点。在第一个分割点的基础上,利用平均宽度avl和字符数η对余下的字符串进行预分割得,在预分割的基础上进行精确分割,主要为调整分割点。若分割点间距离大于1. 5倍avl, 则在分割点间再插入相应的分割点得到最终分割图。对于分割结果取字符的小波变换系数和结构特征组成特征向量,作为BP网络的输入训练神经网络,最后使用训练的神经网络进行识别。由于车票条码的扫描图像比较模糊,所以对于条码信息首先采用本方法提出的基于先验知识的条码二值化算法得到二值化图像对于一种具有特定编码形式的条码,其条码的条数是事先知道的。假设一个一维条码图像A含有b个条码,一般而言图像上的条是黑色的(深颜色),而条之间的空是白色的(浅颜色)。试想如果将某一行的各列像素的灰度值进行排序(从大到小),并且图像上的每个条码都是由单像素列构成的,那么排序结果的最后b个像素值就代表了原图中的b个条码,记下这b个条码在原图中所在的位置,进而就可以直接将这些位置上的像素置0,而将其他位置的像素值置1,就可以得到二值化图像。进一步推广,条码图像里的各个条码不一定都是单列像素的,这时排序的结果就不能够确定从排序结果的最后一个开始应该有多少个可以代表原图中的所有条码,因此本方法采用如下算法以适应一般情况(算法流程见图2)。对于一个图像A(只含有条码区域的图像),假设其分辨率为mXn,条码数为num ①图像锐化后将其每一列像素的灰度值累加求平均,得到m个平均值,结果放在数组array 1[]中。②将上述m个值从大到小进行排序,结果放在数组array2[]中,并记下数组
5array2[]中的各元素原先在数组arrayl []中的位置,也就是其在原图像中所对应的列。③将排序后的值从最小的开始依次取出赋给变量thre。④将thre与数组arrayl []中的各元素做比较,如果thre大,则将数组arrayl [] 中相应元素对应在原图中的列中的各像素变为黑点,否则变为白点,得到二值图像B。⑤计算二值图B的条码个数barnum,判断是否等于num,并继续③的循环。循环完后如果都不等于num,则再对原图锐化后,重复① ⑤步骤,直到有等于num ;如果有等于 num的则取对应的thre中最大的,重复④步骤。⑥将二值图像B作为结果。在得到条码二值化的基础上使用改进的1 码译码算法,对标准1 码译码算法得到的结果和1 码的编码结果使用最小二乘法,将差值平方和最小的一组作为译码结
果ο因为条码的译码字符串和条码存在对应关系,本方法在例2的基础上,利用两部分的相互印证来提高识别率,采用相关译码算法①将译码结果与对应的数字识别结果分为一组,并判断是否相等;将22组条码按照其二值化结果分割出22组灰度图,并归一化。②对于不相等的组,取数字识别结果ab,假设第一个数字a正确,取出以a开头的十组数字,分别生成标准的条码动态图像与步骤①中的对应灰度图匹配,判断误差是否小于一个给定的阈值,如果小于的话则用该组数字作为译码结果,否则则假设第二个数字b 正确,取出以b结尾的十组数字,重复步骤②③如果步骤②没有结果,则很有可能该组识别出的数字均为错误结果,则以基于条码译码得到的两位数字做结果重复步骤②。对于汉字信息利用前面字符识别结果和数据库技术通过图像匹配来简化汉字识别过程,首先建立车次信息的数据库(包含每一车次的沿途站点信息),利用字符识别结果检索数据库提取该车次的沿途站点名,将动态位图生成的站点名与分割出的归一化的站点名图像匹配,实现站点名的识别,正确率可以达到100%。该种该法经过试验验证可以快速获得车票的主要信息,并可以实现车票的自动检票,并对车票的真伪给与甄别。
权利要求
1.一种车票的自动检票方法,包括以下步骤将车票图像通过预处理,分割得到三种主要文本信息(字符串,条码,汉字),在对其利用基于图像处理,模式识别的手段实现文本内容识别,在识别的基础上可以实现车票的自动检票。上述车票的自动检票方法主要包括以下步骤;①对于一张车票图像,本方法将其文本信息主要分为三类字符串,条码,汉字信息,先通过预处理手段分割出车票上的这三种信息,分割方法是车票是一个二维图像,具有X和 y两个方向,对于扫描进来的图像先通过倾斜校正,去噪,灰度处理等手段得到灰度图,首先将校正的灰度图沿y轴方向投影,投影图的最小值点位可能得分割点,然后结合车票各行文本高度所占比例的先验知识实现车票文本信息的分割;在步骤②的识别过程中,这三种信息之间是可以相互验证的,可以判断每种信息的识别是否准确。②将分割出的各种文本信息采用图1所示的流程进行识别a.对于印刷体粘连断裂字符串首先要对其分割,本方法采用基于识别和先验知识的分割;首先是字符串的预处理,分割前的预处理主要包括锐化,二值化,去噪等。预处理中重要的一个环节是二值化。本方法中如果采用局部二值化方法Niblack算法,其性能表现好而且稳定,不像使用全局二值化算法会进一步扩大相邻字符的粘连程度,不利于分割。对于得到的二值化图使用垂直差分投影分析,投影值为极小的点为可能的切分点,对于粘连字符串的分割要首先确定一个准确的分割点(也就是第一个分割点),然后以此分割点为基础利用先验知识(平均宽度avl和字符数η等)分割余下的字符,本方法采用结合识别的方法,对第一个字符进行分割识别,用识别可信度最高的结果作为第一个字符,并得到第一个分割点。在第一个分割点的基础上,利用平均宽度avl和字符数η对余下的字符串进行预分割得,在预分割的基础上进行精确分割,主要为调整分割点。若分割点间距离大于1. 5倍 avl,则在分割点间再插入相应的分割点得到最终分割图。对于分割结果取字符的小波变换系数和结构特征组成特征向量,作为BP网络的输入训练神经网络,最后使用训练的神经网络进行识别。b.对于车票条码图像,首先采用本方法提出的基于先验知识的条码二值化算法将其二值化(详见说明书),在二值化的基础上对1 码的标准译码算法进行改进并联合使用相关译码算法进行译码(详见说明书),其中相关译码算法是将字符串识别结果和条码识别结合在一起考虑,相互验证,提高文本信息的识别准确率。c.对于汉字信息,综合利用前面的字符串识别结果,数据库技术,图像匹配技术实现车票的汉字信息的识别。首先建立车次信息的数据库(包含每一车次的沿途站点信息),利用字符识别结果检索数据库提取该车次的沿途站点名,将动态位图生成的站点名与分割出的归一化的站点名图像匹配,实现站点名的识别。本方法在提出给模块识别方法的同时,更多的关注于各信息之间的对应和验证关系, 从而提高识别的准确率。③根据识别出的信息可以实现车票信息的检验,对一张特定的车票,根据识别结果判断旅客是否搭乘当日当次车,是否在对应车站上下车等。
2.一种车票的自动检票方法,其特征在于所述步骤①为对于一张车票图像,本方法将其文本信息主要分为三类字符串,条码,汉字信息,先通过预处理手段分割出车票上的这三种信息,分割方法是车票是一个二维图像,具有χ和y两个方向,对于扫描进来的图像先通过倾斜校正和灰度处理得到灰度图,首先将校正的灰度图沿y轴方向投影,投影图的最小值点位可能得分割点,然后结合车票各行文本高度所占比例的先验知识实现车票文本信息的分割;在步骤②的识别过程中,这三种信息之间是可以相互验证的,可以判断每一种信息的识别是否准确。
3.根据权利2所述的一种车票的自动检票方法,其特征在于还包括步骤②将分割出的各种文本信息采用图1所示的流程进行识别具体为步骤②的a,b,c三步。本方法在提出给模块识别方法的同时,更多的关注于各信息之间的对应和验证关系,从而提高识别的准确率。
4.根据权利2所述的一种车票的自动检票方法,其特征在于所述步骤③为根据识别出的信息可以实现车票信息的检验,对一张特定的车票,根据识别结果判断旅客是否搭乘当日当次车,是否在对应车站上下车等。
全文摘要
本发明公布了一种火车票自动检票方法。包括以下步骤将车票图像通过预处理,分割得到三种主要文本信息(字符串,条码,汉字),再对其利用基于图像处理,模式识别的手段实现文本内容识别,在识别的基础上可以实现车票的自动检票。本发明方法能有效的实现车票文本信息的识别,识别率较高,识别速度快;可以有效的得到车票的各种文本信息,快速实现车票的检票,验票准确率高。
文档编号G06K9/62GK102194275SQ201010126530
公开日2011年9月21日 申请日期2010年3月15日 优先权日2010年3月15日
发明者党力 申请人:党力