一种卡信息获取方法和系统的制作方法

文档序号:6487921阅读:123来源:国知局
一种卡信息获取方法和系统的制作方法
【专利摘要】本方案涉及一种卡信息获取系统和方法。该系统包括图像获取模块(201)获取卡图像;数据库(205)预存至少包含卡的类型、图像特征、文字排版信息的卡信息;图像分析和识别模块(203)从获取的卡图像中提取图像特征并与数据库(205)预存的卡信息的图像特征比较,确定卡的类型;字符识别模块(207)根据确定的卡的类型,从数据库(205)中提取与该类型对应的包含文字排版信息的卡信息,定位字符区域和分割字符,对获取的卡图像上的字符进行识别。方法包括该系统处理过程。本方案利用卡的卡片信息,建立数据库,通过有效的图像特征辨识卡片类型,提升了卡片信息区域提取的性能和效率,方便用户利用移动终端快速自动输入卡信息。
【专利说明】一种卡信息获取方法和系统
【技术领域】
[0001]本发明涉及移动终端上获取信息的【技术领域】,尤其涉及一种移动终端上利用图像识别获取卡片信息的方法和系统。
【背景技术】
[0002]随着移动终端的迅猛发展,在移动终端上进行支付的需求越来越多。大多数与支付相关的业务都需要用户输入其卡的信息,如信用卡/银行卡的卡号等信息。通常获取这些信息做法有两种:一种是手工输入,这样做往往容易输入错误,繁复的操作对用户会造成困扰。另一种是基于传统的OCR(光学字符识别)的方式,通过摄像头拍摄卡片,然后定位感兴趣区域(如账号信息部分),然后进行字符的分割和识别。
[0003]在移动终端上输入卡(例如银行卡:信用卡、借记卡等,或代金的购物卡,等等)的卡号信息是件非常不方便的事情。例如:基于传统OCR的文字录入方式,如图1所示,现有技术中提出的利用手机自动录入文字、图像及其处理的方法。手机包括摄像头和与手机中央处理器连接的摄像信号输出端;在总控制模块110的控制下,摄像头驱动模块101将名片上的文字、图像等拍摄成像后,由版面处理与增强模块102、智能版面分析模块103、字符识别模块104、后处理模块105顺序工作,对摄像信号进行预处理和增强处理,分割出文字区域和图像区域,对文字区域的字符进行识别和分类,把分类结果和图形压缩结果存储于数据库模块106 ;手机的数据交换模块107通过本地网或远程网连接实现与电脑之间或与其他移动终端之间的数据交换,显示驱动模块108驱动显示,关联应用模块109对选中的名片信息,进行关联应用。其中,与移动终端中央处理器连接的摄像信号输出端由于没有利用对自动录入非常有帮助的卡片类型等先验信息,其方法很容易受到形形色色的不同种类、样式等的卡片背景、纹理、凹凸图案等的影响(尤其是各类不同的卡),容易造成文字内容提取和识别的失败,而且需要做全图扫描识别所有的文字区域,运行的效率也较低。

【发明内容】

[0004]针对上述现有技术的缺陷,本发明要解决的技术问题是提供一种移动终端上的卡片信息获取方法和系统,其基于图像识别技术,有效地快速获取各类卡片(卡)信息,基于数据库的卡片类型先验信息利用对获取的图像进行图像识别和分析、字符识别等技术,快速进行卡片账号区域定位和账户文字等信息识别,从而有效提高在复杂图案背景下文字区域定位的效率和成功率,并且,将识别结果自动填入账户输入框,完成账号信息自动输入,使得在移动终端上能够自动便捷地获取卡片信息。
[0005]本发明提供的一种移动终端上的卡片信息获取系统,包括:图像获取模块,用于获取卡图像;数据库,用于存储至少包含卡的类型、图像特征、文字排版信息的卡信息;图像分析和识别模块,用于从图像获取模块所获取的卡图像中提取图像特征,并将所提取的图像特征与数据库所预存的所述卡信息的图像特征进行比较,以确定卡的类型;字符识别模块,用于根据确定的卡的类型,从数据库(205)中提取与所述类型对应的包含文字排版信息的卡信息,以定位字符区域和分割字符,从而对所获取的卡图像上的字符进行识别。
[0006]对应本方案的系统的一种移动终端上的卡片信息获取方法,包括:构建数据库步骤,构建用于预存至少包含卡的类型、图像特征、文字排版信息的卡信息的数据库;获取步骤,获取卡图像;特征提取步骤,从所获取的卡图像中提取图像特征;比较步骤,将提取的图像特征与数据库中预存的所述卡信息的图像特征比较,以确定卡的类型;字符识别步骤,根据确定的卡的类型,从数据库中提取与所述类型对应的包含文字排版信息的卡信息,以定位字符区域和分割字符,以对所获取的卡图像上的字符进行识别。
[0007]在本发明中,通过图像识别方式事先构建卡片的图像特征库,简化文字区域检测和识别难度,解决了文字区域定位的难题,实现有效便捷地在移动终端上进行卡片(卡)信息获取,提升了效率。本发明的方法和系统充分利用卡的卡片信息,建立数据库,通过有效的图像特征辨识卡片类型,进而提升了卡片信息区域提取的性能和效率,为用户利用移动终端进行快速自动的卡信息输入提供方便。
【专利附图】

【附图说明】
[0008]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0009]图1为现有基于OCR的卡片信息获取技术。
[0010]图2为本发明【具体实施方式】的结构框图。
[0011]图3为本发明【具体实施方式】的流程图。
【具体实施方式】
[0012]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0013]本发明【具体实施方式】是基于图像识别技术的快速获取卡信息的方法:通过移动终端设备所带的摄像头拍摄要获取卡信息的卡,首先通过图像识别技术判断出卡片类型,然后基于数据库中该类型卡片的信息对其进行版面分析,从而快速进行卡片中账号区域的定位。该方法可以有效提高在复杂图案背景下文字区域定位的效率和成功率;在成功定位支付账户文字区域的基础上结合图像分析和字符识别技术,进行账户文字等信息的识别;最后,将识别的结果自动填入应用程序中需要填账户信息的输入框中,以实现自动账号信息输入。
[0014]本发明的在移动终端上获取卡片信息的系统结构框图如图2所示。该系统包括移动终端上的图像获模块201、图像分析和识别模块203、数据库205、字符识别模块207以及数据交换模块209,等。
[0015]图像获取模块201:包括在移动设备(终端)或其他移动平台如手机、PDA、平板电脑、及其他类似的手持设备等上设置的图像采集装置如摄像头等、以及摄像驱动模块211。图像获取模块201用于由该摄像驱动模块211驱动摄像头拍摄要使用的卡片如含有账号信息的卡(银行卡、信用卡等)卡片,获得相关的图像数据/图像信息。
[0016]构建的数据库205:存储卡片信息(如卡信息等数据:至少包括卡类型、文字排版信息、图像特征等),其还包括两个方面,第一,卡片图像特征库213,预存卡信息中与卡的类型对应的图像特征,以便区分不同卡的类型,其用于区分不同卡片的类型,其中,图像特征包括但不限于颜色、纹理、局部二元特征LBP、盖博Gabor滤波器对图像过滤后提取的特征直方图等等;第二,卡片版式库215,预存卡信息中与卡的类型对应的文字排版信息,用于区分与卡的类型对应的版式,其用于记录包括但不限于对应卡片的文字排版信息,如卡账号文字区域所在的位置、字体、账号字符排布方式等。
[0017]图像分析和识别模块203:用于对图像获取模块201获取的图像进行图像特征提取,并将提取的图像特征与数据库205中建立的卡片图像特征库213中的图像特征进行对t匕,通过特征相似性比较,得到图像获取模块201采集获取的卡片图像在数据库205中的最佳匹配结果,以确定该卡片的类型。
[0018]字符识别模块207,包含卡片版面分析与文字区域定位模块217、文字识别模块219。
[0019]卡片版面分析与文字区域定位模块217,通过图像分析和识别模块203处理获取得到的卡片类型,进一步从数据库205中提取该类型的卡片在卡片版式数据库215中的信息,这些信息包括该类型的卡片文字区域所在的位置、字体、字符、字符排布方式等。利用这些信息作为模板,在图像获取模块201获取的图像上对卡片(卡)的卡号文字区域进行定位和字符分割。
[0020]文字识别模块219,利用卡片版面分析与文字定位模块217获取到的卡片字符字体信息,采用相应字体的文字识别引擎(此处的文字识别引擎,对应于不同字体的文字识别方法,如:利用对应的模板进行模板匹配、利用对应的统计学方法训练出来的识别方法等),对文字区域的字符进行识别,将识别的结果进行整理,得到一个账号信息相对应的字符串,用于下一步的账号信息自动录入。
[0021]数据交换模块209,响应移动终端上要求输入卡片账号或其他卡片信息的各种应用程序;或者通过有线/无线等网络与其他移动终端或其他电子处理设备、服务器、基站等连接,响应要求输入卡片账号或其他卡片信息的各种应用程序,完成数据交换如账号数据的输入以响应这些应用程序。比如,其包括卡片账号等信息的自动录入模块221,该自动录入模块221将从文字识别模块219得到的字符串,通过消息传送机制,传给需要调用卡信息的应用程序(模块)中,最终得到自动信息录入和后续处理。
[0022]下面将根据图3,对移动终端上的卡片信息获取的方法流程,进行描述。在该方法的步骤中,不再对系统结构中的各个模块(装置)的功能重复描述。
[0023]步骤301 (构建数据库步骤),构建卡片信息数据库205,如卡信息的数据库(I)卡片图像特征库213和(2)卡片版式库215。卡片图像特征库区分不同卡片类型,其中,图像特征包括但不限于颜色、纹理、局部二元特征LBP、盖博Gabor滤波器对图像过滤后提取的特征直方图等等。卡片版式库记录对应卡片文字排版信息,比如对于卡,则关心支付账号文字区域所在位置、字体、账号字符内容、账号字符排布方式等等。由此,设置了对自动录入非常有帮助的卡片先验信息(至少包含类型、排版、图像特征等等),由特征比对得到类型能快速准确查找到对应的卡片账号区域,从而避免了各类卡片背景(图像或文字)等干扰而导致文字内容提取和识别经常出现失败或错误的情形。进一步的,该数据库构建,还可以包含智能的识别和更新,如未预先将卡片信息设置在数据库中的新的卡片,可以将其图像特征和版式特征在不能匹配到已经存储的卡片时,将新的卡片的两类信息分别加入到数据库中,更新数据库(数据库是可扩展更新的)。图像获取步骤302 (采集步骤),通过图像获取模块201中的驱动模块211驱动移动终端上的图像采集装置如摄像头等,拍摄含有账号信息的卡片(卡),得到相关的图像数据。
[0024]步骤303 (特征提取步骤和比较步骤),通过图像分析和识别模块203,对图像获取步骤302中获取的图像进行图像特征的提取,并且将提取的图像特征与步骤301中建立的卡片图像特征库213中的图像特征进行比对,利用特征相似性比较得到在步骤302中获取得卡片的图像在数据库205中的最佳匹配结果(特征库213中的对结果),从而确定该卡片是什么类型。即利用卡片类型这类先验信息,能防止识出错(即其简化了文字区域定位难度,可以大大提高后续文字识别的正确率)。
[0025]步骤305 (字符识别步骤),利用卡片的版面分析与文字区域定位模块217进行处理,通过步骤303获得的卡片类型信息,从数据库205中提取与该类型卡片对应的、该卡片在卡片版式库215中的信息,这些信息包括类此类型卡片文字区域所在位置、字体、字符排布方式等等,用这些信息作为模板数据,在图像获取步骤302获取的图像上,对卡片(卡)的卡号文字区域进行定位和字符分割。(即,确定了卡片类型这些先验信息,使得在版面分析和定位区域时,不需要全图扫描识别所有的文字区域,快速定位,提高识别效率和识别准确度)。
[0026]步骤305 (字符识别步骤),利用文字识别模块219获取的卡片字符字体信息,采用相应字体的文字识别引擎,对文字区域的字符进行识别,将识别的结果进行整理,得到一个字符串信息,如与卡的账号信息相对应的字符串,用于下一步的账号信息自动录入(输入)。
[0027]步骤306 (响应步骤),利用卡片账号等信息的自动录入模块211,将步骤305中得到的字符串,通过消息传送机制等方式,传输给需要调用卡片信息(如卡账号信息)的应用模块中,如本地或远程的应用模块(应用程序)运行弹出账号输入框等,最终得到自动信息录入和后续处理的实现。
[0028]由图2的系统和图3的方法可见,通过移动终端快速获取卡信息,主要利用了建立数据库的方法,如图像特征库与卡的卡片版式库的组合,从而根据建立的数据库中的信息,在复杂的卡的卡片图案中进行账号文字区域的快速定位、文字区域分析和文字识别,使得用户能够利用移动终端快速进行卡信息获取。
[0029]本说明书中的各个实施例一般采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0030]本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块或单元。一般地,程序模块或单元可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。一般来说,程序模块或单元可以由软件、硬件或两者的结合来实现。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块或单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0031]最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0032]本文中应用了具体个例对本申请的原理及实施方式进行了闸述,以上实施例的说明只是用于帮助理解本申请的方法及其主要思想;同时,对于本领域的一般技术人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申 请的限制。
【权利要求】
1.一种卡信息获取的系统,其特征在于,包括: 图像获取模块(201),用于获取卡图像; 数据库(205),用于预存至少包含卡的类型、图像特征、文字排版信息的卡信息; 图像分析和识别模块(203),用于从图像获取模块(201)所获取的卡图像中提取图像特征,并将所提取的图像特征与数据库(205)所预存的所述卡信息的图像特征进行比较,以确定卡的类型; 字符识别模块(207),用于根据确定的卡的类型,从数据库(205)中提取与所述类型对应的包含文字排版信息的卡信息,以定位字符区域和分割字符,从而对所获取的卡图像上的字符进行识别。
2.如权利要求1所述的系统,其特征在于,进一步包括: 数据交换模块(209),用于响应应用程序的卡字符录入请求,自动输入识别出的字符。
3.如权利要求1或2所述的系统,其特征在于,数据库(205)还包括: 卡片图像特征库(213),预存卡信息中与卡的类型对应的图像特征,以便区分不同卡的类型; 卡片版式库(215),预存卡信息中与卡的类型对应的文字排版信息,用于区分与卡的类型对应的版式。
4.如权利要求3所述的系统,其特征在于: 卡片的图像特征包括:颜色、纹理、局部二元特征LBP、盖博Gabor滤波器对图像过滤后提取的特征直方图; 卡片的文字排版信息包括:卡的文字区域所在的位置、字体、账号字符排布方式。
5.如权利要求3所述的系统,其特征在于,图像分析和识别模块(203)还用于: 将提取的图像特征与卡片图像特征库(213)中的图像特征进行对比,通过特征相似性比较,从而得到获取的卡片图像在数据库(205)中的最佳匹配结果,以确定所述卡的类型。
6.如权利要求3所述的系统,其特征在于,字符识别模块(207)还包括: 卡片版面分析与文字区域定位模块(217),通过图像分析和识别模块(203)确定的卡的类型,从数据库(205)中提取确定的所述类型的卡在卡片版式数据库(215)中的文字排版信息,以文字排版信息作为模板,在所获取的卡图像上对卡文字区域进行定位和字符分割; 文字识别模块(219),利用获得的文字排版信息,对分割出的文字区域的字符进行识另IJ,并整理识别的结果,得到卡上需要输入的字符串。
7.如权利要求6所述的系统,其特征在于,文字识别模块(219)还包括: 利用文字排版信息中获得的字体信息对分割出的文字区域的字符进行识别,其中,字符识别采用模板匹配方式或统计学训练识别方式,所述字符串是卡的账号信息。
8.如权利要求7所述的系统,其特征在于,数据交换模块(209)还包括: 自动录入模块(221),用于响应应用程序的请求,将从文字识别模块(219)得到的字符串,通过消息传送机制,传送给请求调用卡信息的应用程序,以完成自动信息录入和后续处理。
9.一种卡信息获取方法,其特征在于,包括: 构建数据库步骤,构建用于预存至少包含卡的类型、图像特征、文字排版信息的卡信息的数据库(205); 获取步骤,获取卡图像; 特征提取步骤,从所获取的卡图像中提取图像特征; 比较步骤,将提取的图像特征与数据库(205)中预存的所述卡信息的图像特征比较,以确定卡的类型; 字符识别步骤,根据确定的卡的类型,从数据库(205)中提取与所述类型对应的包含文字排版信息的卡信息,以定位字符区域和分割字符,以对所获取的卡图像上的字符进行识别。
10.如权利要求9所述的方法,其特征在于,进一步包括: 响应步骤,响应应用程序的卡字符录入请求,自动输入识别出的所述字符。
11.如权利要求9或10所述的方法,其特征在于,构建的所述数据库(205)还包括: 卡片图像特征库(213),预存卡信息中与卡的类型对应的图像特征,以便区分不同卡的类型; 卡片版式库(215),预存卡信息中与卡对应的类型的文字排版信息,用于区分与卡的类型对应的版式。
12.如权利要求11所述的方法,其特征在于: 卡片的图像特征包括:颜色、纹理、局部二元特征LBP、盖博Gabor滤波器对图像过滤后提取的特征直方图; 卡片的文字排版信息包括:卡的文字区域所在的位置、字体、账号字符排布方式。
13.如权利要求11所述的方法,其特征在于,比对步骤还包括: 将提取的图像特征与卡片图像特征库(213)中的图像特征进行比对,利用特征相似性比较得到采集的卡的图像在数据库(205)中的最佳匹配结果,从而确定采集的卡的类型。
14.如权利要求11所述的方法,其特征在于,字符识别步骤还包括: 根据获得的卡的类型,从数据库(205)中提取确定的所述类型的卡在卡片版式数据库(215)中的文字排版信息,以文字排版信息作为模板,在所获取的卡图像上对卡文字区域进行定位和字符分割; 利用获得的文字排版信息,对分割出的文字区域的字符进行识别,并整理识别的结果,得到卡上需要输入的字符串。
15.如权利要求14所述的方法,其特征在于,字符识别步骤中对采集的卡图像上的字符进行识别还包括: 利用文字排版信息中获得的字体信息对分割出的文字区域的字符进行识别,其中,字符识别采用模板匹配方式或统计学训练识别方式,所述字符串是卡的账号信息。
16.如权利要求14所述的方法,其特征在于,响应步骤中自动输入识别的所述字符还包括: 将得到的字符串,通过消息传送机制,传送给请求调用卡信息的应用程序,以完成自动信息录入和后续处理。
【文档编号】G06K9/00GK103593642SQ201210293138
【公开日】2014年2月19日 申请日期:2012年8月16日 优先权日:2012年8月16日
【发明者】楚汝峰, 张伦, 张春晖 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1