专利名称:用于曲率校正的图像处理方法
技术领域:
本发明涉及光读取器系统和计算机系统,光读取器系统采用照相机来捕获未读表格的数字数据图像,计算机系统用于处理数字数据来校正失真和取得及解译来自数字数据的信息。在此,“照相机”包括对以下光敏介质中的场景进行捕获的任何光敏设备,该场景可以由计算机处理系统所下载或读出,该计算机处理系统在存储器中存储表示该场景的数字数据。在术语“照相机”中可以包括透镜、滤光器、光圈等,和用于保持(hold)场景图像的光敏面、或一个或多个光敏阵列。
背景技术:
印制文档、投注单(play slip)、刮开型彩票(lottery scratch ticket)、即时型彩票(lottery instant ticket)等在此被集体定义为“表格”。通常,表格在表示人的特定意图的位置处具有人为的标记。正确对表格进行识别以及正确地对印制的和人为的标记进行读取或处理并不是简单的任务。这些任务中的一些包括检测表格的存在;确定表格是静止的或不运动的 (motion-less);识别表格上的标记的存在;定位表格上的标记;然后解译标记的意义。对于每一项任务,必须有足够的光来以相对于背景足够的反差来照射表格,从而检测和识别这些标记。为了识别表格,可以对印制标志进行检测和解译,或者人可以指出表格类型。印制标志通常会包括用于识别表格类型的标识(logo)或其他特殊标记。另外,可以印制对准标记,并由处理系统来使用对准标记以精确地识别表格上的位置。然后,可以精确地定位表格上的标志并解译它们的意义。对表格上的图像的处理及识别始于对表格的图像进行捕获的照相机。可以由计算系统下载、存储和分析所捕获的图像。分析图像可以由“应用程序”来实现,该应用程序可以是在计算机系统中运行的软件、嵌入在硬件框架(framework)中的固件、硬件状态机或是它们的组合。读取表格时的一个重要而普遍的问题出现在表格被弯曲(bend)、折皱 (crumple)、卷曲(roll)或折叠(fold)时,由此产生了失真。在读取表格或拒绝表格时失真是引起误差的主要原因。失真至少表示定位误差及解析误差。一些现有技术的读取器具有将表格变平并将其安置在封闭室内的驱动机构。这样的驱动机构是昂贵的,而且需要例行服务和技术支持来维护它们,所有这些都导致在拥有时的额外成本和费用。现有技术在补偿失真方面的尝试是无效的,而对这样的失真进行校正、减少和/ 或补偿并且方便、可靠、相对便宜、容易使用的读取器会有益于产业。
发明内容
本发明涉及如下光读取器该光读取器能够读取各式各样的表格,更具体地,该光读取器能够通过使用用于失真校正的系统和方法来读取被弯曲、卷曲、折皱或折叠的表格。 根据本发明的至少一个实施例,具有已知表格类型一诸如印制文档、投注单、刮开型彩票、即时型彩票一的模型图像被存储在计算机系统上。连同模型图像一起,信息也被存储在计算机系统上,该信息包括已知的标识或其他表格识别标记以及将每一个模型图像分成由至少三个不共线的对准标记所限定的区域或区段的对准标记。对准标记、标识、其他这样的识别标记的位置、属性(参见以下)和相对应的意义、以及可能的手绘标记的位置和它们的意义也都随着每一个模型图像而被存储。坐标系——诸如笛卡尔坐标系、极坐标系等——描述了模板图像上的位置以及未读表格的任何捕获图像上的位置。例如,在笛卡尔坐标系中,X和y可以限定模型图像上的位置,而χ'和y'可以用于表格的未读图像上的位置。可以将传递函数应用于未读图像的区段之内的任何标记的所见到的(apparent) 位置来产生校正位置。然后,可以将所见到的位置与模型图像上的相对应的位置进行比较, 而该相对应的位置可以确定标记的意义。可以以相似的方式对其中具有标记的所有区段进行处理。“传递函数”是在此所使用的短语,其也可以被其他人称为“转换函数”,或“方程”, 或“校正函数”,或“因子”,或者其他这样的术语或可以在本领域找到的术语的组合。属性可以指的是形状、尺寸、标记的重心等。标记的位置和属性可以限定对准标记或标识。表格的类型可以由标识或一些其他的一个或多个印制标记来确定,或者可以由代理人手工确认。例如,在表格上的特定位置处的铅笔标记可以表示通过人(诸如在玩游戏时)填写表格所做出的选择。计算机系统可以容易地检测和辨识未读图像上的对准标记。在特定位置找到的标记具有使其适于被检测为对准标记的属性(大、圆形、正方形、长方形、长线形(long linear)或任何形状)。在对其进行检测和识别的难易性(ease)方面,标识是类似于对准标记的标记,并且,如上所述,标识可以用于识别表格类型。将表格分成区段允许了通过确定区段的尺寸来校正曲率失真。更小的区段可以相对平坦,其中,这样的区段中的曲率在读取该区段中的标记时不明显导致误差。如果区段是由三个不共线的点来限定的,则以下方程可以表示对该区段内的标记的缩放、平移和旋转进行校正的传递函数χ' =A' x+B' y+C'式 1,及f = D' x+E' y+F'式 2。一旦为表格的特定捕获图像取得6个系数(A'、B'、C'、D'、E'和F'),那么式1和式2可以用于将模型图像中的任何位置(x,y)平移到表格的未读图像中的相对应的坐标(χ',y')。
如果区段由限定了四边形区段区域的四个不共线的点限定,则以下方程可以表示对缩放、平移和旋转进行校正并且对与捕获表格的未读区段的照相机相关联的透视问题 (perspective issues)进行校正的传递函数
权利要求
1.一种用于读取未读表格上的信息的方法,所述方法包括以下步骤在计算机系统中存储所述未读表格的模型的图像,所述模型图像包括对准标记; 在所述计算机系统中存储所述未读表格的图像,所述未读图像包括与所述模型图像上的对准标记相对应的对准标记;将所述模型图像分成一组区段,其中,每一个区段由至少三个对准标记的位置所限定;通过将所述模型图像上的对准标记与所述未读图像上的相对应的对准标记进行比较, 检测与所述模型图像上的区段相对应的所述未读图像上的区段;根据所述模型图像和所述未读图像的相对应的对准标记的位置,针对所述未读图像的每一个区段生成传递函数;及将每一个区段的传递函数应用于所述未读图像的相对应的区段上的标记的位置来生成所述标记的校正位置,由此实现对所述未读表格的读取。
2.根据权利要求1所述的方法,还包括以下步骤针对所述未读图像的每一个区段形成坐标系,其中,针对每一个区段的传递函数对所述未读图像中的失真进行补偿,及参考在所述模型图像的每一个区段之内的相对应的位置,确定所述标记在所述未读图像的每一个区段之内的校正位置的意义。
3.根据权利要求2所述的方法,其中,由三个对准标记的位置限定所述区段,并且所述方法还包括以下步骤将三点传递函数方程应用于由三个对准标记所限定的每一个区段。
4.根据权利要求3所述的方法,还包括以下步骤针对所述模型图像中的标记的位置构建χ,y坐标系,并且针对所述未读图像中的标记构建X',y'坐标系,其中,所述三标记传递函数是X' =A' x+B' y+C'和y'= D' x+E' y = F'。
5.根据权利要求2所述的方法,其中,由四个对准标记的位置限定所述区段,并且所述方法还包括以下步骤将四点传递函数方程应用于由四个对准标记所限定的每一个区段。
6.根据权利要求5所述的方法,还包括以下步骤针对所述模型表格图像中的标记的位置构建χ,y坐标系,并且针对所述未读表格图像中的标记构建χ' ,ι'坐标系,其中,所述四标记传递函数是
7.根据权利要求2所述的方法,还包括以下步骤将多标记传递函数应用于所述未读表格图像的、由八个对准标记所限定的每一个区段,其中,所述传递函数是
8.根据权利要求1所述的方法,还包括以下步骤生成所述未读图像上的特定标记的校正位置,其中,所述模型图像上的特定标记的位置是已知的;计算所述未读图像上的特定标记的校正位置与所述模型图像上的特定标记的相对应的已知位置的差; 建立误差阈值;及将所述差与所述阈值进行比较,并且如果所述差超过所述阈值,则拒绝所述表格。
9.一种用于处理和校正已知表格上的标记的系统,所述系统包括 照明设备,所述照明设备照射对某些光进行反射的表格;照相机,所述照相机被设置成从所述表格接收所反射的光;照相机电子设备,所述照相机电子设备提取和存储所述表格的所述未读图像,所述未读图像具有在各位置处的对准标记;所述表格的模型图像,所述模型图像具有对准标记; 区段,所述区段由所述对准标记的位置所限定;针对每一个区段的传递函数,所述传递函数是根据所存储的未读图像及模型图像的相对应的对准标记的位置的;及生成校正位置的应用程序,所述生成校正位置的应用程序通过将所述传递函数应用到所存储的未读图像的每一个区段之内的标记,生成所存储的未读图像的每一个区段之内的标记的校正位置。
10.根据权利要求9所述的系统,还包括所存储的未读图像及所述模型图像上的位置的坐标系;及确定标记意义的应用程序,所述确定标记意义的应用程序通过参考所述模型图像上的相对应的位置来确定具有校正位置的标记的意义。
11.根据权利要求10所述的系统,还包括所存储的未读图像上的、具有校正位置的特定标记,以及所述模型图像上的、相对应的特定标记,其中,所述模型图像上的特定标记的位置是已知的;计算器,所述计算器用于计算所述未读图像上的特定标记的校正位置与所述模型图像上的特定标记的相对应的已知位置的差; 误差阈值;及比较器,所述比较器用于将所述差与所述误差阈值进行比较,并且如果所述差超过所述阈值,则拒绝所述表格。
12.一种包括用于确定已知类型表格上的标记的位置的可执行程序指令的计算机可读介质,所述可执行程序包括一个或多个程序指令,所述程序指令用于在计算机系统中存储所述未读表格的模型的图像,所述模型图像包括对准标记; 在所述计算机系统中存储所述未读表格的图像,所述未读图像包括与所述模型图像上的对准标记相对应的对准标记;将所述模型图像分成一组区段,其中,每一个区段由至少三个对准标记的位置所限定;通过将所述模型图像上的对准标记与所述未读图像上的相对应的对准标记进行比较, 检测与所述模型图像上的区段相对应的所述未读图像上的区段;根据所述模型图像和所述未读图像的相对应的对准标记的位置,针对所述未读图像的每一个区段生成传递函数;及将每一个区段的传递函数应用于所述未读图像的相对应的区段上的标记的位置来生成所述标记的校正位置,由此实现对所述未读表格的读取。
13.根据权利要求12所述的计算机可读介质,还包括如下程序指令,所述程序指令用于针对每一个区段形成坐标系,其中,针对每一个区段的传递函数对失真进行补偿; 参考所述模型图像的每一个区段之内的标记的相对应的位置,确定所述未读图像的每一个区段之内的标记的校正位置的意义;及将三标记传递函数应用于由三个对准标记所限定的每一个区段。
14.根据权利要求13所述的计算机可读介质,其中,所述三标记传递函数是X'= A' x+B' y+C'和 y' =D' x+E' y = F'。
15.根据权利要求12所述的计算机可读介质,还包括如下程序指令,所述程序指令用于针对每一个区段形成坐标系,其中,针对每一个区段的传递函数对失真进行补偿; 参考所述模型图像的每一个区段之内的标记的相对应的位置来确定所述未读图像的每一个区段之内的标记的校正位置的意义;及将三标记传递函数应用于由四个对准标记所限定的每一个区段。
16.根据权利要求15所述的计算机可读介质,其中,所述四标记标记传递函数是
17.根据权利要求12所述的计算机可读介质,还包括如下程序指令,所述程序指令用于针对每一个区段形成坐标系,其中,针对每一个区段的传递函数对失真进行补偿; 参考所述模型图像的每一个区段之内的标记的相对应的位置,确定所述未读图像的每一个区段之内的标记的校正位置的意义;及将多标记传递函数应用于由八个对准标记所限定的每一个区段,其中,所述传递函数是
18.根据权利要求12所述的计算机可读介质,还包括如下程序指令,所述程序指令用于参考所述模型图像的每一个区段之内的标记的相对应的位置,确定所述未读图像的每一个区段之内的标记的校正位置的意义。
19.根据权利要求1所述的方法,其中,所述未读表格选自印制文档、投注单、彩票刮刮乐和彩票即时票。
20.根据权利要求9所述的系统,其中,所述已知的表格选自印制文档、投注单、刮开型彩票和即时型彩票。
全文摘要
公开了用于使用曲率失真校正方案来读取表格的系统和方法。已知表格的模型图像被分成由至少三个对准标记所限定的区段,并且通过将捕获的表格的未读图像上的对准标记的位置与模型图像上的对准标记的位置进行比较,生成了针对每一个区段的传递函数或校正函数。然后,将传递函数应用于该区段内的其他标记来计算这些标记的校正位置。确定每一个区段的尺寸来合理地确保曲率失真被处理,以便适当地找到和解译表格上的所有标记。可以对误差进行检查,而且,如果继续存在误差,则在可行的情况下可以限定并采用更小的区段。
文档编号G06T5/00GK102265303SQ200980152937
公开日2011年11月30日 申请日期2009年11月24日 优先权日2008年11月26日
发明者卡洛斯·塞尔万特斯·托拉尔, 弗兰克·J·梅塔耶, 邓肯·D·薛 申请人:集特科公司