专利名称:用于进行自动光学采集字符的方法、计算机程序产品、数据处理系统和扫描仪的制作方法
技术领域:
本发明涉及一种用于进行自动光学采集字符的方法、计算机程序产品、数据处理系统以及光学扫描仪。
背景技术:
由现有技术公知手动扫描仪,在该手动扫描仪中,借助于行扫描摄像机来扫描文件。被称作行扫描摄像机的是数码摄像机类型,这种摄相机类型不具有二维的传感器,而是只具有单个的传感器排。在这种情况下,通过文件相对于摄像机的不受控制的相对运动来采集图像数据。在使用带有行扫描摄像机的扫描仪时,特别的优点在于,行扫描摄像机的光学有效面明显小于矩阵式摄像机(Matrixkameras)或平面式摄像机的光学有效面,由此, 例如由于灰尘颗粒而产生污染的可能性较小,并且能够低成本地实现非常高的分辨率。尤其可以将行扫描摄像机实施为所谓的接触式图像传感器(CIS)。但是,在借助于逐行扫描摄影机扫描文件时,缺点是文件相对于行扫描摄像机的前移与该行扫描摄像机的采样频率不同步,因为该相对运动是手动实行的,也就是说不受控制。由此导致所采集的图像数据出现失真。为了解决该问题,例如由US 6,064, 779,US 6,608,297B2 和 US6, 619,551B2 公知 通过机械传感器(例如轮子或辊子)来采集文件相对于行扫描摄像机的相对运动。与此相反地,US 5,023,922和旧2004/0165224々1提出借助于光学传感器来采集该相对运动。然后,在机械地或光学地采集文件相对于行扫描摄像机的相对运动的基础上,进行对图像数据的矫正。此外,由US7,204,416B1公知借助于以矢量为基础的模式识别来对由行扫描摄像机所记录的图像数据进行矫正。但是,这导致非常巨大的数据处理开支。此外,由US 6,965,703B1公知一种用于对借助于行扫描摄像机所记录的图像数据进行矫正的方法,在该方法中,对所扫描的文本的各个字母或者对所扫描的文本的很短的字母顺序进行矫正。该方法也在为此所需要的数据处理开支方面具有缺点。
发明内容
与此相对地,本发明的目的在于,实现一种改进的用于借助行扫描摄像机来进行自动光学采集字符的方法、相应的计算机程序产品、数据处理系统以及扫描仪。本发明的目的分别利用独立权利要求的特征来解决。本发明的实施方式在从属权利要求中给出。根据本发明的实施方式,实现一种用于对文件进行自动光学采集字符的方法。“文件”例如可以是名片或有价证券或担保文件(例如ID文件,也就是证明文件, 例如身份证、护照、驾驶证或工作证),或支付手段(例如现金、信用卡),或其他的资格凭证 (例如门票、托运单、签证或类似物)。文件能够以纸张和/或塑料为基础地构成。文件尤
5其能够书本状地或卡片状地构成。此外,该文件还可以是芯片卡。可以单面地或双面地整面地扫描该文件。也可以只扫描该文件的一个带有待光学采集的字符的分区域。在可机读的证明文件(MachineReadable Travel Document-MRTD) 的情况中,该分区域是指所谓的可机读区域(Machine Readable hne_MRZ)。该MRZ可以与国际民航组织(ICAO)的规范相应地实施。借助于行扫描摄像机扫描文件的至少一个分区域,其中,进行文件相对于行扫描摄像机不受控制的相对运动。因此,该行扫描摄像机例如可以是静止的,以便手动地将文件引导经过行扫描摄像机上,或者该文件可以是静止的,方法是将该文件例如平放在底板上,然后引导行扫描摄像机经过文件。另外,也可以让使用者一只手拿着文件,另一只手拿着行扫描摄像机,从而在扫描时既移动文件又移动行扫描摄像机。文件相对于行扫描摄像机的相对运动是不受控制的,也就是说,该相对运动与行扫描摄像机的采样频率不同步。该不受控制的相对运动的运动侧写(Bewegimgsprofil)可以仅依赖于为了扫描该分区域,使用者如何使文件和行扫描摄像机彼此相对运动。因为在扫描过程中,文件相对于行扫描摄像机的相对运动与行扫描摄像机的采样频率不同步,所以图像数据或多或少会失真。借助于预先给定的运动侧写来矫正图像数据。 例如,针对不同的使用者来采集文件相对于行扫描摄像机的相对运动的运动侧写。从这些运动侧写中测定出平均的典型的运动侧写。于是,将这种典型的运动侧写定义为预先给定的运动侧写,借助于该预先给定的运动侧写来对图像数据进行第一次矫正。也可以依赖于行扫描摄像机相对于文件的布置来选择预先给定的运动侧写。如果用于扫描的相对运动在竖直方向上从上向下实行,那么可以假定在此实施的相对运动差不多相当于大约具有重力加速度的自由下落的相对运动。与此相反地,如果文件相对于行扫描摄像机的相对运动在水平方向上进行,那么可以假定该相对运动大约具有恒定的速度。在这种情况下,预先给定的运动侧写可以具有恒定的速度。在这里,把“运动侧写”理解为一种对文件相对于行扫描摄像机的相对运动的描述。例如,该运动侧写可以是在扫描过程中,行扫描摄像机依赖于时间地相对于文件的位置。在具有恒定的加速度的运动侧写中,如果从时间点Ttl上(也就是扫描过程开始时)的速度等于零出发,那么能够以带有唯一的运动侧写参数(即恒定的加速度)的方式来描述该运动侧写。可以例如通过机械的或光学的传感器来采集扫描过程的开始,所述传感器可以布置在扫描仪100上,以便感测(sensieren)何时文件122的下边缘经过行扫描摄像机。但是,也可以不带有这种额外的传感器地感测扫描的开始,方法是处理器113为此持续地监测由行扫描摄像机所提供的图像数据。同样地适用于使用恒定速度的预先给定的运动侧写的情况。在这种情况下,将速度值作为运动侧写参数就足够了。当然,尤其是当该运动侧写是源自实践地测定的典型的运动侧写的时候,也可以将该运动侧写作为曲线来储存。在矫正图像数据之后,在经矫正的图像数据的基础上进行字符识别。“字符识别”可以是指所谓的文字识别,其也称作光学字符识别(Optical Character Recognition-OCR)。针对字符识别,也可以使用智能字符识别(ICR)方法,在该智能字符识别方法中,在所述光学字符识别中连带地考虑到上下文内容。
针对从经矫正的图像数据中识别出的字符输出全局的置信值(Vertrauenswert)。 该全局置信值是针对字符识别的可靠性的尺度(Mai3),更确切地说,该全局置信值与在经矫正的图像数据中总共被识别出的字符相关,而与单个的字符无关。因此,全局置信值是针对所有从经矫正的图像数据中被识别出的字符的唯一的值。全局置信值例如可以是在0% 与100%之间的百分比数据,其中,在0%的全局置信值的情况下,被识别出的字符是随机值,而在100%的全局置信值的情况下,在字符识别的准确性方面存在绝对的可靠性。这种置信值也被称作“分数(Score) ”,对此例如参看US 5,048,097和US 7,280,684B2。下面,从预先给定的运动侧写出发,迭代地改变运动侧写,其中,在每次迭代中都重新矫正图像数据并且进行字符识别。根据优化法来实行运动侧写的改变,其中,将字符识别在每次迭代中所提供的全局置信值用作评估函数。在实施优化法之后,输出借助于当前运动侧写所识别出的字符。按照本发明的方法的实施方式尤其具有优点,因为一方面不必机械地或光学地采集文件相对于行扫描摄像机的不受控制的相对运动,并且另一方面用于矫正图像数据的数据处理开支相对小。根据本发明的实施方式,可以通过如下方式进一步改进字符识别,S卩,将文件或文件的所扫描的分区域分成区段。这例如可以根据预先给定的网格(Raster)来实行。用于进一步改进字符识别的出发点是基于优化法所测定出的改变的运动侧写。然后,将该优化法应用于图像数据的各个区段,其中,代替全局置信值,使用如下局部置信值, 该局部置信值由针对相应被处理的区段的字符识别来提供。因此,局部置信值正如全局置信值那样由字符识别来测定,两者的区别在于,局部置信值仅涉及区段之一内部的正确的字符识别的可靠性。因此,区段式地应用优化法,以便区段式地改变运动侧写,从而使各个区段的字符识别的局部置信值最大化。根据本发明的实施方式,预先给定至少第一运动侧写和第二运动侧写。在扫描文件的至少分区域之后,借助于第一预先给定的运动侧写来对图像数据进行第一次矫正以及借助于第二预先给定的运动侧写来对图像进行第二次矫正。如果设置有一个或多个其他的运动侧写,那么相应地生成其他版本的经矫正的图像数据。然后,借助OCR分别从经矫正的图像数据中识别出字符,并且针对经矫正的图像数据的每个版本都输出全局置信值。然后,挑选出至少第一运动侧写和第二运动侧写中实现了带有最大的全局置信值的字符识别的那个运动侧写。从至少第一运动侧写和第二运动侧写中挑选出的该运动侧写充当根据用于使全局置信值最大化的优化法对运动侧写进行迭代地改变的出发点。第一运动侧写例如可以是加速度恒定的运动侧写。恒定的加速度尤其可以约等于重力加速度g。与此相反地,第二运动侧写可以是速度恒定的运动侧写。如果例如行扫描摄像机是静止的,并且使用者必须手动地使待扫描的文件竖直地从上向下经过行扫描摄像机,那么令人感到意外地可以将使用者分成两组当将文件引导经过行扫描摄像机时,第一组使用者让持有文件的手基本上自由下落。与此相反地,第二组使用者尽力使文件以近似恒定的速度经过行扫描摄像机。基于所述使用者行为,相应的第一运动侧写和第二运动侧写的预先给定尤其具有优点,因为这些运动侧写中的一个运动侧写已经近似地相应于在扫描过程中文件相对于行扫描摄像机的不受控制的相对运动的实际上的运动侧写。于是,利用较少次数的迭代就足够完成该优化法,并且该优化法还提供较好的结果。在另一方面,本发明涉及一种计算机程序产品,带有用于进行如下步骤的能执行的程序指令(Programminstruktion)输入图像数据,该图像数据由行扫描摄像机从文件的至少一个分区域中通过扫描来采集;借助于文件和行扫描摄像机的相对运动的预先给定的运动侧写来矫正图像数据;在经矫正的图像数据中进行字符识别,其中,测定针对识别出的字符的准确性的全局置信值;迭代地改变运动侧写,其中,在每次迭代中,利用改变的运动侧写来矫正图像数据并且进行字符识别,并且其中,根据用于使全局置信值最大化的优化法来实行迭代地改变。在另一方面,本发明涉及一种数据处理系统,该数据处理系统带有用于输入图像数据的机构,这些图像数据由行扫描摄像机从文件的至少一个分区域中通过扫描来采集; 用于借助于文件和行扫描摄像机的相对运动的预先给定的运动侧写来矫正图像数据的机构;用于在经矫正的图像数据中进行字符识别的机构,其中,测定针对识别出的字符的准确性的全局置信值;用于迭代地改变运动侧写的机构,其中,在每次迭代中,利用改变的运动侧写来矫正图像数据并且进行字符识别,并且其中,根据用于使全局置信值最大化的优化法来实行迭代地改变。在另一方面,本发明涉及一种用于对文件进行自动光学采集字符的扫描仪,该扫描仪带有用于借助于行扫描摄像机来扫描文件的至少一个带有字符的分区域的机构,其中,进行文件和行扫描摄像机不受控制的相对运动,由此,采集至少所述分区域的图像数据;用于借助于文件和行扫描摄像机的相对运动的预先给定的运动侧写来矫正图像数据的机构;用于在经矫正的图像数据中进行字符识别的机构,其中,测定针对识别出的字符的准确性的全局置信值;用于迭代地改变运动侧写的机构,其中,在每次迭代中,利用改变的运动侧写来矫正图像数据并且进行字符识别,并且其中,根据用于使全局置信值最大化的优化法来实行迭代地改变。根据本发明的实施方式,扫描文件的整个正面和/或背面。但是,仅以文件的分区域的通过扫描而采集到的图像数据为基础,迭代地测定所述改变的运动侧写。该分区域可以是MRZ。在通过实施优化法对用于矫正的运动侧写进行测定之后,借助于该运动侧写来矫正所有扫描到的图像数据。
下面参考附图详细地阐述本发明的实施方式。其中图1示出按照本发明的扫描仪的实施方式的方框图;图2示出按照本发明的方法的实施方式的流程图;图3示出按照本发明的数据处理系统的实施方式的方框图;图4示出按照本发明的方法的实施方式的流程图。
具体实施例方式如下实施方式的彼此相应的部件都以相同的附图标记来表示。图1示出的是带有行扫描摄像机102的扫描仪100。该扫描仪100具有用于存储预先给定的运动侧写106的电子存储器104。所述预先给定的运动侧写106可以例如以数字化的曲线或可参数化的计算规则的形式指出行扫描摄像机在扫描时间期间依赖于时间的相对于待扫描的文件的位置。在速度恒定的运动侧写106中,行扫描摄像机的位置可以通过公式s = ν · t给出,其中,S是行扫描摄像机与文件的前缘的距离,V是恒定的速度,而t是自扫描过程开始所经过的时间。如果预先给定的是带有恒定的加速度的运动侧写106,那么相反计算规则是s = l/2a · t2,其中,a是加速度。例如,加速度可以与重力加速度相等。此外,存储器104用于存储改变的运动侧写108以及由行扫描摄像机102采集的图像数据110。存储器104还用于存储经矫正的图像数据112。扫描仪100具有处理器113,以便实施用于进行OCR的程序模块114。除了通过 OCR识别的字符之外,该程序模块114还提供单个的置信值,所述置信值是针对从经矫正的图像数据112中正确识别所有字符的可靠性的尺度。那就是说,程序模块114并不是针对每个识别出的字符都提供这种置信值,而是仅提供一个唯一的置信值,所述唯一的置信值总体上与从经矫正的图像数据112中识别出的字符的准确性相关。这种置信值可以由程序模块114例如通过对针对每个字符所测定的置信值取平均来获得。如果经矫正的图像数据 112整体经历一次OCR,那么该置信值是全局置信值;相反,如果只有图像数据112的一个区段经历OCR,那么该置信值是局部置信值。此外,扫描仪100的处理器113用于实施程序模块115。该程序模块115用于借助于预先给定的运动侧写106或者借助于改变的运动侧写108来矫正图像数据110。扫描仪100的处理器113还用于实施程序模块116,该程序模块用于执行优化法。 该优化法用于以如下方式为预先给定的运动侧写106的改变的最优化问题找出解决方案, 即,将置信值最大化,该置信值由程序模块114基于借助于改变的运动侧写矫正的图像数据112的OCR来测定。该优化法尤其可以是一种逼近法,该逼近法逼近地解决该最优化问题。扫描仪100连接在计算机118上,以便将由程序模块114识别出的字符传输给计算机118。在那里,识别出的字符例如由应用程序120作进一步处理。扫描仪100例如用于扫描证明文件,尤其是文件122。文件122例如带有护照照片 IM并且具有带个人数据的文字区126。此外,文件122具有所谓的MRZ 128,所述MRZ带有光学可读的字符。例如,借助于行扫描摄像机102来扫描文件122的整个正面或者仅扫描MRZ 128, 方法是使用者手动地从上向下拖动文件122经过行扫描摄像机102。由此,行扫描摄像机 102采集图像数据110并且将其存储到存储器104中。因为文件122和行扫描摄像机102 的相对运动在扫描过程期间不受控制,也就是说,以文件122相对于行扫描摄像机102的前进运动与行扫描摄像机102的重复频率(Wiederholfrequenz)不同步的方式实行,所以,这样采集到的图像数据110或多或少会失真。为了矫正图像数据110而假定在扫描过程期间,文件122相对于行扫描摄像机 102的不受控制的相对运动近似地与预先给定的运动侧写106相应。启动程序模块115用于矫正图像数据110。该程序模块使用图像数据Iio和预先给定的运动侧写106,该程序模块115借助于预先给定的运动侧写106对图像数据110进行矫正,并且该程序模块115将经矫正的图像数据112保存在存储器104中。接着,启动程序模块114,以便进行OCR,该程序模块114使用经矫正的图像数据 112。如果在此所测定的全局置信值已经处在阈值之上,那么将OCR的结果输出到计算机 118上。如果相反不是这种情况,那么启动程序模块116,以便实施优化法。为此,改变预先给定的运动侧写106,并且将生成的、改变的运动侧写108保存在存储器104中。例如可以使预先给定的运动侧写106增加或减小预先给定的值,例如方法是使运动侧写参数ν或a变大或变小预先给定的值。然后,重新开始实施程序模块115,以便借助于改变的运动侧写108重新对图像数据110进行矫正。经矫正的图像数据112又被写入到存储器104中。然后,在这样获得的、经矫正的图像数据112的基础上,借助于程序模块 114重新进行OCR。如果全局置信值现在处在阈值之上,那么中止执行优化法,并且将所识别出的字符输出到计算机118上。相反,如果该全局置信值仍然处于预先限定的阈值之下的话,那么进行一次或多次进一步的迭代,直至该全局置信值达到阈值或满足中止条件为止,例如最大次数的迭代。如果利用行扫描摄像机102扫描例如文件122的整个正面,那么在本发明的实施方式中可能发生的是为了执行该方法,仅应用从MRZ的区域中扫描的图像数据。在已经迭代地改变运动侧写,直至与MRZ的图像数据相关的全局置信值达到阈值或者满足中止条件之后,紧接着将该改变的运动侧写用于矫正所有扫描的图片数据,在此即是用于矫正文件的整个正面。这具有的优点是,仅在MRZ的图像数据的基础上进行矫正可以是支出较少的, 因为在MRZ方面可以将先验信息(a priori Information)引入到OCR中,例如用于MRZ的字符、字符间距或其他由ICAO所详细说明的特征。图2示出相应的方法。在步骤200中,借助于行扫描摄像机扫描文件,其中,文件相对于行扫描摄像机的相对运动不受控制并且无法与行扫描摄像机的重复频率同步。在步骤202中,这样采集的图像数据借助于预先给定的运动侧写来进行矫正。该预先给定的运动侧写例如可以是源自实践地测定的典型的运动侧写,该典型的运动侧写以数字化的路径-时间曲线的形式存储在扫描仪中。该预先给定的运动侧写也可以存储为唯一的运动侧写参数,例如恒定的速度ν或恒定的加速度a。在步骤204中,对经矫正的图像数据进行OCR。针对OCR无法提供关于所识别出的字符的、足够大的全局置信值的情况,在步骤206中执行迭代的优化法,以便使全局置信值最大化,其中,这通过在每次迭代中改变运动侧写来实行。因此,迭代包括改变基于上一次迭代而得到的运动侧写、借助于此次迭代的改变了的运动侧写对通过扫描所采集的图像数据进行后续矫正以及对这样得到的经矫正的图像数据进行0CR,连带输出为此测定的全局置信值。于是,在步骤208中,在优化法的实施结束之后,输出所识别出的字符。可选地,也可以输出针对所识别出的字符而测定的全局置信值。图3示出计算机118的实施方式,该实施方式集成有图1所示的实施方式的扫描仪100的功能。因此,行扫描摄像机102直接连接在计算机118上。与图1所示的实施方式的区别在于,存储器104中存储有两个不同的预先给定的运动侧写,即运动侧写A106' 和运动侧写B106"。
10
从程序模块115中与此相应地生成经矫正的图像数据A112'和经矫正的图像数据112 “,更确切地说,是在运动侧写A或运动侧写B的基础上生成这些经矫正的图像数据。处理器用于实施程序模块130,以便挑选出运动侧写A和B之一作为用于借助于程序模块116实施优化法的出发点。此外,处理器113用于实施程序模块132,以便根据预先给定的网格将文件122分成区段134. 1至134. 5。为了对文件122的MRZ 1 进行自动光学采集字符,进行如下操作将MRZ 1 手动地并且不受控制地引导经过扫描摄像机102,从而行扫描摄像机采集图像数据110,这些图像数据被保存在存储器104中。然后,启动程序模块115,该程序模块借助于运动侧写A对图像数据进行矫正。由此得到的经矫正的图像数据A被保存在存储器104中。此后,对图像数据110进行第二次矫正,更确切地说是借助运动侧写B进行该第二次矫正。通过实施程序模块115而生成的经矫正的图像数据B同样被存储在存储器104中。接着,启动程序模块114,以便根据经矫正的图像数据A进行OCR并且根据经矫正的图像数据B进行另一次OCR。针对经矫正的图像数据A的OCR,由程序模块114输出全局置信值A,并且针对经矫正的图像数据B的OCR,由程序模块114输出全局置信值B。程序模块130将全局置信值A和B相互进行比较并且挑选出这两个全局置信值中较大的那个全局置信值,并且也由此挑选出运动侧写A或B中的一个运动侧写。例如,如果全局置信值A大于全局置信值B,那么程序模块130挑选出运动侧写A。在相反的情况下, 程序模块130则挑选出运动侧写B。由程序模块130挑选出来的运动侧写就是用于随后通过程序模块116来实施优化法的初始值。程序模块116改变该被挑选出的运动侧写,并且将改变的运动侧写118存储在存储器104中。借助于改变的运动侧写108,对图像数据110重新进行矫正并且在此基础上进行OCR。该优化法一直迭代地进行,直至所得到的全局置信值达到阈值或者满足中止条件为止,如同图1所示的实施方式中的情况。为了进一步改善光学采集字符的质量,可以随后将文件122分成区段134,如图3 所示的那样。为此,图像数据110被分成相应的图像数据区段。因此,针对区段134中的每个区段,都存在图像数据区段,该图像数据区段包括属于相关的区段134的图像数据。然后,针对图像数据区段中的每个图像数据区段,借助于程序模块116实施优化法,更确切地说是从通过先前实施与图像数据110相关的优化法所得到的改变的运动侧写 108出发来实施该优化法。因此,为了例如针对区段134. 1实施优化法,使用图像数据110 的第一图像数据区段以及改变的运动侧写108的相应的第一区段。进一步对改变的运动侧写108的该区段进行优化,以便优化用于该区段134. 1的OCR的局部置信值。针对区段134 中的每个区段进行类似的操作。于是,在针对区段134中的每个区段实施优化法之后,将这样识别出的字符输入到用于进行进一步处理的应用程序120中。图4示出相应的流程图。在步骤300中,借助于行扫描摄像机扫描文件的至少一个分区域。在步骤302. 1 中,利用预先给定的运动侧写A来矫正这样采集到的图像数据,并且在步骤304. 1中,在借助于运动侧写A进行矫正的图像数据的基础上进行OCR并且对此测定全局置信值A。
以类似的方法和方式,在步骤302. 2中,借助于预先给定的运动侧写B对图像数据进行矫正,并且在步骤304. 2中,在利用运动侧写B进行矫正的图像数据的基础上进行OCR 并且测定全局置信值B。在步骤306中,挑选出运动侧写A和B中提供较高的全局置信值的那个运动侧写。 然后,从在步骤306中挑选出的运动侧写出发,在步骤308中实施优化法,通过该优化法,迭代地改变该挑选出的运动侧写,以便使全局置信值最大化。当运动侧写A和B分别以唯一的运动侧写参数ν或a的形式存在时,例如可以如下地实施这种优化法在步骤310中,使挑选出的运动侧写的运动侧写参数增大一个预先给定的值。然后,在步骤312中,在这样改变的运动侧写的基础上对图像数据重新进行矫正,并且在步骤 314中,使在步骤312中矫正过的图像数据经历OCR并且对此测定出与所采集的字符相关的
置信值。在步骤316中检验该置信值是否处在先前迭代的置信值之上。如果当前迭代是第一次迭代,那么检验该迭代的置信值是否大于在步骤304. 1或304. 2中所提供的置信值。如果是这种情况,那么返回到步骤310,以便重新提高运动侧写参数。如果情况相反,那么在步骤318中使运动侧写参数的先前的增大撤消,并且取而代之使运动侧写参数减小一个预先给定的值。在此之后,从步骤318返回到步骤312。一直执行该迭代法,直至在步骤314中所测定的置信值达到阈值或满足中止条件为止。该中止条件例如可以是迭代的最大次数。在步骤308中实施优化法之后,在步骤310中将图像数据分成区段。紧接着,针对这些区段中的每个区段,区段式地实施步骤308中的优化法,以便区段式地进一步改善光学采集字符的质量。于是,充当评估函数的分别是在步骤314中针对图像数据的区段所提供的局部置信值,该局部置信值与从该区段中识别出的字符有关。在步骤312中,在针对所有区段实施优化法之后,输出所识别出的字符。附图标记列表100扫描仪102行扫描摄像机104存储器106运动侧写108改变的运动侧写110图像数据112经矫正的图像数据113处理器114程序模块115程序模块116程序模块118计算机120应用程序122 文件
124护照照片
126文字区
128MRZ
130程序模块
132程序模块
134区段
权利要求
1.用于对文件(12 进行自动光学采集字符的方法,所述方法包括如下步骤-借助于行扫描摄像机(102)扫描所述文件的至少一个带有字符的分区域(1 ),其中,进行所述文件和所述行扫描摄像机的不受控制的相对运动,由此,采集至少所述分区域的图像数据(110),-借助所述文件和所述行扫描摄像机的相对运动的预先给定的运动侧写(106)来矫正所述图像数据,-在经矫正的图像数据(11 中进行字符识别,其中,测定针对识别出的字符的准确性的全局置信值,-迭代地改变所述运动侧写,其中,在每次迭代中,利用改变的运动侧写来矫正所述图像数据并且进行所述字符识别,并且其中,根据用于使所述全局置信值最大化的优化法来实行所述迭代地改变。
2.根据权利要求1所述的方法,其中,只要达到中止条件,就结束所述运动侧写的所述迭代地改变,所述方法带有如下其他步骤-将至少所述分区域分成区段(Π4),-从通过应用所述用于使所述全局置信值最大化的优化法而得到的运动侧写出发,区段式地迭代地改变所述运动侧写,其中,在与所述区段之一相关的每次迭代中,利用该区段的改变的运动侧写来矫正该区段的所述图像数据并且进行所述字符识别,其中,根据用于使相关的所述区段中的局部置信值最大化的优化法来实行所述区段中的所述运动侧写的所述迭代地改变。
3.根据权利要求1或2所述的方法,其中,预先给定至少第一运动侧写(106')和第二运动侧写(106〃),并且其中,分别利用预先给定的所述运动侧写来矫正所述图像数据并且进行对经矫正的图像数据的字符识别,并且其中,挑选出所述运动侧写中提供最大的全局置信值的那个运动侧写用于迭代应用。
4.根据权利要求3所述的方法,其中,所述第一运动侧写具有恒定的加速度。
5.根据权利要求4所述的方法,其中,所述加速度是重力加速度。
6.根据权利要求3、4或5所述的方法,其中,所述第二运动侧写具有恒定的速度。
7.根据权利要求3至6中任意一项所述的方法,其中,所述运动侧写中的每个运动侧写都具有唯一的运动侧写参数,其中,所述运动侧写中的被挑选出用于所述迭代地改变的运动侧写的所述运动侧写参数通过其运动侧写参数的改变而改变。
8.计算机程序产品,带有用于进行如下步骤的能执行的程序指令-输入图像数据(110),所述图像数据由行扫描摄像机从文件的至少一个分区域中通过扫描来采集,-借助所述文件和所述行扫描摄像机的相对运动的预先给定的运动侧写(106)来矫正所述图像数据,-在经矫正的图像数据中进行字符识别,其中,测定针对识别出的字符的准确性的全局置信值,-迭代地改变所述运动侧写,其中,在每次迭代中,利用改变的运动侧写来矫正所述图像数据并且进行所述字符识别,并且其中,根据用于使所述全局置信值最大化的优化法来实行所述迭代地改变。
9.根据权利要求8所述的计算机程序产品,其中,所述能执行的程序指令设计成用于执行如下其他步骤-只要达到中止条件,就结束所述运动侧写的所述迭代地改变, -将至少所述分区域分成区段(Π4),-从通过应用所述用于使所述全局置信值最大化的优化法而得到的运动侧写出发,区段式地迭代地改变所述运动侧写,其中,在与所述区段之一相关的每次迭代中,利用该区段的改变的运动侧写来矫正该区段的所述图像数据并且进行所述字符识别,其中,根据用于使相关的所述区段中的局部置信值最大化的优化法来实行所述区段中的所述运动侧写的所述迭代地改变。
10.根据权利要求9所述的计算机程序产品,其中,根据预先给定的网格将至少所述分区域分成区段。
11.数据处理系统,所述数据处理系统带有-用于输入图像数据(110)的机构,所述图像数据由行扫描摄像机从文件的至少一个分区域中通过扫描来采集,-用于借助所述文件和所述行扫描摄像机的相对运动的预先给定的运动侧写(106)来矫正所述图像数据的机构(115),-用于在经矫正的图像数据(112)中进行字符识别的机构(114),其中,测定针对识别出的字符的准确性的全局置信值,-用于迭代地改变所述运动侧写的机构(116),其中,在每次迭代中,利用改变的运动侧写来矫正所述图像数据并且进行所述字符识别,并且其中,根据用于使所述全局置信值最大化的优化法来实行所述迭代地改变。
12.根据权利要求11所述的数据处理系统,所述数据处理系统带有-用于存储至少第一预先给定的运动侧写和第二预先给定的运动侧写的机构(104), -用于挑选出所述至少第一运动侧写和第二运动侧写中的一个运动侧写用于所述迭代地改变的机构(130),其中,挑选出所述运动侧写中的如下运动侧写,即,在借助该运动侧写来矫正所述图像数据并且进行字符识别之后,该运动侧写提供最大的全局置信值。
13.根据权利要求11或12所述的数据处理系统,其中,所述至少第一运动侧写和第二运动侧写分别以运动侧写参数的形式来存储,所述运动侧写参数能够通过所述优化法来改变。
14.用于对文件进行自动光学采集字符的扫描仪,所述扫描仪带有-用于借助于行扫描摄像机来扫描所述文件的至少一个带有字符的分区域(1 )的机构(102),其中,进行所述文件和所述行扫描摄像机的不受控制的相对运动,由此,采集至少所述分区域的图像数据,-用于借助所述文件和所述行扫描摄像机的相对运动的预先给定的运动侧写来矫正所述图像数据的机构(115),-用于在经矫正的图像数据中进行字符识别的机构(114),其中,测定针对识别出的字符的准确性的全局置信值,-用于迭代地改变所述运动侧写的机构(116),其中,在每次迭代中,利用改变的运动侧写来矫正所述图像数据并且进行所述字符识别,并且其中,根据用于使所述全局置信值最大化的优化法来实行所述迭代地改变。
15.根据权利要求14所述的扫描仪,所述扫描仪带有-用于存储至少第一预先给定的运动侧写和第二预先给定的运动侧写的机构(104), -用于挑选出所述至少第一运动侧写和第二运动侧写中的一个运动侧写用于所述迭代地改变的机构(130),其中,挑选出所述运动侧写中的如下运动侧写,即,在借助该运动侧写来矫正所述图像数据并且进行字符识别之后,该运动侧写提供最大的全局置信值。
全文摘要
本发明涉及一种对文件(122)进行自动光学采集字符的方法,该方法包括如下步骤借助于行扫描摄像机(102)扫描所述文件的至少一个带有字符的分区域(128),其中,进行文件和行扫描摄像机不受控制的相对运动,由此,采集至少所述分区域的图像数据(110)借助于文件和行扫描摄像机的相对运动的预先给定的运动侧写(106)来矫正图像数据;在经矫正的图像数据(112)中进行字符识别,其中,测定针对识别出的字符的准确性的全局置信值;迭代地改变运动侧写,其中,在每次迭代中,利用改变的运动侧写来矫正图像数据并且进行字符识别,并且其中,根据用于使所述全局置信值最大化的优化法来实行迭代地改变。
文档编号G06K9/22GK102160065SQ200980136183
公开日2011年8月17日 申请日期2009年9月1日 优先权日2008年9月15日
发明者于尔根·迪特里希, 克里斯蒂安·克拉默, 赖蒙德·阿尔海特, 霍斯特·凯斯勒, 马丁·施普伦格 申请人:联邦印制有限公司