专利名称:字符识别方法和字符识别装置的制作方法
技术领域:
本发明一般地涉及字符识别方法和字符识别装置。更具体地说,本发明涉及一 种能够分离字符图像上的标记的字符识别方法和字符识别装置。
背景技术:
OCR (Optical Character Recognition,光学字符识别)系统已经越来越普及并且对
于计算机应用来说显得日益重要。OCR系统将纸件形式的文档转换为电子文件,简化了 数据输入并且使得能够方便地进行巨量文档的编辑、管理、分发等等。OCR引擎的识别 能力是影响其应用成本的关键因素,只有高准确度的识别才能保证其应用价值。对于普 通的打印文本文档,尤其是那些标准化的字符,当前的大多数OCR引擎都能够实现较高 的识别率。但是,在某些情况下,比如登记表、调查表、票据等,会将某些字符标记以便 表示选择结果,这些标记对OCR引擎的识别带来了新的挑战。首先,一些标记将两个或 更多个字符连接成了一个字符,这通常会导致OCR引擎的字符分割失败。其次,标记可 能会占据比字符区域大的区域,这在OCR引擎进行归一化时将会使字符尺寸变小,从而 导致后续的识别失败。为此,现有技术中已经提出了一种通过色彩过滤的方法来提取与字符具有不同 颜色的标记上的标记像素,但是这种方法在标记与字符具有相同颜色时不能正常工作。 现有的另一种方法是根据标记和字符的灰度差来分离标记和字符并进行识别,但是这种 方法的工作也不稳定,因为经常会出现标记与字符具有相同灰度而无法分离的情况。
发明内容
鉴于上述情况,本发明提出一种字符识别方法和字符识别装置,通过利用对标 记和字符都适用的的空间位置和形状特征来分离标记和字符,由此实现字符识别。根据 本发明的字符识别方法和字符识别装置,能够方便地检测并且分离与要识别的字符图像 交叠的字符图像上的标记,从而恢复字符图像以便于进行识别。在下文中首先给出关于本发明的简要概述,以便提供关于本发明的某些方面的 基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本 发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给 出某些概念,以此作为稍后论述的更详细描述的前序。根据本发明的一个方面,提供一种字符识别方法,包括根据要识别的字符图 像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有 相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字 符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标 记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。根据本发明的一个实施例的字符识别方法还包括选择要识别的所述字符图像的候选区域作为所述标记字符。根据本发明的另一个方面,提供一种字符识别装置,包括标记像素提取单 元,配置为根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记 的部分标记像素;扩展单元,配置为通过包含具有相同方向的相邻像素将所述提取的部 分标记像素扩展为标记线段;细化图像获取单元,配置为获取要识别的所述字符图像的 细化图像;标记线段生长单元,配置为沿着所述细化图像的轨迹将所述扩展的标记线段 生长为识别的标记;分离单元,配置为将所述识别的标记与所述字符图像分离;以及识 别单元,配置为识别所述分离的字符图像。根据本发明的一个实施例的字符识别装置还包括标记字符选择单元,配置为选 择要识别的所述字符图像的候选区域作为所述标记字符。优选地,所述选择候选区域包括通过将要识别的所述字符图像中的文本块交 替投影到水平方向和垂直方向来将所述文本块分割为字符区域;通过比较所述分割的字 符区域的大小将所述分割的字符区域分类为接触区域、大尺寸区域和正常尺寸区域;以 及将所述接触区域和所述大尺寸区域作为所述标记字符。根据本发明的一个实施例,所述提取部分标记像素包括提取包含字符的矩形框 之外的部分标记像素。具体地说,所述提取部分标记像素包括通过分别分离沿着水平 方向和垂直方向的投影中的两侧边波选择出一组候选标记像素;通过利用最小二乘曲线 拟合方法建立曲线模型以拟合所述候选标记像素组;以及计算所述候选标记像素组的拟 合误差以确定所述候选标记像素组是否是标记像素。根据本发明的另一个实施例,所述提取部分标记像素包括通过分析游程估计 笔划宽度;沿着接触方向的正交方向检查接触碎片的穿越特征;以及将具有在穿越线上 有两个部分且每一部分的宽度与所述笔划宽度相当的穿越特征的线段上的像素确定为标
记像素。根据本发明的再一个实施例,所述提取部分标记像素包括为每一个标记字符 确定参考字符,所述参考字符是与所述标记字符位于相同行或相同列的那些字符;根据 所述参考字符计算基准坐标;以及提取在所述基准坐标范围之外的像素作为标记像素。 优选地,当所述参考字符是沿着水平方向时,仅将所述参考字符的垂直坐标用于计算所 述基准坐标;以及当所述参考字符是沿着垂直方向时,仅将所述参考字符的水平坐标用 于计算所述基准坐标。根据本发明的一个实施例,所述扩展所述提取的部分标记像素包括获取所述 标记字符的方向图;以及通过包含在所述方向图的局部区域中的具有相同值的像素扩展 之前选择的标记像素。根据本发明的一个实施例,所述生长所述扩展的标记线段包括逐个包含在所 述细化图像的轨迹中的连接像素直到遇到接合点为止。可以看出,根据本发明的字符识别方法和 字符识别装置,通过利用对标记和字 符都适用的空间位置和形状特征,能够容易地分离标记和字符,从而方便地恢复字符图 像以便于进行识别。另外,本发明还提供用于实现上述字符识别方法的计算机程序。此外,本发明也提供至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述字符识别方法的计算机程序代码。
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在 所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下 面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例 说明本发明的优选实施例和解释本发明的原理和优点。在附图中图1 (a)示出要识别的带有标记的字符图像的示例;
图1 (b)示出根据本发明的实施例将图1 (a)所示的带有标记的字符图像进行标记 和字符分离之后输出的字符图像;图1 (c)示出根据本发明的实施例将图1 (a)所示的带有标记的字符图像进行标记 和字符分离之后输出的标记图像;图2示出根据本发明的实施例的字符识别方法的处理过程的流程图;图3示出根据本发明的实施例在图2的选择标记字符步骤中的具体处理过程的流 程图;图4示出根据本发明的实施例在进行切分和分类之后的字符图像示例;图5 (a)示出标记紧密围绕字符的示例;图5 (b)示出没有可用参考字符的接触情形的示例;图6示出根据本发明的实施例在图2的提取部分标记像素步骤中的第一示例处理 过程的流程图;图7(a)和7(b)示出带有标记的字符图像在垂直方向上的投影波形示例图;图7(c)和7(d)示出带有标记的字符图像在水平方向上的投影波形示例图;图8示出根据本发明的实施例在图2的提取部分标记像素步骤中的第二示例处理 过程的流程图;图9示出根据本发明的实施例利用穿越特征进行部分标记像素提取的示例图;图10示出根据本发明的实施例在图2的提取部分标记像素步骤中的第三示例处 理过程的流程图;图11示出根据本发明的实施例利用基准坐标作为参考进行部分标记像素提取的 示例图;图12示出根据本发明的实施例在图2的扩展提取的标记像素步骤中的处理过程 的流程图;图13示出标记字符的方向图的示例图;图14示出细化后的要识别的带有标记的字符图像的示例图;图15示出根据本发明的实施例的字符识别装置的配置方框图;以及图16示出用于实施根据本发明的字符识别方法的信息处理设备的结构方块图。本领域技术人员应当理解,附图中的元件仅仅是为了简单和清楚起见而示出 的,而且不一定是按比例绘制的。例如,附图中某些元件的尺寸可能相对于其他元件放 大了,以便有助于提高对本发明实施例的理解。
具体实施例方式在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起 见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种 实际实施例的过程中必须做出很多特定于该实际实施方式的决定,以便实现开发人员的 具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随 着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和 费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任 务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与 本发明关系不大的其他细节。为了便于加深对本发明原理的理解,在下文中将以图1所示的具体示例为例说 明如何将具有标记的字符图像分离为字符图像和标记图像并对字符图像进行识别以得到 识别后的字符。如图1中所示,图1(a)示出要识别的带有标记的字符图像的示例,图 1(b)示出根据本发明的实施例将图1(a)所示的带有标记的字符图像进行标记和字符分离 之后输出的字符图像,而图1(c)示出根据本发明的实施例将图1(a)所示的带有标记的字 符图像进行标记和字符分离之后输出的标记图像。下面将首先参照图2至图14描述根据本发明的实施例的字符识别方法的基本工
作原理。如图2所示,根据本发明的该实施例的字符识别方法包括选择标记字符步 骤S210,用于选择要识别的字符图像的候选区域作为标记字符;提取部分标记像素步 骤S220,用于根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标 记的部分标记像素;扩展提取的标记像素步骤S230,用于通过包含具有相同方向的相 邻像素将所述提取的部分标记像素扩展为标记线段;获取细化图像(thinned image)步骤 S240,用于获取要识别的所述字符图像的细化图像;生长扩展的标记线段步骤S250, 用于沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;分离字符和标 记步骤S260,用于将所述识别的标记与所述字符图像分离;以及识别分离出的字符步骤 S270,用于识别所述分离的字符图像。这里需要指出的是,上面所述的选择标记字符的步骤S210是可选步骤。也就是 说,可以不经过标记字符的选择而直接对要识别的带有标记的字符图像进行提取部分标 记像素步骤S220及其以后的处理,同样能够实现将标记与字符图像分离并对分离后的字 符图像进行识别,从而提交识别的准确性和可靠性。接下来将结合附图3至附图14对图2所示的字符识别方法包括的选择标记字符 步骤S210、提取部分标记像素步骤S220、扩展提取的标记像素步骤S230、获取细化图像 步骤S240、生长扩展的标记线段步骤S250、分离字符和标记步骤S260、以及识别分离出 的字符步骤S270等各个步骤中的处理进行详细描述。图3示出根据本发明的一个实施例在图2的选择标记字符步骤S210中的具体处 理过程的流程图。如图3所示,在选择带有标记的字符时,首先在步骤S310中,通过将 要识别的所述字符图像中的文本块交替投影到水平方向和垂直方向来将所述文本块分割为字符区域。
接着,在步骤S320中,比较在步骤S310中分割的字符区域的大小,并且将分割 后的字符区域分为三类,即接触区域、大尺寸区域和正常尺寸区域。图4示出根据本发 明的该实施例在进行切分和分类之后的字符图像示例。最后,在步骤S330中将接触区域 和大尺寸区域作为标记字符,而将正常尺寸区域标注为非标记字符区域。这里,还针对每一个标记字符标注出参考字符,参考字符是那些与标记字符位 于同一行或同一列上的字符。如图4所示,对于示出的大尺寸情形,标注出了两个参考 字符,而对于接触情形,则只有一个参考字符。另外,如果所有的字符区域为正常尺寸区域,则将该要识别的字符图像分类为 非标记字符图像。如此,无需执行图2所示的提取部分标记像素步骤S220、扩展提取的 标记像素步骤S230、获取细化图像步骤S240、生长扩展的标记线段步骤S250、以及分离 字符和标记步骤S260,处理流程直接前进到步骤S270进行字符识别处理。在根据图3所示的流程选择了标记字符之后,接下来将根据选择的标记字符上 的标记的位置和形状特征提取所述标记的部分标记像素。在提取标记的部分标记像素 时,可以根据标记的不同位置和形状特征进行相应的处理。下面将针对几种具体情况进 行具体分析和描述。根据本发明的一个实施例,在提取部分标记像素时,如图5所示,可以提取包 含字符的矩形框之外的部分标记像素。利用该特征,在标记紧密围绕字符时能够方便地 提取部分标记像素,如图5(a)所示。另外,对于没有可用参考字符的接触情形,这种处 理方式也能取得较好的处理效果。图6示出根据本发明的实施例在图2的提取部分标记像素步骤S220中的第一示 例处理过程的流程图。如图6所示,首先在步骤S610中,通过分别分离沿着水平方向和 垂直方向的投影中的两侧边波选择出一组候选标记像素。图7(a)和7(b)示出带有标记的字符图像在垂直方向上的投影波形示例图,图 7(b)中左右两侧的两条竖直线相应于图7(a)中文字两边的两条竖直线。图7(c)和7(d) 示出带有标记的字符图像在水平方向上的投影波形示例图,图7(d)中左右两侧的两条竖 直线相应于图7(c)中文字两边的两条水平横线。这样,对于图7(a)至图7(d)所示出的示例,可以选择图7(a)中的两条竖直线 之外的像素点(分别相应于图7(b)中左右两侧的竖直线之外的两个波)和图7(c)中的两 条水平横线之外的像素点(分别相应于图7(d)中左右两侧的竖直线之外的两个波)作为 标记像素。然后,在步骤S620中,通过利用最小二乘曲线拟合方法建立曲线模型以拟合所 述候选标记像素组,并且在步骤S630中,计算所述候选标记像素组的拟合误差以确定所 述候选标记像素组是否是标记像素。如果拟合误差较小,则可以认为该候选标记像素组 中的像素为标记像素。通过步骤S620和步骤S630的处理,可以将那些判断为标记像素 而实际为字符像素的虚假标记像素排除。例如,对于图7(a)中右侧竖直线之外的像素, 由于实际的像素值与拟合的曲线模型之间的拟合误差超出预定的阈值,因此将其设为不 是标记像素。此外,在提取部分标记像素时,针对上面所述的接触情形,也可以利用接触碎片的穿越特征来确定标记像素。图8示出根据本发明的实施例在图2的提取部分标记像 素步骤S220中的第二示例处理过程的流程图。如图8所示,根据该实施例的提取部分标记像素的处理,首先在步骤S810中通 过分析游程估计笔划宽度,然后在步骤S820中沿着接触方向的正交方向检查接触碎片的 穿越特征,并在步骤S830中将具有在穿越线上有两个部分且每一部分的宽度与所述笔划 宽度相当的穿越特征的线段上的像素确定为标记像素。图9示出根据本发明的该实施例利用穿越特征进行部分标记像素提取的示例 图。如图9中所示的标记上灰度较深的部分,即是穿越线上宽度与笔画宽度相当的两个 部分,因此将这些像素确定为标记像素。 另外,对于上面描述的大尺寸的情形,在提取部分标记像素时,可以通过分析 参考字符的布局来进行提取。图10示出根据本发明的实施例在图2的提取部分标记像素 步骤S220中的第三示例处理过程的流程图。如图10所示,在提取部分标记像素时,首先在步骤S1010,为每一个标记字符 确定参考字符,所述参考字符是与所述标记字符位于相同行或相同列的那些字符,然后 在步骤S1020根据所述参考字符计算基准坐标。在确定了字符的基准坐标之后,在步骤 S1030提取在所述基准坐标范围之外的像素作为标记像素。在步骤S1020中计算基准坐标时,当所述参考字符是沿着水平方向时,仅将所 述参考字符的垂直坐标用于计算所述基准坐标。类似地,当所述参考字符是沿着垂直方 向时,仅将所述参考字符的水平坐标用于计算所述基准坐标。图11示出根据本发明的该实施例利用基准坐标作为参考进行部分标记像素提取 的示例图。如图11所示,将字符图像中两条竖直的虚线之外的像素提取作为标记像素。在按照上面所述的方法提取了部分标记像素之后,在图2所示的扩展提取的标 记像素步骤S230中通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为 标记线段。图12示出根据本发明的该实施例在图2的扩展提取的标记像素步骤S230中 的处理过程的流程图。如图12所示,在扩展提取的部分标记像素时,首先在步骤S1210获取标记字符 的方向图,然后在步骤S1220中通过包含在所述方向图的局部区域中的具有相同值的像 素扩展之前选择的标记像素。图13示出根据本发明的一个具体示例的标记字符的方向图。如图13中所示,可 以根据下面的公式计算每一个像素在各个方向上的梯度来获取标记字符区域的方向图。C_horizontal = |in(i, j)_in(i,j_l)|+|in(i,j)_in(i,j+1) |+|in(i_l,j)-in(i_l, j-l)|+|in(i_l,j)-in(i_l,j+1) |+|in(i+l,j)_in(i+l,j_l) |+|in(i+l,j)_in(i+l,j+l)|C_vertical = |in(i, j)-in(i_l, j) |+|in(i, j)_in(i+l, j) |+|in(i, j-l)-in(i_l, j-l)|+|in(i,j-l)_in(i+l,j_l)|+|in(i,j+l)-in(i_l,j+l)|+|in(i,j+l)_in(i+l,j+1) |C_diagonall35 = |in(i,j)-in(i_l,j_l)|+|in(i,j)_in(i+l,j+l)|+2 * |in(i, j+l)-in(i_l,j)|+2*|in(i,j-l)_in(i+l,j) |C_diagonal45 = |in (i, j)_in(i_l,j+l)|+|in (i, j)_in(i+l,j-l)|+2 * |in (i, j-l)-in(i_l,j)|+2*|in(i,j+l)_in(i+l,j) |在对之前选择的标记像素进行扩展时,如果在方向图中所选择的标记线段位于同一方向线部分上,则将该整个方向线部分都标注为标记像素,由此实现对提取的部分 标记像素的扩展。现在返回图2,在步骤S230中对提取的部分标记像素进行扩展之后,在步骤 S240获取要识别的字符图像的细化图像,如图14所示,示出根据本发明的一个具体示例 的细化后的要识别的带有标记的字符图像。接着,在步骤S250中,逐个包含在所述细化图像的轨迹中的连接像素直到遇到 接合点为止,由此将步骤S230中扩展的标记线段生长为识别的标记。然后,在步骤S260 中将所述识别的标记与所述字符图像分离,并且在步骤S270中识别所述分离的字符图像。
以上结合附图2至附图14详细描述了根据本发明的实施例的字符识别方法的处 理过程及其详细工作原理。下面将结合图15描述根据本发明的实施例的字符识别装置的 结构及其工作原理。如图15所示,根据该实施例的字符识别装置包括标记字符选择单元1510,配 置为选择要识别的字符图像的候选区域作为标记字符;标记像素提取单元1520,配置为 根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记 像素;扩展单元1530,配置为通过包含具有相同方向的相邻像素将所述提取的部分标记 像素扩展为标记线段;细化图像获取单元1540,配置为获取要识别的所述字符图像的细 化图像;标记线段生长单元1550,配置为沿着所述细化图像的轨迹将所述扩展的标记线 段生长为识别的标记;分离单元1560,配置为将所述识别的标记与所述字符图像分离; 以及识别单元1570,配置为识别所述分离的字符图像。根据该实施例的字符识别装置包含的标记字符选择单元1510、标记像素提取单 元1520、扩展单元1530、细化图像获取单元1540、标记线段生长单元1550、分离单元 1560、以及识别单元1570等各个模块中的具体处理过程分别与参照图2至图14描述的字 符识别方法中的选择标记字符步骤S210、提取部分标记像素步骤S220、扩展提取的标记 像素步骤S230、获取细化图像步骤S240、生长扩展的标记线段步骤S250、分离字符和标 记步骤S260、以及识别分离出的字符步骤S270等各个步骤中的处理类似,在此略去进一 步的详细描述。同样需要指出的是,这里的标记字符选择单元1510是可选配置,根据本发明 的一个实施例可以不包括标记字符选择单元1510,而是仅由上述的标记像素提取单元 1520、扩展单元1530、细化图像获取单元1540、标记线段生长单元1550、分离单元 1560、以及识别单元1570构成,也同样能够实现字符图像和标记图像的分离,从而提高 识别的准确度。如此,通过上面描述的根据本发明的实施例的字符识别方法及字符识别装置, 能够准确地检测要识别的字符图像上存在的标记,并且从字符中分离出全部或部分的标 记像素,从而能够准确地进行识别。另外,由于根据本发明的实施例的字符识别方法及字符识别装置,采用了稳定 且可靠的标记位置和形状特征来分离字符图像上的标记,而且位置和形状特征同样也适 用于字符,因此能够确保所提取的像素属于标记像素,从而能够从字符图像中可信地分 离出全部或部分标记像素并准确地对字符图像进行识别。
此外,在根据本发明的实施例的字符识别方法及字符识别装置中,由于采用了 方向图和细化后的图像的轨迹作为参考来进行标记线段扩展,提供了空间上的约束,由 此有助于避免将字符像素错误地划分为标记像素,从而能够准确地分离字符图像和标记 图像,为后续实现准确地识别字符图像提供了保障。以上结合具体实施例描述了本发明的基本原理,但是,还需要指出的是,对本 领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部 件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、 固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明 的情况下运用他们的基本编程技能就能实现的。因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序 来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提 供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产 品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存 储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具 有专用硬件结构的计算机,例如图16所示的通用个人计算机700安装构成该软件的程 序,该计算机在安装有各种程序时,能够执行各种功能等等。在图16中,中央处理单元(CPU) 701根据只读存储器(ROM) 702中存储的程序 或从存储部分708加载到随机存取存储器(RAM) 703的程序执行各种处理。在RAM 703 中,也根据需要存储当CPU 701执行各种处理等等时所需的数据。CPU 701、ROM 702 和RAM 703经由总线704彼此连接。输入/输出接口 705也连接到总线704。下述部件连接到输入/输出接口 705:输入部分706,包括键盘、鼠标等等;输 出部分707,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器 等等;存储部分708,包括硬盘等等;和通信部分709,包括网络接口卡比如LAN卡、 调制解调器等等。通信部分709经由网络比如因特网执行通信处理。根据需要,驱动器710也连接到输入/输出接口 705。可拆卸介质711比如磁 盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器710上,使得从中读出 的计算机程序根据需要被安装到存储部分708中。在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可 拆卸介质711安装构成软件的程序。本领域的技术人员应当理解,这种存储介质不局限于图16所示的其中存储有程 序、与装置相分离地分发以向用户提供程序的可拆卸介质711。可拆卸介质711的例子 包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用 盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介 质可以是ROM 702、存储部分708中包含的硬盘等等,其中存有程序,并且与包含它们 的装置一起被分发给用户。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分 解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行 上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。虽然已经详细说明了本发明及其优点,但是应当理解在不脱离由所附的权利要 求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本申 请的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得 包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确 列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没 有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的
过程、方法、物品或者装置中还存在另外的相同要素。附记附记1. 一种字符识别方法,包括根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的 部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线 段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。附记2.根据附记1所述的字符识别方法,还包括选择要识别的所述字符图像的候选区域作为所述标记字符。附记3.根据附记2所述的字符识别方法,其中所述选择候选区域包括通过将要识别的所述字符图像中的文本块交替投影到水平方向和垂直方向来将 所述文本块分割为字符区域;通过比较所述分割的字符区域的大小将所述分割的字符区域分类为接触区域、 大尺寸区域和正常尺寸区域;以及将所述接触区域和所述大尺寸区域作为所述标记字符。附记4.根据附记3所述的字符识别方法,其中所述提取部分标记像素包括提取 包含字符的矩形框之外的部分标记像素。附记5.根据附记4所述的字符识别方法,其中所述提取部分标记像素包括通过分别分离沿着水平方向和垂直方向的投影中的两侧边波选择出一组候选标 记像素;通过利用最小二乘曲线拟合方法建立曲线模型以拟合所述候选标记像素组;以 及计算所述候选标记像素组的拟合误差以确定所述候选标记像素组是否是标记像素。附记6.根据附记3所述的字符识别方法,其中所述提取部分标记像素包括通过分析游程估计笔划宽度;沿着接触方向的正交方向检查接触碎片的穿越特征;以及将具有在穿越线上有两个部分且每一部分的宽度与所述笔划宽度相当的穿越特征的线段上的像素确定为标记像素。 附记7.根据附记3所述的字符识别方法,其中所述提取部分标记像素包括为每一个标记字符确定参考字符,所述参考字符是与所述标记字符位于相同行 或相同列的那些字符;根据所述参考字符计算基准坐标;以及提取在所述基准坐标范围之外的像素作为标记像素。附记8.根据附记7所述的字符识别方法,其中 当所述参考字符是沿着水平方向时,仅将所述参考字符的垂直坐标用于计算所 述基准坐标;以及当所述参考字符是沿着垂直方向时,仅将所述参考字符的水平坐标用于计算所 述基准坐标。附记9.根据附记1至8中的任意一个所述的字符识别方法,其中所述扩展所述提 取的部分标记像素包括获取所述标记字符的方向图;以及通过包含在所述方向图的局部区域中的具有相同值的像素扩展之前选择的标记像素。附记10.根据附记1至8中的任意一个所述的字符识别方法,其中所述生长所述 扩展的标记线段包括逐个包含在所述细化图像的轨迹中的连接像素直到遇到接合点为止。附记11. 一种字符识别装置,包括标记像素提取单元,配置为根据要识别的字符图像中标记字符上的标记的位置 和形状特征提取所述标记的部分标记像素;扩展单元,配置为通过包含具有相同方向的相邻像素将所述提取的部分标记像 素扩展为标记线段;细化图像获取单元,配置为获取要识别的所述字符图像的细化图像;标记线段生长单元,配置为沿着所述细化图像的轨迹将所述扩展的标记线段生 长为识别的标记;分离单元,配置为将所述识别的标记与所述字符图像分离;以及识别单元,配置为识别所述分离的字符图像。附记12.根据附记11所述的字符识别装置,还包括标记字符选择单元,配置为选择要识别的所述字符图像的候选区域作为所述标 记字符。附记13.根据附记12所述的字符识别装置,其中所述标记字符选择单元还配置 为通过将要识别的所述字符图像中的文本块交替投影到水平方向和垂直方向来将 所述文本块分割为字符区域;通过比较所述分割的字符区域的大小将所述分割的字符区域分类为接触区域、 大尺寸区域和正常尺寸区域;以及将所述接触区域和所述大尺寸区域作为所述标记字符。
附记14.根据附记13所述的字符识别装置,其中所述标记像素提取单元还配置 为提取包含字符的矩形框之外的部分标记像素。附记15.根据附记14所述的字符识别装置,其中所述标记像素提取单元还配置 为通过分别分离沿着水平方向和垂直方向的投影中的两侧边波选择出一组候选标 记像素;通过利用最小二乘曲线拟合方法建立曲线模型以拟合所述候选标记像素组;以 及计算所述候选标记像素组的拟合误差以确定所述候选标记像素组是否是标记像
ο附记16.根据附记13所述的字符识别装置,其中所述标记像素提取单元还配置 为通过分析游程估计笔划宽度;沿着接触方向的正交方向检查接触碎片的穿越特征;以及将具有在穿越线上有两个部分且每一部分的宽度与所述笔划宽度相当的穿越特 征的线段上的像素确定为标记像素。附记17.根据附记13所述的字符识别装置,其中所述标记像素提取单元还配置 为为每一个标记字符确定参考字符,所述参考字符是与所述标记字符位于相同行 或相同列的那些字符;根据所述参考字符计算基准坐标;以及提取在所述基准坐标范围之外的像素作为标记像素。附记18.根据附记17所述的字符识别装置,其中当所述参考字符是沿着水平方向时,仅将所述参考字符的垂直坐标用于计算所 述基准坐标;以及当所述参考字符是沿着垂直方向时,仅将所述参考字符的水平坐标用于计算所 述基准坐标。附记19.根据附记11至18中的任意一个所述的字符识别装置,其中所述扩展单 元还配置为获取所述标记字符的方向图;以及通过包含在所述方向图的局部区域中的具有相同值的像素扩展之前选择的标记像素。附记20.根据附记11至18中的任意一个所述的字符 识别装置,其中所述标记 线段生长单元还配置为逐个包含在所述细化图像的轨迹中的连接像素直到遇到接合点为止。
权利要求
1.一种字符识别方法,包括根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分 标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段; 获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记; 将所述识别的标记与所述字符图像分离;以及 识别所述分离的字符图像。
2.根据权利要求1所述的字符识别方法,还包括选择要识别的所述字符图像的候选区域作为所述标记字符。
3.根据权利要求2所述的字符识别方法,其中所述选择候选区域包括通过将要识别的所述字符图像中的文本块交替投影到水平方向和垂直方向来将所述 文本块分割为字符区域;通过比较所述分割的字符区域的大小将所述分割的字符区域分类为接触区域、大尺 寸区域和正常尺寸区域;以及将所述接触区域和所述大尺寸区域作为所述标记字符。
4.根据权利要求3所述的字符识别方法,其中所述提取部分标记像素包括 通过分别分离沿着水平方向和垂直方向的投影中的两侧边波选择出一组候选标记像素;通过利用最小二乘曲线拟合方法建立曲线模型以拟合所述候选标记像素组;以及 计算所述候选标记像素组的拟合误差以确定所述候选标记像素组是否是标记像素。
5.根据权利要求3所述的字符识别方法,其中所述提取部分标记像素包括 通过分析游程估计笔划宽度;沿着接触方向的正交方向检查接触碎片的穿越特征;以及将具有在穿越线上有两个部分且每一部分的宽度与所述笔划宽度相当的穿越特征的 线段上的像素确定为标记像素。
6.根据权利要求3所述的字符识别方法,其中所述提取部分标记像素包括 为每一个标记字符确定参考字符,所述参考字符是与所述标记字符位于相同行或相同列的那些字符;根据所述参考字符计算基准坐标;以及 提取在所述基准坐标范围之外的像素作为标记像素。
7.根据权利要求1至6中的任意一个所述的字符识别方法,其中所述扩展所述提取的 部分标记像素包括获取所述标记字符的方向图;以及通过包含在所述方向图的局部区域中的具有相同值的像素扩展之前选择的标记像素。
8.根据权利要求1至6中的任意一个所述的字符识别方法,其中所述生长所述扩展的 标记线段包括逐个包含在所述细化图像的轨迹中的连接像素直到遇到接合点为止。
9.一种字符识别装置,包括标记像素提取单元,配置为根据要识别的字符图像中标记字符上的标记的位置和形 状特征提取所述标记的部分标记像素;扩展单元,配置为通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩 展为标记线段;细化图像获取单元,配置为获取要识别的所述字符图像的细化图像; 标记线段生长单元,配置为沿着所述细化图像的轨迹将所述扩展的标记线段生长为 识别的标记;分离单元,配置为将所述识别的标记与所述字符图像分离;以及 识别单元,配置为识别所述分离的字符图像。
10.根据权利要求9所述的字符识别装置,还包括标记字符选择单元,配置为选择要识别的所述字符图像的候选区域作为所述标记字符。
全文摘要
本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
文档编号G06K9/34GK102024138SQ20091017369
公开日2011年4月20日 申请日期2009年9月15日 优先权日2009年9月15日
发明者于浩, 堀田悦伸, 孙俊, 小泽宪秋, 常兰兰, 武部浩明, 直井聪 申请人:富士通株式会社