图像处理装置和图像处理方法

文档序号:6424384阅读:170来源:国知局
专利名称:图像处理装置和图像处理方法
技术领域
本发明涉及图像处理装置和图像处理方法。
背景技术
在相关技术领域中,已经知道从图像中切出字符的技术。作为其中一项技术,JP-A-62-190575披露了字符图案切出装置,该装置从以字符接字符的形式写在纸张上的字符串(例如文档)中切出字符图案。字符图案切出装置包括扫描单元、字符串图案存储单元、基本图案区检测单元、字形估算值计算单元、字符识别字典存储单元、字符识别估算值计算单元、估算值加法单元、字符切出单元和输出单元。扫描单元通过光扫描纸张上的字符串来进行光电转换。字符串图案存储单元存储光电转换后的字符串的图案。基本图案区检测单元基于通过沿着与字符串方向垂直的方向扫描字符串图案而获得的周围分布值的连续性来分割字符串图案,并且根据由分割而得到的基本图案的左右端坐标和上下端坐标来确定参考图案区。字形估算值计算单元根据基本图案区的左右端坐标和上下端坐标,来计算单个基本图案区的字形估算值和组合图案区(如多个连续的基本图案区的组合)的字形估算值。字符识别字典存储单元存储待读取的字符的参考图案。字符识别估算值计算单元基于与存储在字符识别字典存储单元中的参考图案的匹配, 来获得单个基本图案的字符识别估算值和组合图案(如多个连续的基本图案的组合)的字符识别估算值。估算值加法单元通过将由字形估算值计算单元计算出的字形估算值与由字符识别估算值计算单元计算出的字符识别估算值相加,来计算与所有基本图案和组合图案对应的字符估算值。字符切出单元基于基本图案区的位置信息来获取候选切出位置的所有可能的组合,基于由估算值加法单元获得且与候选切出位置切出的基本图案和组合图案对应的字符估算值来获取候选切出位置的各个组合的切出估算值,并且基于切出估算值确定最佳字符切出位置的组合。输出单元基于字符切出单元的结果,从存储在字符串图案存储单元中的一行字符串图案中,以字符接字符的形式切出并且输出字符图案。

发明内容
本发明旨在提供以下图像处理装置和图像处理方法,在识别图像中的字符时,能够防止被识别的字符串仅基于一个字符图像的识别结果而被确定。[1]根据本发明的一方面,图像处理装置包括切出位置提取单元、候选字符提取单元、图生成单元、链接值生成单元、路径选择单元和输出单元。切出位置提取单元提取切出位置以从图像中分割字符图像。候选字符提取单元为每个由切出位置提取单元提取的切出位置所分割的各个字符图像的识别每个字符,并且为各个被识别字符提取多个候选字符。 图生成单元将由候选字符提取单元提取的多个候选字符中的每一个设定为节点,并且通过在相邻字符图像的节点之间建立链接来生成图。链接值生成单元基于字符串罩(hood)的值来生成链接值,所述字符串罩的值表示通过链接而连接的节点的候选字符之间的关系。 路径选择单元基于由链接值生成单元生成的链接值,来在由图生成单元生成的图中选择路径。输出单元输出所述路径选择单元选择的路径中的候选字符串,作为图像处理装置的字符识别结果。[2]在根据第[1]方面所述的图像装置中,在处理过程中,所述路径选择单元使用动态编程方法基于链接值之和来选择路径,同时删除和减少路径。[3]在根据第[1]方面或第[2]方面所述的图像处理装置中,链接值生成单元基于表示构成链接的节点的字符罩的值,来生成链接值。[4]在根据第[1]方面至第[3]方面中任一方面所述的图像处理装置中,切出位置提取单元提取多个切出位置。图生成单元将多个候选字符中的每一个设定为节点。为由切出位置提取单元提取的多个切出位置所分割的每个字符图像识别出多个候选字符中的每一个候选字符。图生成单元通过在相邻字符图像的节点之间建立链接来生成图。[5]根据本发明的另一方面,一种图像处理方法包括提取切出位置以从图像中分割字符图像;为由所提取的切出位置分割的每个字符图像的识别每个字符;为每个被识别的字符提取多个候选字符;将所提取的多个候选字符中的每一个设定为节点;通过在相邻字符图像的节点之间建立链接来生成图;基于字符串罩的值来生成链接值,所述字符串罩的值表示通过链接而连接的节点的候选字符之间的关系;基于所生成的链接值在所生成的图中选择路径;输出所选择路径中的候选字符串,作为所述图像处理方法的字符识别结^ ο根据第[1]方面的图像处理装置,在识别图像中的字符时,可以防止被识别的字符串仅基于一个字符图像的识别结果而被确定。根据第[2]方面的图像处理装置,与不具有该构造的图像处理装置相比,可以减少处理负担。根据第[3]方面的图像处理装置,可以利用表示字符串罩的值和表示字符罩的值来生成链接值。根据第[4]方面的图像处理装置,可以输出多个切出位置的字符识别结果。根据第[5]方面的图像处理装置,在识别图像中的字符时,可以防止被识别的字符串仅基于一个字符图像的识别结果而被确定。


将基于附图详细描述本发明示例性实施例,其中图1是根据本实施例的构造实例的概念性模块构造视图;图2是链接值生成模块的构造实例的概念性模块构造视图;图3是路径选择模块的构造实例的概念性模块构造视图;图4是示出根据本实施例的处理实例的流程图;图5是示出存在多个候选字符的图的实例的说明性视图;图6是示出标号实例的说明性视图;图7是示出标号实例的说明性视图;图8是示出标号实例的说明性视图;图9是示出标号实例的说明性视图;图10是示出标号实例的说明性视图11是示出利用内节点信息的实例的说明性视图;图12A和图12B是示出节点和链接的实例的说明性视图;图13是示出存在多个字符切出位置时的处理实例的说明性视图;图14是示出标号实例的说明性视图;图15是示出存在多个字符切出位置时的处理实例的说明性视图;图16A、图16B、图16C、图16D、图16E、图16F和图16G是示出加权实例的说明性视图;图17是示出加权确定模块的模块构造实例的说明性视图;图18是示出加权实例的说明性视图;图19是示出权重实例的说明性视图;图20A、图20B、图20C、图20D、图20E、图20F和图20G是示出加权实例的说明性视图;图21是示出加权确定模块的模块构造实例的说明性视图;图22是示出用计算机实现本实施例时的硬件配置的实例的框图;图23是示出字符串图像的实例的说明性视图;图M是示出候选字符边界的实例的说明性视图;图25是示出外接矩形的实例的说明性视图;图沈々、图^B、图26C和图26D是示出字符切出结果的实例的说明性视图;图27是示出表示字符切出位置的图解表述的实例的说明性视图;图观是示出图解表述的图案的实例的说明性视图;图四是示出图的实例的说明性视图。
具体实施例方式本实施例涉及在包括字符串的图像中确定字符识别的结果。在说明本实施例之前,首先对说明前提或使用本实施例的图像处理装置进行说明。本说明是为了使本实施例易于理解。例如,将对图观中所示的字符串图像进行描述。首先,将该字符串分割成字符段。 文中所述的短语“字符段”涉及可能为字符本身或字符的一部分的字符部分。下面,将举例说明图观中所示的横向书写的字符串图像。用竖线(或大致竖直的线)将横向书写的图像分割成字符段。例如,用图M中所示的竖线(候选切分线MlO和候选切分线2420)将字符串图像分割成3个字符段“〃 ”、“ t”和“学”。将图M中所示的竖线称为“候选切分线”。候选切分线2410分开“彳,,和“匕,,,候选切分线2420分开“匕,,和“学”。下面,如图25所示,各个外接矩形(外接矩形2510、外接矩形2520和外接矩形 2530)提取出字符段。下面,举例说明JP-A-62-190575中披露的技术内容。尽管以下说明中使用的术语有时与JP-A-62-190575中使用的术语不一样,但技术内容与JP-A-62-190575的技术内容相同。将上述字符段组合来确定字符图像。在一些情况下,可以将多个字符段组合来形成一个字符图像,或者在另外一些情况下,一个字符段可以形成一个字符。由于确定字符图像相当于确定字符切出位置,因而,确定字符图像有时可以称为确定字符切出位置。存在多种字符段组合图案。在这些图案中,通过选择具有最高字符图像估算值的图案来确定最终字符切出位置。图26A至图26D所示实例示出了图25所示实例的所有字符切出图案。具体而言, 图2队的实例作为第一图案示出了三个字符图像(外接矩形2510、外接矩形2520和外接矩形2530),图^B的实例作为第二图案示出了两个矩形图像(外接矩形2510和2520,以及外接矩形2530),图^C的实例作为第三图案示出了一个字符图像(外接矩形2510、2520 和2530),以及图^D的实例作为第四图案示出了两个字符图像(外接矩形2510和外接矩形 2520 和 25030)。图26A至图^D的实例所示的多种切出图案可以由描述字符切出位置的图来表示。在图27的实例中,图包括四个节点起始节点2700、终点节点2790、中间节点2710(第一节点)和中间节点2720(第二节点),以及使节点之间相互连接的弧线(此处节点之间的连接线称为弧线)。起始点与字符串图像的左端点对应,并且终点与字符串图像的右端点对应。中间节点2710(第一节点)和中间节点2720(第二节点)表示各个候选字符段位置 (如图M所示,分别为候选段MlO和候选段对20)。中间节点2710(第一节点)与候选段 2410对应,而中间节点2720 (第二节点)与候选切分线M20对应。下文中将从起点经过节点到达终点的路线称为“路径”。路径包括一条或多条弧线。通常,存在多条路径。图26A至图26D实例中示出的字符切出图案与这些路径对应。例如,图^B的实例中所示的第二图案与图28中用粗线所示的路径(字符切出图案2704和字符切出图案2722)对应。此处,一个候选字符图像与一条弧线对应。例如,字符图像(字符切出图案 2704) “化”与连接起始节点2700和中间节点2720(第二节点)的弧线对应。对于与一条弧线对应的字符,可以确定该字符的估算值。该估算值称为“弧线估算值”。弧线估算值基于字形信息和字符识别精度等来计算。存在多种弧线估算值计算方法,例如(1) JP-A-9-185681、(2) JP-A-8-161432、(3) JP-A-10-154207、(4) JP-A-61-175878、 (5) JP-A-3-037782 和(6) JP-A-11_20;3406 等所披露的计算方法。一条路径包括多个弧线。由弧线构成的路径的估算值可以基于多个弧线估算值来计算。文中称为“路径估算值”。从多条路径中选择具有最高路径估算值的一条路径来确定字符切出位置。路径选择允许确定字符切出位置和切出字符,同时可以确定被切出字符的识别结果(字符图像)。例如,假定选择了图观的实例中的粗线路径。在该情况下,字符切出位置与三个节点对应,即起始节点2700、中间节点2720(第二节点)和终点节点2790。所确定的字符识别结果与“化”(字符切出图案2704)和“学”(字符切出图案2722)对应。将对路径估算值计算方法进行说明。基于弧线估算值的加权之和来大致计算路径估算值。假定Vi表示第i条弧线的弧线估算值,Wi表示第i条弧线估算值的权重,N表示弧线数量,并且P表示路径估算值,P由以下等式(1)表示。[等式1]
权利要求
1.一种图像处理装置,包括切出位置提取单元,其提取切出位置以从图像中分割字符图像; 候选字符提取单元,其为每个由所述切出位置提取单元提取的切出位置所分割的字符图像识别每个字符,并且为每个被识别的字符提取多个候选字符;图生成单元,其将由所述候选字符提取单元提取的多个候选字符中的每一个设定为节点,并且通过在相邻字符图像的节点之间建立链接来生成图;链接值生成单元,其基于字符串罩的值来生成链接值,所述字符串罩的值表示通过链接而连接的节点的候选字符之间的关系;路径选择单元,其基于由所述链接值生成单元生成的链接值在由所述图生成单元生成的图中选择路径;以及输出单元,其输出所述路径选择单元选择的路径中的候选字符串,作为所述图像处理装置的字符识别结果。
2.根据权利要求1所述的图像处理装置,其中,在处理过程中,所述路径选择单元使用动态编程方法基于链接值之和来选择路径,同时删除和减少路径。
3.根据权利要求1或2所述的图像处理装置,其中,所述链接值生成单元基于表示构成链接的节点的字符罩的值,来生成链接值。
4.根据权利要求1或2所述的图像处理装置,其中, 所述切出位置提取单元提取多个切出位置,所述图生成单元将多个候选字符中的每一个设定为节点,为由所述切出位置提取单元提取的多个切出位置所分割的每个字符图像识别出多个候选字符中的每一个候选字符;以及所述图生成单元通过在相邻字符图像的节点之间建立链接来生成图。
5.一种图像处理方法,包括提取切出位置以从图像中分割字符图像; 为由所提取的切出位置分割的每个字符图像识别每个字符; 为每个被识别的字符提取多个候选字符; 将所提取的多个候选字符中的每一个设定为节点; 通过在相邻字符图像的节点之间建立链接来生成图;基于字符串罩的值来生成链接值,所述字符串罩的值表示通过链接而连接的节点的候选字符之间的关系;基于所生成的链接值在所生成的图中选择路径;以及输出所选择路径中的候选字符串,作为所述图像处理方法的字符识别结果。
全文摘要
本发明公开了一种图像处理装置和图像处理方法。所述图像处理装置包括切出位置提取单元、候选字符提取单元、图生成单元、链接值生成单元、路径选择单元和输出单元。切出位置提取单元提取切出位置。候选字符提取单元识别由所述切出位置所分割的各个字符图像的每一个字符,并且为各个被识别字符提取多个候选字符。图生成单元将提取的多个候选字符中的每一个设定为节点,并且通过在相邻字符图像的节点之间建立链接来生成图。链接值生成单元基于表示候选字符之间的关系的字符串罩的值来生成链接值。路径选择单元基于链接值在图中选择路径。输出单元输出所选路径中的候选字符串。
文档编号G06K9/72GK102479332SQ20111012921
公开日2012年5月30日 申请日期2011年5月18日 优先权日2010年11月30日
发明者木村俊一 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1