信息处理设备以及信息处理方法

文档序号:6539861阅读:175来源:国知局
信息处理设备以及信息处理方法
【专利摘要】本发明提供了一种信息处理设备和信息处理方法,该设备包括存储单元、解释单元、以及校正单元。所述存储单元存储多个校正指令。所述解释单元解释存储在所述存储单元中的校正指令。所述校正单元根据由所述解释单元解释的所述校正指令来校正识别字符串。所述解释单元确定所述校正指令的类型,并且根据所述校正指令的类型来提取包括作为所述校正指令的目标的一个或多个字符在内的第一字符串和通过对部分或全部的所述第一字符串执行转换而获得的第二字符串。所述校正单元在所述第一字符串存在于所述识别字符串中的情况下,将所述识别字符串内的部分或全部所述第一字符串转换为所述第二字符串。
【专利说明】信息处理设备以及信息处理方法

【技术领域】
[0001]本发明涉及信息处理设备以及信息处理方法。

【背景技术】
[0002]在日本未经审查的专利申请公开文件第2-170292号中描述的字符识别后处理方法的目标是,即使从具有多变字符间距的文档以及混合了“全角(em)”字符、“半角(en)”字符、“倍角”(double “em”)字符等的文档等中也能采用简单处理方法高速度和高精确度地读取字符。字符识别后处理方法从字符串图案提取单独的字符以用于识别,从而校正了在字符读取中由错误切分字符引起的错误识别结果。该方法从用于校正被错误切分和错误识别部分的信息中提取候选字符串集,将正确字符串与该候选字符串集的关系登记为校正规贝U,并且将该校正规则应用于识别出的结果,此后使得能够将该校正规则内的正确字符串替换为其后的字符识别结果的第一候选字符串。
[0003]在日本未经审查的专利申请文件第5-298488号中描述的一种光学字符阅读器的目标是甚至在没有字符书写框的纸片中也能进行快速字符读取。扫描仪在图像检测阶段光学地扫描纸片,纸张缓存器存储纸片图像。字符切分阶段检测出涉及由从控制部分发送的格式控制信息指定的在存储的纸片图像之内的阅读栏的垂直投影,基于该垂直投影,按照来自纸片图像的每个字符切分字符图案并将所切分的字符图案输出至识别阶段。识别阶段通过使用关于接收的字符图案的识别词典来处理字符识别,并将该字符识别结果输出到后处理阶段。后处理阶段在存储于词汇字典部分中的词汇、错误字符串、以及源自识别部分的候选字符串之间做比较和核对,判定正确的词汇,并将正确的词汇输出至输出缓存器。
[0004]在日本未经审查的专利申请文件第7-306917号中描述的字符识别装置的目标是,即使当字符识别单元使用错误的字符切分方法并且不正确地识别合并或分离的字符时用户未指示字符切分校正方法,也能够简单和可靠地识别合并或分离的字符。该字符识别装置包括:字符识别单元,其识别关于书写字符等的字符图案数据的字符;存储单元,其将由所述字符识别单元识别的识别字符存储为对应于所述字符图案数据的字符以及这些识别字符的候选字符组;字符表格,其包括多个字符并预先存储多个字符与不同于这多个字符的组合字符之间的对应关系;以及字符产生单元,其通过参考所述字符表格,基于通过所述字符识别单元获得并存储在所述存储单元中的识别的字符以及针对识别的字符的候选,来产生新的字符。


【发明内容】

[0005]因而,本发明的目标是提供信息处理设备和信息处理方法,其在执行用于校正所识别字符串的处理中,提取对应于校正指令类型的第一字符串和第二字符串。
[0006]根据本发明的第一方面,提供了一种信息处理设备,其包括存储单元、解释单元、以及校正单元。所述存储单元存储多个校正指令。所述解释单元解释存储在所述存储单元中的校正指令。所述校正单元根据由所述解释单元解释的所述校正指令来校正识别字符串。所述解释单元确定所述校正指令的类型,并且根据所述校正指令的类型来提取包括作为所述校正指令的目标的一个或多个字符在内的第一字符串和通过对所述第一字符串的一部分或全部执行转换而获得的第二字符串。所述校正单元在所述第一字符串存在于所述识别字符串中的情况下,将所述识别字符串内的所述第一字符串的一部分或全部转换为所述第二字符串。
[0007]在根据本发明的第二方面的所述信息处理设备中,所述校正指令包括字符合并指令和字符分离指令。所述解释单元在所述校正指令是字符合并指令的情况下,提取多个字符的串作为所述第一字符串并且提取一个字符作为所述第二字符串。所述解释单元在所述校正指令是字符分离指令的情况下,提取一个字符作为所述第一字符串并且提取多个字符的串作为所述第二字符串。
[0008]在根据本发明的第三方面的所述信息处理设备中,所述校正指令包括字符交换指令和候选字符增加指令。所述解释单元在所述校正指令是字符交换指令的情况下,提取包括目标字符以及在所述目标字符前面和后面的字符在内的字符串作为所述第一字符串,并且提取替换字符以及在所述替换字符前面和后面的字符作为所述第二字符串。所述解释单元在所述校正指令是候选字符增加指令的情况下,提取包括目标字符以及在所述目标字符前面和后面的字符在内的字符串作为所述第一字符串,并且提取作为所述目标字符的识别候选而将被增加的字符作为所述第二字符串。
[0009]在根据本发明的第四方面的所述信息处理设备中,所述解释单元在所述字符合并指令和所述字符分离指令作为所述校正指令而存在的情况下,确定所述字符合并指令的所述第二字符串和所述字符分离指令的所述第一字符串是否彼此相同。
[0010]根据本发明的第五方面,一种信息处理方法包括步骤:存储多个校正指令;解释存储的校正指令;以及根据解释的校正指令来校正识别字符串。所述解释步骤确定所述一个校正指令的类型,并且根据所述校正指令的类型来提取包括作为所述校正指令的目标的一个或多个字符在内的第一字符串和通过对所述第一字符串的一部分或全部执行转换而获得的第二字符串。所述校正步骤在所述第一字符串存在于所述识别字符串的情况下,将所述识别字符串内的所述第一字符串的一部分或全部转换为所述第二字符串。
[0011]根据本发明的第一方面的信息处理设备在执行用于校正识别字符串的处理中,可提取对应于校正指令类型的第一字符串和第二字符串。
[0012]根据本发明的第二方面的信息处理设备可根据所述字符合并指令或所述字符分离指令提取所述第一字符串和所述第二字符串。
[0013]根据本发明的第三方面的信息处理设备可根据字符交换指令或候选字符增加指令提取所述第一字符串和所述第二字符串。
[0014]根据本发明的第四方面的信息处理设备可防止所识别字符的同一字母被所述字符合并指令和所述字符分离指令校正。
[0015]根据本发明的第五方面的信息处理方法在执行用于校正所识别字符串的处理中,可提取对应于校正指令类型的所述第一字符串和所述第二字符串。

【专利附图】

【附图说明】
[0016]将基于下列附图详细描述本发明的示例性实施例,其中:
[0017]图1是第一示例性实施例的配置示例的示意模块配置图;
[0018]图2是示出第一示例性实施例中的处理示例的流程图;
[0019]图3A和图3B是示出校正指令的示例的说明图;
[0020]图4A和图4B是示出校正参数的示例的说明图;
[0021]图5A和图5B是示出校正指令的示例的说明图;
[0022]图6是示出校正参数的示例的说明图;
[0023]图7是第二示例性实施例的配置示例的示意模块配置图;
[0024]图8是示出第二示例性实施例中的处理示例的流程图;
[0025]图9是示出校正指令数据的示例的说明图;
[0026]图10是第三示例性实施例的配置示例的示意模块配置图;
[0027]图11是示出第三示例性实施例中的处理示例的流程图;
[0028]图12是示出校正指令列表的示例的说明图;
[0029]图13A、图13B、图13C以及图13D是示出校正指令的示例的说明图;以及
[0030]图14是示出实现示例性实施例的计算机的硬件配置的示例的框图。

【具体实施方式】
[0031]将通过参考附图在下文中描述本发明的不同示例性实施例。
[0032]<第一示例性实施例>
[0033]图1是第一示例性实施例的配置示例的示意模块配置图。
[0034]通常,术语“模块”是指诸如软件(计算机程序)、硬件等可逻辑分离的组件。因此,示例性实施例中的模块不仅涉及计算机程序中的模块,而且涉及硬件配置中的模块。因而,通过示例性实施例,描述了使得所述组件用作模块的计算机程序(使计算机执行每个步骤的程序、使计算机用作每个单元的程序、以及使计算机执行每个功能的程序)、系统、以及方法。然而,为了描述方便,将使用术语“存储”“使某物存储”,以及其他等同的表达方式。当示例性实施例涉及计算机程序时,这些术语和表达方式意即“使存储装置存储”,或“控制存储装置以存储”。模块和功能可以以一一对应的准则相关联。然而,在实际实施方式中,一个模块可以通过一个程序实施、多个模块可以通过一个程序实施,或者一个模块可以通过多个程序实施。此外,多个模块可以通过一个计算机执行,或者在分布式计算机环境或并联计算机环境中一个模块可以通过多个计算机实施。此外,一个模块可包括另一个模块。需注意,术语“连接”在下文中可指逻辑连接(诸如数据传输、指令、以及数据间的交叉引用关系),也可以指物理连接。术语“被预定”意即在目标处理被执行之前被设置。根据处理时的条件和状态或根据处理前一段时间内的条件和状态,只要在执行目标处理之前被设置,“被预定”不仅表示在示例性实施例中的处理之前被设置,还表示甚至在示例性实施例中的处理开始之后被设置。当存在多个“预定数值”时,数值可能彼此不同,或者两个或以上的数值(显然,包括所有数值)可以相同。术语“在A的情况下,B被执行”表示“执行是否为A的确定,以及当确定为A时,B被执行”,除非不需要确定是否是A。
[0035]此外,“系统”或者“设备”不仅可以通过经由诸如网络(包括一一对应的通信连接)之类的通信单元连接的多个计算机、硬件、设备等实现,还可以通过单个计算机、硬件、设备等实现。术语“设备”和“系统”作为同义词使用。显然地,术语“系统”不包括仅被人为布置的社会化“机构”(社会系统)。
[0036]此外,对于模块中的每个处理或对于执行多个处理的模块中的各个处理而言,从存储装置读取目标信息并且在执行了该处理之后将处理结果写入存储装置。因而,在处理被执行之前从存储装置读取的描述或在处理被执行之后写入到存储装置的描述可以省略。存储装置可以是硬盘、随机存取存储器(RAM)、外部存储介质、使用通信线路的存储装置、中央处理单元(CPU)内的寄存器等。
[0037]根据第一示例性实施例的识别字符串校正模块120校正识别字符串115 (其是字符识别模块110的处理结果),并输出校正后的识别字符串155。如图1的示例中所示,识别字符串校正模块120包括校正指令存储模块130、校正指令解释模块140、以及校正指令执行模块150。
[0038]字符识别技术公知是用来辨认和识别文件图像中的字符并将它们转换为字符编码。
[0039]如果字符是事先被切分为字符的单一单位字符(下文中称为“单个字符”)或印刷文档中的字符,则现有的字符识别技术能够以相对高的字符识别精确度来识别字符。
[0040]然而,对于采用复杂排版的文档或手写文档而言,由于单个字符切分错误、手写字符质量不一致(字符大小或字符间距不一致)等原因,字符识别的精确度被极大降低并且更多的字符趋于被不正确地识别。
[0041]因而,在字符识别技术中需要对不正确识别的字符进行检测和校正的技术。
[0042]字符识别模块110被连接至识别字符串校正模块120的校正指令执行模块150。字符识别模块110接收字符图像数据105,识别字符图像数据105,并且输出识别字符串115。此处的字符识别可以使用现有识别技术完成。例如,字符识别模块110从电子文档图像数据切分对应于字符串的字符图像数据105 ;连续地从字符图像数据105切分出可切分的单个字符候选区;识别切分的单个字符候选区的每一个;并输出作为识别结果的识别字符串115。
[0043]识别字符串校正模块120校正已从字符识别模块110输出的识别字符串115。
[0044]校正指令存储模块130被连接至校正指令解释模块140。校正指令存储模块130存储多个校正指令。具体地,校正指令存储模块130存储针对字符串的多个校正方法。校正方法例如可以是任意的下列指令或其组合:字符合并指令、字符分离指令、字符交换指令、以及候选字符增加指令。校正指令包括表示校正字符串的方法的校正命令以及校正命令必需的校正参数。另外,同一校正指令包括多个不同的对应校正参数。用于校正命令的校正参数可以是具有多个字符编码的字符编码图案、定义预定字符编码的范围的字符编码组等。校正命令和对应的校正参数将稍后描述。
[0045]校正指令解释模块140被连接至校正指令存储模块130以及校正指令执行模块150。校正指令解释模块140解释存储在校正指令存储模块130中的校正指令。在此处执行的解释处理中,判别校正指令的类型,并且根据该校正指令的类型,提取出具有作为校正指令目标的一个或多个字符的第一字符串以及通过对该第一字符串的一部分或全部进行转换而获得的第二字符串。所述第一字符串可以是特定的字符串或由正规表达所表示的字符串。
[0046]具体地,校正指令解释模块140从存储在校正指令存储模块130中的多种类型的校正指令中确定使用哪种校正指令,并且获取校正命令和所需的校正参数(上面提及的第一字符串和第二字符串)。此处执行的所述确定包括以预定顺序使用校正指令、判定关于校正指令的组合是否恰当等。
[0047]校正指令解释模块140执行下列提取处理作为解释处理。示例在图13A至图13D中给出。
[0048]当校正指令是合并字符的指令时,多字符的串被提取作为第一字符串并且一个字符被提取作为第二字符串。如图13A中示例所示,连续字符串,即字符1310和字符1312,被合并为字符1314。当两个或以上的字符被处理时,该指令被应用多次。
[0049]当校正指令是分离字符的指令时,一个字符被提取作为第一字符串并且多字符的串被提取作为第二字符串。如图13B中示例所示,一个字符,即字符1320,被分离为两个字符,即字符1322和字符1324。当字符将被分离为三个或以上字符时,该指令被应用多次。
[0050]当校正指令是字符交换指令时,包括目标字符及其前面和后面字符的字符串被提取作为第一字符串,并且包括替换字符及其前面和后面字符的字符串被提取作为第二字符串。第二字符串内的前面和后面的字符串与第一字符串内的前面和后面的字符串是相同的。如图13C中示例所示,字符1330、字符1332、以及字符1334 (目标字符1332、其前面字符1330、以及其后面字符1334)被替换为字符1330、字符1336、以及字符1334 (目标字符1332被替换为字符1336)。
[0051]当校正指令是增加候选字符的指令时,包括目标字符及其前面字符和后面字符的字符串被提取作为第一字符串,并且被增加作为目标字符的识别候选字符的字符被提取作为第二字符串。如图13D中示例所示,在字符1340、字符1342、以及字符1344 (目标字符1342、其前面字符1340、以及其后面字符1344)的情况下,目标字符1342的识别候选字符1346被增加。增加候选字符的目的是,当在通过字符识别模块110执行的字符识别处理中预定数目的识别候选(例如,仅一个字符)被输出为针对每个字符图像的识别候选时,针对容易被不正确识别的字符增加一个候选字符来作为识别字符串115。例如,在通过校正后的识别字符串155的进一步语言处理(例如,采用其他语言字典的匹配处理,诸如词法分析)做出校正的情况下,不是使用校正后的识别字符串155作为最终校正结果,而是可以增加作为字符识别结果的字符候选。
[0052]校正指令解释模块140进行的解释处理是任意下列指令或其组合:字符合并指令、字符分离指令、字符交换指令、以及字符候选增加指令(例如,字符合并指令和字符分离指令的组合、字符交换指令和字符候选增加指令的组合等)。
[0053]在校正指令包括字符合并指令和字符分离指令的情况下,校正指令解释模块140可确定字符合并指令的第二字符串和字符分离指令的第一字符串是否彼此相同。该“确定字符合并指令的第二字符串和字符分离指令的第一字符串是否彼此相同”被这样做是因为,当对同一字符做出合并指令和分离指令时,很有可能没有做出期望的校正。例如,很有可能返回了最初识别的字符。
[0054]如果第二字符串和第一字符串彼此相同,则可以去除相应的合并指令和分离指令之一。或者,可以安排为,对于单个识别字符串115,产生已通过合并指令校正的校正后的识别字符串155和已通过分离指令校正的校正后的识别字符串155。结果是,这两个字符串(经过合并指令的字符串和经过分离指令的字符串)被作为校正结果输出。理所应当的,当存在多对合并指令和分离指令时,产生了数目与校正指令和分离指令的组合的数目相同的校正指令串。结果是,输出了其数目等于该组合的数目的校正后的识别字符串155。
[0055]校正指令执行模块150被连接至字符识别模块110和校正指令解释模块140。校正指令执行模块150根据通过校正指令解释模块140解释的校正指令来校正识别字符串115。此处的校正处理,在第一字符串存在于识别字符串115内的情况下,将识别字符串115内的部分或全部的第一字符串转换为第二字符串。为了获知“第一字符串存在于识别字符串115内的情况”,例如,可以使用图案匹配处理以从识别字符串中搜索第一字符串。
[0056]换句话说,校正指令执行模块150基于获取的校正命令和相应的校正参数来确定在识别字符串115内是否存在需要校正的字符串,如果这样的字符串存在,则根据校正命令和相应的校正参数做出校正。
[0057]图2是示出通过第一示例性实施例中的识别字符串校正模块120进行的处理示例(识别字符串校正处理的示例)的流程图。下面描述的处理流程是关于一个字符串的处理流程的说明,当多个字符串被处理时,按照所要求的字符串数目来重复从步骤S202直到步骤S218的处理。
[0058]在步骤S202,校正指令解释模块140从存储在校正指令存储模块130中的多个校正指令中选择一个校正指令。
[0059]在步骤S204,校正指令解释模块140解释在步骤S202中选择的校正指令的校正命令。如上所述,校正命令表示字符串的校正方法(上面提及的字符合并指令、字符分离指令、字符交换指令、或字符候选增加指令)。此处提及的“解释”意即确定校正命令表示上述哪种校正方法。根据校正指令的校正参数也被提取。
[0060]在步骤S206,校正指令执行模块150从接收自字符识别模块110的识别字符串115中选择校正字符串候选。
[0061]在步骤S208,校正指令执行模块150获取校正指令的校正参数。校正指令执行模块150从校正指令存储模块130获取在校正指令解释模块140解释的校正命令必需的校正参数。
[0062]在步骤S210,校正指令执行模块150确定校正字符串候选是否匹配通过校正指令执行模块150获取的校正参数。如果校正字符串候选匹配获取的校正参数,则处理前进到步骤S214,并且校正指令执行模块150根据由已在校正指令解释模块140解释的校正命令表示的校正方法来对校正字符串候选进行校正。如果校正字符串候选不匹配获取的校正参数,则处理进入步骤S212。
[0063]在步骤S212,校正指令执行模块150获取在校正指令解释模块140解释的校正命令的所有不同的校正参数,并且确定是否已做出了与校正字符串候选的匹配确定。如果已对所有获取的校正参数做出了匹配确定,则处理前进到步骤S216。如果未对所有获取的校正参数做出匹配确定,则处理返回到步骤S208并且针对下一个校正参数重复步骤S208的处理以及步骤S210的处理。
[0064]在步骤S216,校正指令执行模块150确定是否已处理了针对接收的识别字符串115的所有校正字符串候选。如果存在未处理的校正字符串候选,则处理返回步骤S206,并且针对新的校正字符串候选,重复从步骤S206直到步骤S214的处理。如果已处理了所有校正字符串候选,则处理前进到步骤S218。
[0065]在步骤S218,校正指令执行模块150确定是否已完成针对存储在校正指令存储模块130中的所有校正指令的处理。如果所有校正指令已完成,则校正指令执行模块150针对接收自字符识别模块110的识别字符串115,输出校正后的识别字符串155。如果存在未处理的校正指令,则处理进入步骤S202并且针对下一个校正指令重复从步骤S202直到步骤S216的处理。
[0066]图3A和图3B示出了存储在校正指令存储模块130中的校正指令(校正命令和校正参数)的具体示例。
[0067]图3A和图3B示出了作为校正指令之一的“合并指令”的具体示例。图3A中所示的“C0RRECT_MERGE”表示校正命令,图3B中所示的字符编码串“0x30a30x4e4d0x4f5c”表示校正命令“C0RRECT_MERGE”必需的校正参数。在该示例中,“0x30a30x4e4d”是第一字符串,而“0x4f5c”是第二字符串。图3A和图3B中所示的“合并指令”表示“如果字符编码03x30a3 (左部分)和字符编码0X4e4d (右部分)被放在一起,则这些码被合并为字符编码0x4f5c (左部分和右部分合并在一起)”的校正被执行。如已经描述的那样,校正指令存储模块130被配置为不仅存储图3B中所示的字符编码串、而且存储多个参数作为对应于校正命令“C0RRECT_MERGE”的校正参数,所述多个参数例如为,如图4A和图4B中所示,图4A中的“0x30a30x30d20x5316”,其为“如果字符编码0x30a3 (左部分)和字符编码0x30d2 (右部分)被放在一起,则这些码被合并为字符编码0x5316 (左部分和右部分合并在一起)”,图4B中的“0x30b70x4e3b0x6ce8”,其为“如果字符编码0x30b7 (左部分)和字符编码0x4e3b(右部分)被放在一起,则这些码被合并为字符编码0x6ce8 (左部分和右部分合并在一起)”,
坐坐寸寸ο
[0068]图5A和图5B示出了校正指令之一的“交换指令”的具体示例。正如图3A和图3B中所示的“合并指令”的示例一样,图5A中所示的“CORRECT_EXCHANGE”表示校正命令,并且图5B 中所示的字符编码串 “ 0x30cd0x30c80x30c40x30c3 ” 表示校正命令“ CORRECT_EXCHANGE ”必需的校正参数。在该示例中,“0x30cd0x30c80x30c4”是第一字符串,而“0x30c3”是第二字符串。图5A和图5B中所示的“交换指令”表示“在0x30cd (左部分)和0x30c8 (右部分)之间夹入的0x30c4(中间部分)被替换为0x30c3(小字号的中间部分)”的校正被执行。如图3A和图3B以及图4A和图4B,针对校正命令“CORRECT_EXCHANGE”,多个校正参数被存储在校正指令存储模块130中,并且如图6所示,例如,存储了诸如“0xffl30x67080x30ab0x30f5”之类的校正参数,其意即“在0xffl3 (左部分)和0x6708 (右部分)之间夹入的0x30ab (中间部分)被替换为0x30f5 (小字号的中间部分)”。自然,多个校正参数被存储在校正指令存储模块130中。
[0069]<第二示例性实施例>
[0070]在下面描述的第二示例性实施例中,将识别字符串校正模块120与校正指令分离,以使得能够在不用修改识别字符串校正模块120自身的情况下增加/删除校正指令。
[0071]图7是第二示例性实施例的配置示例的示意模块配置图。以相同的参考标记指代类似于第一示例性实施例中的部分,并且多余的说明将被省略(下文中同样如此)。校正指令接收模块730被连接至校正指令解释模块140以及校正指令数据710。
[0072]如图7中示例所示,类似于第一示例性实施例中的字符识别设备,在第二示例性实施例中的字符识别设备包括字符识别模块I1以及识别字符串校正模块120。在第二示例性实施例中的识别字符串校正模块120包括:校正指令接收模块730,其从外部校正指令数据710接收校正指令;校正指令解释模块140,其解释接收的校正指令;以及校正指令执行模块150,其针对接收自字符识别模块110的识别字符串115执行所解释的校正指令。校正指令解释模块140以及校正指令执行模块150类似于在本发明的第一示例性实施例中描述的那些模块。
[0073]图8是示出第二示例性实施例中的识别字符串校正模块120的处理示例(识别字符串校正处理的示例)的流程图。对于作为如图7中所示的存储在校正指令数据710中的外部数据的校正指令而言,一条校正指令数据包括,例如,校正命令和校正命令必需的校正参数,如图9中所示。换句话说,每个校正指令包括校正命令和校正参数。
[0074]在步骤S802,校正指令接收模块730从校正指令数据710接收校正指令。
[0075]在步骤S804,校正指令解释模块140解释接收的校正指令。换句话说,校正指令解释模块140确定校正指令数据710中的校正命令表示哪种校正方法并且获取相应的校正参数。
[0076]在步骤S806,校正指令执行模块150从接收自字符识别模块的识别字符串115中选择校正字符串候选。
[0077]在步骤S808,校正指令执行模块150确定校正字符串候选是否匹配校正参数。如果校正字符串候选匹配校正参数,则处理前进到步骤S810,并且校正指令执行模块150根据由已在校正指令解释模块140解释的校正命令表示的校正方法来对校正字符串候选进行校正。如果校正字符串候选不匹配校正参数,则处理返回步骤S802,并且针对在校正指令数据710中的新的校正指令,重复从步骤S802直到步骤S806的处理。
[0078]在步骤S812,校正指令执行模块150确定是否已经处理了针对接收的识别字符串115的所有校正字符串候选。如果存在未处理的校正字符串候选,则处理返回步骤S806,并且针对新的校正字符串候选,重复从步骤S806直到步骤S810的处理。如果已处理所有的校正字符串候选,则处理前进到步骤S814。
[0079]在步骤S814,校正指令执行模块150确定是否已完成针对所有校正指令数据710的处理。如果已完成针对所有校正指令数据710的处理,则校正指令执行模块150针对接收自字符识别模块110的识别字符串115,输出校正后的识别字符串155。如果存在未处理的校正指令数据710,则处理返回步骤S802并且针对下一个校正指令数据710,重复从步骤S802直到步骤S812的处理。
[0080]在第二示例性实施例中,将校正指令数据710布置在识别字符串校正模块120的外部以将校正指令与识别字符串校正模块120分开,由此使得不用修改识别字符串校正模块120就能增加/删除校正指令。通过这种布置,对错误识别的新校正变得容易。
[0081]〈第三示例性实施例〉
[0082]图10是第三示例性实施例的配置示例的示意模块配置图。识别字符串校正模块120包括校正指令接收模块1020、校正指令存储模块1030、校正指令解释模块140、以及校正指令执行模块150。校正指令接收模块1020被连接至校正指令存储模块1030以及校正指令列表1010。校正指令存储模块1030被连接至校正指令解释模块140以及校正指令接收模块1020。
[0083]如图10所示,类似于第一示例性实施例,在第三示例性实施例中,字符识别模块110与识别字符串校正模块120连接。在第三示例性实施例中的识别字符串校正模块120包括:校正指令接收模块1020,其接收作为外部文件的校正指令列表1010 ;校正指令存储模块1030,其基于预定的数据结构存储由校正指令接收模块1020接收的校正指令列表1010 ;校正指令解释模块140,其解释所接收的校正指令;以及校正指令执行模块150,其针对从字符识别模块110接收的识别字符串115执行所解释的校正指令。
[0084]校正指令接收模块1020读取作为识别字符串校正模块120的外部文件的校正指令列表1010,并且基于预定的数据结构,在校正指令存储模块1030中存储表示多个校正指令的校正命令以及校正命令必需的校正参数。
[0085]校正指令存储模块1030基于预定的数据格式存储校正指令。在校正指令存储模块1030中的数据格式可以是,例如,如图9所示的仅包括校正命令和校正参数的简单数据列表结构。然而,在校正指令数目非常庞大的情况下,优选地使用诸如散列数据结构(hashdata structure)之类的实现高效搜索的数据结构。
[0086]图11是示出了第三示例性实施例中的识别字符串校正模块120的处理示例(识别字符串校正处理的示例)的流程图。在此处的处理示例中,说明了第三示例性实施例中的识别字符串校正模块120所进行的识别字符串校正处理的示例,其中校正指令存储模块1030的数据结构是散列结构,在该结构中作为校正参数的字符编码被用作关键字而校正命令是值。
[0087]在步骤S1102,校正指令解释模块140将从字符识别模块110接收的识别字符串115的目标字符的字符编码用作关键字,并且搜索存储在校正指令存储模块1030中的校正命令。
[0088]在步骤1104,校正指令解释模块140在存在与关键字匹配的校正命令的情况下前进到步骤1108,并在不存在与关键字匹配的校正命令的情况下,校正指令解释模块140前进到识别字符的下一个目标(步骤S1106)并且重复步骤S1102的处理。
[0089]在步骤S1108,校正指令解释模块140在发现的校正命令之中选择预定的校正命令。校正命令的选择应当遵循诸如已预先确定的校正指令的执行顺序之类的规则。
[0090]在步骤S1110,校正指令解释模块140解释选择的校正命令。换句话说,校正指令解释模块140确定校正命令表示的哪种校正方法,并且获取与存储在校正指令存储模块1030中的校正命令关联的对应校正参数。
[0091]在步骤S1112,校正指令执行模块140从接收自字符识别模块110的识别字符串115中选择在步骤1110解释的校正命令所必需的校正字符串候选。
[0092]在步骤SI 114,校正指令执行模块150确定校正字符串候选是否匹配校正参数。如果校正字符串候选匹配校正参数,则处理前进到步骤S1116,并且校正指令执行模块150根据由已在校正指令解释模块140解释的校正命令表示的校正方法来对校正字符串候选进行校正。如果校正字符串候选不匹配校正参数,则处理前进到识别字符的下一个目标(步骤S1106)。处理返回步骤S1102并且重复从步骤S1102直到步骤S1112的处理。
[0093]在步骤S1118,校正指令执行模块150确定是否已处理了针对接收的识别字符串115的所有校正字符串候选。如果存在未处理的字符串候选,则处理前进到识别字符的下一个目标(步骤S1106)。处理返回步骤S1102并且重复从步骤S1102直到步骤S1116的处理。如果已处理了所有校正字符串候选,则处理前进到步骤S1120。
[0094]在步骤S1120,校正指令执行模块150确定是否已完成识别字符串115必需的所有校正指令的处理。如果所有的校正指令已完成,则校正指令执行模块150针对接收自字符识别模块110的识别字符串115,输出校正后的识别字符串155。如果存在未处理的校正指令,则处理返回识别字符串115的开始(步骤S1122)并重复从步骤S1102直到步骤S1118的处理。
[0095]图12示出了在第三示例性实施例中的校正指令列表1010的具体示例,其被准备为外部文件。
[0096]在图12中所示的校正指令列表1010的具体示例中,在列表的第一行和最后一行分别描述了 “ START ”和“END ”。在第一行的“ START ”表示接下来的描述是校正指令列表的主体并且“START”之前的描述不涉及。同样,最后一行的“END”表示直到“END”为止的描述是校正指令列表主体并且在“END”之后的描述不涉及。“START”之前或“END”之后可具有对用户有用的信息,例如,校正指令列表的版本信息或校正指令列表主体的描述方法。
[0097]在“START”和“END”之间的夹入部分是校正指令列表主体,其每行具有“校正命令”和相应的校正命令必需的“校正参数”。例如,有如下校正指令:“左侧部分”彳和“右侧部分”匕两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”化;“左侧部分M和“右侧部分”壬两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”任;“左侧部分”彳和“右侧部分”左两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”佐;“左侧部分”彳和“右侧部分”右两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”佑;“左侧部分”彳和“右侧部分”乍两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”作;“左侧部分” 和“右侧部分”主两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”注;“左侧部分” 和“右侧部分”隼两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”準;“左侧部分” '>和“右侧部分”皮两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”波;“左侧部分” 和“右侧部分”舌两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”活;“左侧部分” 和“右侧部分”凡两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”汎;“左侧部分” 和“右侧部分”太两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”汰;“左侧部分” '>和“右侧部分”及两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”汲;“左侧部分” '>和“右侧部分”屯两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”沌;“左侧部分” '>和“右侧部分”中两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”沖左侧部分”'> 和“右侧部分”少两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”沙;“左侧部分” 和“右侧部分”尺两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”沢;“左侧部分” 和“右侧部分”末两个字符被合并为“通过将这两个字符组合在一起获得的一个字符”沫;以及“左侧字符” +、“中间字符” 以及“右侧字符”卜这三个字符被替换为“通过在中间字符采用小字号的情况下将这三个字符组合在一起而获得的一个字符”專'7卜。
[0098]在第三示例性实施例中的校正指令接收模块1020读取夹在“START”和“END”之间的每行,将读取的行转换为预定数据结构(例如,散列结构)并将具有预定数据结构的转换后的数据存储到校正指令存储模块1030。
[0099]在第三示例性实施例中,校正指令列表1010被布置在识别字符串校正模块120的外部,以将校正指令与识别字符串校正模块120分开,由此使得不用修改识别字符串校正模块120就可增加/删除校正指令。通过这种布置,对错误识别的新校正变得容易。此外,即使在校正指令数目增加的情况下,也能够通过在校正指令存储模块1030中保留预定数据结构的校正指令以抑制对校正错误识别的处理时间的增加。
[0100]参考图14的同时,也将对示例性实施例的信息处理设备的硬件配置示例说明如下。图14所示的配置包括,例如,个人计算机(PC)等,其包括诸如扫描仪之类的数据读取部分1417以及诸如打印机之类的数据输出部分1418。
[0101]中央处理单元(CPU) 1401是根据描述了在上述示例性实施例中说明的不同模块(即,字符识别模块110、识别字符串校正模块120、校正指令存储模块130、校正指令解释模块140、校正指令执行模块150、校正指令接收模块730、校正指令接收模块1020、以及校正指令存储模块1030)的执行序列的计算机程序来执行处理的控制器。
[0102]只读存储器(ROM) 1402存储CPU1401使用的程序和操作参数。随机存取存储器(RAM) 1403存储在CPU1401的执行过程中使用的程序以及参数等,其在CPU1401的执行过程中以适当的方式变化。CPU1401、R0M1402、以及RAM1403通过包括CPU总线等的主机总线1404彼此连接。
[0103]主机总线1404经由桥接器1405连接至外部总线1406,例如,外部部件互连/接口(PCI)总线。
[0104]键盘1408和指示装置1409 (例如鼠标)是操作者操作的输入装置。显示器1410可以是液晶显示器、阴极射线管显示器(CRT)等,其以文本或图像的形式显示各种类型的信肩、O
[0105]硬盘驱动器(HDD) 1411具有内建的硬盘,其驱动该硬盘并记录或再现由CPU1401执行的程序和信息。在该硬盘中存储了识别字符串115、校正后的识别字符串155、校正指令。该硬盘也存储包括其它各种数据处理程序的各种计算机程序。
[0106]驱动器1412读取记录在插入式可移除记录介质1413 (例如,磁盘、光盘、磁光盘、或半导体存储器)中的数据或程序,并将数据和程序提供给经由接口 1407、外部总线1406、桥接器1405、以及主机总线1404连接的RAM1403。可移除记录介质1413可如硬盘那样用作数据存储区。
[0107]连接端口 1414是允许连接至外部连接装置1415并具有针对USB、IEEE1394等的连接部分的端口。连接端口 1414经由接口 1407、外部总线1406、桥接器1405、主机总线1404等连接至CPU1401等。通信部分1416连接至通信线路,其执行与外部的数据通信处理。数据读取部分1417例如是扫描仪,并且执行文档的读取处理。数据输出部分1418例如是打印机,并且执行文档数据的输出处理。
[0108]图14所示的信息处理设备的硬件配置示例是配置的一个示例,并且示例性实施例不必限于图14所示的配置。只要其能够执行在任意前述示例性实施例中描述的模块,可以是任何配置。例如,部分模块可以通过专用硬件配置,例如,专用集成电路,或者部分模块可以布置在内部系统内并通过通信线路连接。作为替代,图14所示的多个系统可以经由通信线路彼此连接以便在协作中相互操作。此外,这些系统可以集成在复印机、传真机、扫描仪、打印机、或多功能机器(具有扫描仪、打印机、复印机、传真机等之中两个或以上功能的图像处理设备)中。
[0109]在上面提及的示例性实施例中,给出字符图像数据105以作为字符识别模块110的识别目标,然而,识别目标可以是在线字符识别中手写顺序的矢量数据。在这种情况下,字符识别模块110可以针对手写顺序的矢量数据来执行书写字符识别处理。
[0110]在字符合并指令、字符分离指令、字符交换指令、以及字符候选增加指令之间,预定类型的校正指令可以被首先执行。例如,可以让字符候选增加指令在其它校正指令之前执行。换句话说,在字符候选增加指令被执行之后的字符串(目标字符在其中已被替换为增加的字符的字符串)可以作为另一个识别字符串115而被识别字符串校正模块120处理。
[0111]上述程序可以存储在记录介质上并提供,或者该程序可以通过通信提供。在这种情况下,例如,上述程序可以认为是“记录了程序的计算机可读取记录介质”的发明。
[0112]“记录了程序的计算机可读取的记录介质”意即计算机可读取的记录介质,其记录程序,用于程序的安装、执行、以及分发。
[0113]记录介质是例如数字多功能盘(其包括DVD论坛设置的标准“DVD-R、DVD-RW、DVD-RAM等”,以及DVD+RW设置的标准“DVD+R、DVD+RW等”)、光盘(CD)(其包括只读存储器(⑶-ROM)、可录式⑶(⑶-R)、可重写式⑶(⑶-RW)等)、蓝光盘?、磁光盘(MO)、软盘(FD)、磁带、硬盘、只读存储器(ROM)、电可擦除可编程只读存储器(EEPR0M?)、闪速存储器、随机存取存储器(RAM)、安全数字(SD)存储卡,等等。
[0114]上述程序或部分程序可以记录在上述记录介质上,被存储并分发。此外,该程序可以通过通信传输,例如,用于局域网(LAN)、城域网(MAN)、广域网(WAN)、互联网、内联网、夕卜联网等的有线网络或无线通信网络,或者上述网络组合的传输介质。作为替代,该程序或部分程序可以通过载波发送。
[0115]上述程序可以是另一个程序的部分或者可以与不同程序一起记录在记录介质上。同样,所述程序可以被分割并记录在多个记录介质上。只要它们是可重新存储的,它们可以以任何格式存储,例如压缩或加密。
[0116]本发明的示例性实施例的前述描述被提供作为示出和描述的目的。其并非意在穷举或将本发明限制为所公开的精确形式。显然,很多修改和变化对于本领域的技术人员是很明显的。实施例被选取和描述以便最佳地说明本发明的原理及其实际应用,由此使得本领域的其他技术人员理解本发明的不同实施例并且各种修改同样适用于所构思的特定用途。本发明的范围由权利要求及其等同物限定。
【权利要求】
1.一种信息处理设备,其包括: 存储单元,其存储多个校正指令; 解释单元,其解释存储在所述存储单元中的校正指令;以及 校正单元,其根据由所述解释单元解释的所述校正指令,来校正识别字符串, 其中所述解释单元确定所述校正指令的类型,并且根据所述校正指令的类型来提取第一字符串和第二字符串,所述第一字符串包括作为所述校正指令的目标的一个或多个字符,所述第二字符串是通过对所述第一字符串的一部分或全部执行转换而获得的,并且其中在所述第一字符串存在于所述识别字符串中的情况下,所述校正单元将所述识别字符串内的所述第一字符串的一部分或全部转换为所述第二字符串。
2.根据权利要求1所述的信息处理设备, 其中所述校正指令包括字符合并指令和字符分离指令, 其中在所述校正指令是字符合并指令的情况下,所述解释单元提取多个字符的串作为所述第一字符串并且提取一个字符作为所述第二字符串,并且 其中在所述校正指令是字符分离指令的情况下,所述解释单元提取一个字符作为所述第一字符串并且提取多个字符的串作为所述第二字符串。
3.根据权利要求1或2所述的信息处理设备, 其中所述校正指令包括字符交换指令和候选字符增加指令, 其中在所述校正指令是字符交换指令的情况下,所述解释单元提取包括目标字符以及在所述目标字符前面和后面的字符在内的字符串作为所述第一字符串,并且提取替换字符以及在所述替换字符前面和后面的字符作为所述第二字符串,并且 其中在所述校正指令是候选字符增加指令的情况下,所述解释单元提取包括目标字符以及在所述目标字符前面和后面的字符在内的字符串作为所述第一字符串,并且提取作为所述目标字符的识别候选而将被增加的字符作为所述第二字符串。
4.根据权利要求2或对权利要求2进行引用的权利要求3所述的信息处理设备, 其中在所述字符合并指令和所述字符分离指令作为所述校正指令而存在的情况下,所述解释单元确定所述字符合并指令的所述第二字符串和所述字符分离指令的所述第一字符串是否彼此相同。
5.一种信息处理方法,其包括步骤: 存储多个校正指令; 解释存储的校正指令;以及 根据所解释的校正指令来校正识别字符串, 其中所述解释步骤确定所述校正指令的类型,并且根据所述校正指令的类型来提取第一字符串和第二字符串,所述第一字符串包括作为所述校正指令的目标的一个或多个字符,所述第二字符串是通过对所述第一字符串的一部分或全部执行转换而获得的,并且其中在所述第一字符串存在于所述识别字符串的情况下,所述校正步骤将所述识别字符串内的所述第一字符串的一部分或全部转换为所述第二字符串。
【文档编号】G06K9/20GK104346611SQ201410083844
【公开日】2015年2月11日 申请日期:2014年3月7日 优先权日:2013年8月6日
【发明者】久保田聪, 木村俊一 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1