字符识别装置的制作方法

文档序号:6577561阅读:105来源:国知局
专利名称:字符识别装置的制作方法
技术领域
本发明涉及识别票据中字符框内的字符的字符识别装置。
背景技术
通常,字符识别装置读取手写字符或铅字作为彩色图像数据,并根 据该彩色图像数据与预先登记的字符图案之间的对照结果来识别字符。
当在这种字符识别装置中识别票据中字符框内的字符时,在确定字 符框之后,从票据的彩色图像数据中去除该确定的字符框而对剩下的字 符进行识别。
此外,在确定字符框时,需要由操作者预先登记字符框信息(例如, 字符框形状和字符框颜色等)(例如参照专利文献1)。
此外,还存在如下字符识别装置,该字符识别装置对于票据的字符
框使用脱落色(dropout color),在字符识别时去除该脱落色而对剩下的 字符进行识别。此时,因为在字符识别装置中己经登记有脱落色的信息, 所以不需要由操作者登记字符框信息。
专利文献1日本特开昭61-253587号公报 但是,在如上所述由操作者预先登记字符框信息的情况下,通常, 操作者需要一边观察显示器上的票据的彩色图像数据一边操作鼠标或键 盘等来指定字符框形状和字符框颜色等,存在操作者的工作量变多的问 题。
并且,在字符框使用脱落色的情况下,存在无法识别使用了该脱落 色以外的颜色的字符框内的字符的问题。

发明内容
因此,本发明的目的在于,提供一种能够减少字符识别时操作者的工作量、并且对字符框使用的颜色没有限制的字符识别装置。 为了解决上述课题,在本发明中采用了如下结构。 艮口,本发明的字符识别装置具有图像读取单元,其读取票据作为 第l彩色图像数据;显示单元,其显示所述第l彩色图像数据;分析范围 指定单元,其提取所述显示单元上显示的第l彩色图像数据中、与操作者 所指定的分析范围对应的第2彩色图像数据;第l线段提取单元,其根据 所述第2彩色图像数据中具有直线性的数据,从所述第2彩色图像数据中 提取线段;背景去除单元,其从所述第2彩色图像数据中去除背景而作为 第3彩色图像数据;第l格线提取单元,其从所述第3彩色图像数据中提取 由所述第l线段提取单元提取出的线段的代表色,合并与该代表色相同颜 色的线段来提取格线;分离单元,其从所述第3彩色图像数据中去除由所 述第l格线提取单元提取出的格线而分离为字符和字符框;第2线段提取 单元,其根据所述第3彩色图像数据中具有直线性的数据和由所述分离单 元分离出的字符框的颜色,从所述第3彩色图像数据中提取线段;第2格 线提取单元,其根据由所述第2线段提取单元提取出的线段,从所述第3 彩色图像数据中提取格线;字符框确定单元,其根据由所述第2格线提取 单元提取出的格线和预先登记的字符框形状图案来确定字符框;第l字符 框去除单元,其根据由所述分离单元分离出的字符的颜色和由所述字符 框确定单元确定的字符框的颜色,保留字符与字符框的重叠部分,并从 所述第3彩色图像数据中去除字符框来提取字符;以及字符识别单元,其 识别由所述第1字符框去除单元提取出的字符。
此外,可以通过如下方式构成所述第2格线提取单元具有第3格 线提取单元,其从所述第3彩色图像数据中提取与由所述第2线段提取单 元提取出的线段的代表色相同颜色的线段,合并这些提取出的线段来提 取格线;确定单元,其确定由所述第3格线提取单元提取出的格线中、可 能还存在连接关系的部位;以及连接单元,其根据由所述确定单元确定 的部位的边缘成分来判断所述部位是否能够进行连接,在其判断结果为 能够进行连接的情况下,连接所述部位来提取格线。
此外,可以通过如下方式构成所述字符框确定单元具有间隔表生成单元,其计算在从所述第2格线提取单元所提取出的格线的各纵线中 选择任意两条纵线的情况下、所有组合各个中所述任意两条纵线之间的
间隔,生成表示该计算出的间隔的间隔表;投票表生成单元,其生成表 示所述间隔表中示出的间隔的总数的投票表;间隔暂定单元,其将所述 投票表中示出的总数较大的间隔暂定为所述字符框的间隔;间隔变更单 元,其将所述字符框的形状图案的间隔变更为由所述间隔暂定单元暂定 的间隔;以及确定单元,其进行由所述间隔变更单元变更间隔后的字符 框形状图案与由所述第2格线提取单元提取出的格线之间的图案匹配,并 根据该图案匹配的结果来确定字符框。
此外,可以通过如下方式构成本发明的字符识别装置具有第2字符 框去除单元,该第2字符框去除单元从所述第3彩色图像数据中去除根据 操作者预先登记的字符框信息而确定的字符框,来提取字符,该字符识 别装置将与所述字符框确定单元所确定的字符框对应的字符框信息反映 到所述操作者预先登记的字符框信息中。
此外,本发明的字符框确定装置用于确定票据内的字符框,该字符 框确定装置具有线段提取单元,其从所述票据的图像数据中提取与字 符框对应的线段;间隔表生成单元,其计算在从所述线段提取单元所提 取出的线段的各纵线中选择任意两条纵线的情况下、所有组合各个中所 述任意两条纵线之间的间隔,生成表示该计算出的间隔的间隔表;投票 表生成单元,其生成表示所述间隔表中示出的间隔的总数的投票表;间 隔暂定单元,其将所述投票表中示出的总数较大的间隔暂定为所述字符 框的间隔;间隔变更单元,其将预先登记的字符框形状图案的间隔变更 为由所述间隔暂定单元暂定的间隔;以及确定单元,其进行由所述间隔 变更单元变更间隔后的字符框形状图案与由所述线段提取单元提取出的 线段之间的图案匹配,并根据该图案匹配的结果来确定字符框。
根据本发明,在通过字符识别装置识别票据中字符框内的字符时, 能够减少操作者的工作量,并且对票据的字符框使用的颜色没有限制。


图l示出了本发明实施方式的字符识别装置。
图2是用于说明字符识别装置的动作的流程图。
图3示出了票据的彩色图像数据的显示画面例。
图4示出了字符与字符框的重叠部分的颜色。
图5示出了字符识别结果和字符框分析结果的显示画面例。
图6示出了在分辨率240dpi下0.1mm的字符框的彩色图像数据与RGB
信息之间的关系。
图7是用于说明利甩边缘成分的格线提取方法的流程图。
图8是用于说明利用边缘成分的格线提取方法的图。
图9是用于说明字符框确定方法的概念的图。
图10是用于说明字符框确定方法的流程图。
图ll示出了线段提取后各纵线的间隔的一例。
图12示出了间隔表的一例。
图13示出了投票表的一例。
图14示出了字符框的形状图案的一例。
图15是用于说明在预先登记的字符框信息中反映字符框的分析结果 时的动作的流程图。 标号说明
1:字符识别装置;2:图像输入部;3:图像读取部;4:图像显示 部;5:分析范围指定部;6:分类部;7:字符框确定部;8:字符框去 除部;9:字符识别部;10:分析结果显示部;11:字符框;12:票据; 13:显示器;14:结果显示栏;15:执行字符识别按钮。
具体实施例方式
以下,使用附图对本发明的实施方式进行说明。 图1示出了本发明实施方式的字符识别装置。
图1所示的字符识别装置1具有图像输入部2、图像读取部3、图像显 示部4、分析范围指定部5、分类部6、字符框确定部7、字符框去除部8、 字符识别部9以及分析结果显示部10。图2是用于说明字符识别装置1的动作的流程图。
首先,图像读取部3读取从扫描仪等图像输入部2输入的票据作为彩 色图像数据(第l彩色图像数据)(以下,简称为票据)(Sl)。
接下来,图像显示部4在显示器上显示图像读取部3所读取的票据 (S2)。在图3 (a)所示的例子中,在显示器13的上半部分显示票据12, 在显示器13的下半部分显示结果显示栏14,票据12示出可填写4位数金额 的字符框ll,结果显示栏14用于示出字符识别结果和字符框分析结果。 此外,在图3 (a)所示的例子中,在显示器13上显示有"执行字符识别" 按钮15,当通过操作者的鼠标或键盘等的操作而按下"执行字符识别"按 钮15时,开始字符框分析和字符识别。
接下来,分析范围指定部5读入显示器上显示的票据中、由操作者指 定的分析范围的彩色图像数据(第2彩色图像数据)(以下,简称为分析 范围)(S3)。例如,如图3 (b)所示,操作者通过一边观察显示器13 上显示的票据12—边操作鼠标或键盘等,来粗略调整分析范围16的位置 和大小,从而至少使字符框11进入到分析范围16内。
接下来,分类部6根据在S3中读入的分析范围内具有直线性的数据, 从分析范围中提取线段(构成字符框的线段、构成字符的线段、以及构 成字符框和字符的线段以外的线段(噪声)等)(S4:线段一次提取)。
接下来,分类部6从S4中提取出的线段以外的分析范围中去除与背景 色(例如,在S4中提取出的线段以外的分析范围内的颜色中最多的颜色) 对应的彩色图像数据(以下简称为背景)(S5)。
接下来,分类部6在通过S5去除了背景的彩色图像数据(第3彩色图 像数据)中,提取通过S4提取出的线段中代表色(例如,去除了背景后 的彩色图像数据内的线段颜色中最多的颜色)的线段,合并该提取出的 线段来提取格线(S6:格线一次提取)。这样,通过合并代表色的线段 来提取格线,能够抑制由于每个扫描仪的颜色偏差或扫描仪的光源的变 化而产生的色差的影响。此外,在该格线中包含有字符的一部分。
接下来,分类部6从S6中提取出的格线中提取单元格(矩形)(S7)。 另外在该单元格中也包含有字符的一部分。接下来,分类部6使用在S6中提取出的格线或者在S7中提取出的单元 格而暂定字符框,从通过S5去除了背景的彩色图像数据中去除该暂定的 字符框(S8),将分析范围大致分类为背景、字符框和字符(S9)。此 时,去除了所分类的字符的一部分。
接下来,字符框确定部7利用在S5中去除了背景的彩色图像数据内具 有直线性的数据、和在S9中分类出的字符框的颜色,从通过S5去除了背 景的彩色图像数据中提取构成字符框的线段(S10:线段二次提取)。
接下来,字符框确定部7根据在S10中提取出的线段来提取格线(Sl 1: 格线二次提取)。
接下来,字符框确定部7根据在S11中提取出的格线和基于该格线而 成的单元格,将分析范围内的字符框确定为单框、梯形框或者单字框中 的任意一种(S12)。
接下来,字符框去除部8根据在S9中分类出的字符的颜色以及在S12 中确定的字符框的颜色,保留字符与字符框的重叠部分,并从通过S5去 除了背景的彩色图像数据中去除字符框来提取字符(S13)。例如,如图 4所示,在S9中分类出的字符和在S12中确定的字符框重叠部分的颜色与 字符颜色和字符框颜色均不相同,因此,通过保留该重叠部分的颜色, 并从通过S5去除了背景色的彩色图像数据中去除在S12中确定的字符框
的颜色的彩色图像数据,能够仅提取出字符。
接下来,字符识别部9对在S13中提取出的字符进行识别(S14)。例 如,可以通过能识别手写字符和铅字的现有字符识别技术来进行字符识 别。此外,也可以预先登记字符属性,并根据该字符属性来进行字符识 别。
接下来,分析结果显示部10在显示器上显示在S14中识别出的字符 (字符识别结果)以及在S12中确定的字符框的字符框信息(字符框形状 图案、孛符框颜色、字符框线型、字符框粗细、字符框框数、字符框大 小、字符框坐标)(S15)。在图5所示的例子中,在显示器13所显示的 结果显示栏14上显示了如下内容"字符识别结果7650、字符框形状图
案单字框、字符框颜色黑色、字符框线型实线、字符框粗细lmm、
10字符框框数4、字符框大小与所显示的框一致、字符框坐标与所显 示的框一致"。
这样,在本实施方式的字符识别装置l中,首先将票据的彩色图像数 据中由操作者指定的分析范围大致分类为背景、字符框以及字符,根据 该分类结果高精度地确定字符框,然后从去除背景后的彩色图像数据中 去除该确定的字符框,对剩下的字符进行字符识别,因此能够提高字符 框内的字符识别精度。由此,操作者不需要预先登记字符框信息,因此 能够减少字符识别时操作者的工作量。
并且,在本实施方式的字符识别装置l中,采用了根据票据的彩色图 像数据来确定字符框的结构,因此对字符框使用的颜色没有限制。
另外,在用于读取票据的彩色图像数据的扫描仪的分辨率为240dpi、 且该票据中字符框的粗细为0.1mm时,字符框的彩色图像数据以l点为单 位,因此读取不到位于扫描仪的CCD摄像元件之间的字符框的彩色图像 数据,难以如S6那样仅依靠代表色来提取所有格线。
因此,如图6所示,对于这种在分辨率240dpi下0.1mm的字符框的彩 色图像数据,由于与RGB中的任意一个信息反应,因此考虑利用边缘成 分来提取格线。
图7是用于说明利用边缘成分的格线提取方法的流程图。
首先,如图8 (a)所示,在通过扫描仪等读取的票据的彩色图像数 据中由操作者指定的分析范围内,提取线段(ST1)。例如,如图2中的
S4所示,根据分析范围内具有直线性的数据,从分析范围中提取线段(构 成字符框的线段、构成字符的线段、以及构成字符框和字符的线段以外 的线段(噪声)等)。
接下来,如图8 (b)所示,提取在ST1中提取出的线段中代表色的线 段,合并该提取出的线段来提取格线(ST2)。
接下来,如图8 (c)所示,确定在ST2中提取出的格线中、可能还存 在连接关系的部位(虚线圆部分)(ST3)。例如,根据在ST2中提取出 的格线位置、格线颜色、格线粗细、格线方向等来确定可能还存在连接 关系的部位。接下来,按照图8 (d)所示的虚线圆部分的放大图那样,对在ST3 中确定的部位实施边缘滤波(ST4)。
此后,如图8 (e)所示,在ST3中确定的部位处、实施边缘滤波后的 彩色图像数据的浓淡差大于等于规定阈值的情况下,合并该彩色图像数 据来提取最终的格线(ST5)。
根据图7所示的格线提取方法,即使扫描仪的分辨率为240dpi、且字 符框的粗细为O.lmm,也能够高精度地提取出与该字符框对应的格线。
此外,也可以在图2的S11中提取格线时利用图7所示的格线提取方 法。g口,可以如下进行首先在图7的ST2中,合并在图2的S10中提取出 的线段来提取格线,接着在图7的ST3中,确定该提取出的格线中可能还 存在连接关系的部位,然后在图7的ST4中,对在ST3中所确定的部位实施 边缘滤波,之后在图7的ST5中,在实施边缘滤波后的彩色图像数据的浓 淡差大于等于规定阈值的情况下,合并该彩色图像数据来提取格线,在 图2的S11中,根据该提取出的格线来确定字符框。
此外,例如在以下等情况下无法将字符框成功确定为单框、梯形框 或者单字框中的任意一种,g卩由于字符框较细从而没有成功提取出格
线;由于字符框为虚线从而没有成功提取出格线;由于填写到字符框中 的字符的颜色与字符框的颜色相同从而没有成功提取出格线;没有成功 提取出与进行了装饰的字符框对应的格线;以及由于字符框纵线之间的 间隔不是等间隔从而没有成功提取出格线。
因此,针对这样无法成功确定字符框的情况,例如考虑到如下方式 首先从图9 (a)所示的票据的彩色图像中提取格线(图9 (b)),接着, 将该提取出的格线的各纵线间隔总数较多的间隔暂定为格线的各纵线彼 此之间的间隔(图9 (c):单点划线表示增补后的纵线、虚线表示删除 后的纵线),然后将预先登记的字符框的各纵线彼此之间的间隔转换为 所暂定的间隔,并根据该字符框和格线的图案匹配结果来确定字符框(图 9 (d"。
图10是用于说明这样确定字符框时的字符框确定方法的流程图。 首先,在通过扫描仪等读入的票据的彩色图像数据中、由操作者指
1定的分析范围内,提取线段(STE1)。
接着,对在STE1中提取出的线段中的各纵线分别赋予连续编号,并 且计算这些纵线彼此之间的间隔(点)(STE2)。例如,如图ll所示, 对在STE1中提取出的线段中的10条纵线分别赋予连续编号((1 ) (10))。 并且,在图ll所示的例子中,计算出如下结果(1)和(2)之间的间 隔为30、 (2)和(3)之间的间隔为60、 (3)和(4)之间的间隔为30、 (4)和(5)之间的间隔为15、 (5)和(6)之间的间隔为15、 (6)和 (7)之间的间隔为20、 (7)和(8)之间的间隔为IO、 (8)和(9)之 间的间隔为30、 (9)和(10)之间的间隔为60。
接着,根据在STE2中计算出的各间隔,计算在从各纵线中选择任意 两条纵线的情况下、所有组合各个中任意两条纵线的间隔,生成表示该 计算出的间隔的间隔表(STE3)。与图ll所示的各纵线(1) (10)对 应的间隔表例如为图12所示的间隔表。在图12所示的间隔表中,例如, 最上行中的"(1)"与最左列中的"(2)"相交处的数字表示以(1)的纵 线为基准时与(2)的纵线之间的间隔,最上行中的"(3)"与最左列中 的"(8)"相交处的数字表示以(3)的纵线为基准时与(8)的纵线之间 的间隔。
接着,针对分别使STE3中生成的间隔表的各间隔1/1后得到的值一张 一张地投票而生成投票表(STE4)。与图ll所示的各纵线(1) (10) 对应的投票表例如为图13 (a)所示的投票表。图13 (a)所示投票表的 最上行示出图12所示的间隔表的各间隔,最左列示出"1/1"及投票数的合 计(总数)。即,在图13 (a)所示的投票表中,例如示出了针对间隔"30" 投了5票的情况。
接着,针对分别使STE3中生成的间隔表的各间隔l/2后得到的值两张 两张地投票,并将该投票数加到STE4中生成的投票表中的投票数合计上 (STE5)。此外,在分别使STE3中生成的间隔表的各间隔l/2后得到的值 不能作为字符框间隔的情况下,不进行投票。在STE5中生成的投票表例 如为图13 (b)所示的投票表。在图13 (b)所示的投票表中,最上行示 出图12所示的间隔表的各间隔以及使这些间隔l/2后得到的值,最左列示出"i/r、 "i/2"、及投票数合计(总数)。g卩,在图i3 (b)所示的投票表
中,例如示出了针对间隔"30"投了 17票的情况。
接着,针对分别使STE3中生成的间隔表的各间隔l/3后得到的值三张 三张地投票,并将该投票数加到STE5中生成的投票表中的投票数合计上 (STE6)。此外,在分别使STE3中生成的间隔表的各间隔l/3后得到的值 不能作为字符框间隔的情况下,不进行投票。在STE6中生成的投票表例 如为图13 (c)所示的投票表。在图13 (c)所示的投票表中,最上行示 出图12所示的间隔表的各间隔、使这些间隔l/2后得到的值、以及使这些 间隔l/3后得到的值,最左列示出"1/1"、 "1/2"、 "1/3"、以及投票数合计(总 数)。即,在图13 (c)所示的投票表中,例如示出了针对间隔"30,,投了 32票的情况。此外,在本实施方式中,对STE3中生成的间隔表的各间隔 进行了3次分割,但是在STE3中生成的间隔表的各间隔的分割次数没有特 别限制。
接下来,将STE6中生成的投票表中投票数合计较多的值暂定为字符 框间隔(STE7)。例如,如图9 (a)所示,在字符框的各纵线为等间隔 的梯形框的情况下,将STE6中生成的投票数中投票数合计最多的"30"设 为字符框间隔。此外,在由单字框或间隔不同的字符框组合而成的情况 下,将STE6中生成的投票表中投票数合计最多的值和第2多的值暂定为字 符框间隔。
接下来,将预先登记的单框、梯形框以及单字框这3种字符框的形状 图案中纵线之间的间隔分别变更为STE7中暂定的间隔,而生成3种字符框
(STE8)。作为字符框的形状图案,例如考虑有以下等图案图14 (a) 所示的单框基本形、图14 (b)所示的单框变形l (没有上格线的框)、 图14 (c)所示的单框变形2 (利用了半格线的框)、图14 (d)所示的梯 形框基本形、图14 (e)所示的梯形框变形l (利用了粗线的框)、图14
(f)所示的梯形框变形2 (利用了虚线的框)、图14 (g)所示的单字框 基本形、图14 (h)所示的单字框变形l (第1个字符框和第2个字符框结 合起来的框)、以及图14 (i)所示的单字框变形2 (由于逗号而使第l个 字#:框和第2个字符框变形后的框)。
14接下来,利用STE1中提取出的线段和STE8中生成的3种字符框进行 图案匹配,并根据该图案匹配的结果来确定字符框(STE9)。例如,在 作为字符框的形状图案而将单框各纵线之间的间隔变更为"30"的情况 下,虽然在该字符框形状图案中没有分割线,但由于在STE1中提取出的 线段中存在多条分割线,因此判断为不是单框。此外,在作为字符框的 形状图案而将梯形框各纵线彼此之间的间隔暂定为"30"的情况下,由于 该字符框形状图案与STE1中提取出的线段基本一致,因此判断为梯形框, 如图9 (c)所示,在STE1中提取出的线段中增补不足的纵线,并且删除 多余的纵线而确定出字符框。当这样确定了字符框时,不进行其余的字 符框形状图案即单字框与STE1中提取出的线段之间的图案匹配。另外, 在作为字符框形状图案的单字框与STE1中提取出的线段之间的图案匹配 中,可以根据各纵线彼此之间的间隔的规则性来判断是否一致。
然后,登记在STE9中所确定的字符框的字符框信息(字符框形状图 案、字符框颜色、字符框线型、字符框粗细、字符框框数、字符框大小、 字符框坐标),以便在下次确定字符框时进行利用(STE10)。
根据图10所示的字符框确定方法,即使在以下情况下也能够成功确 定字符框由于字符框较细从而没有成功提取出格线;由于字符框为虚 线从而没有成功提取出格线;由于填写到字符框中的字符的颜色与字符 框的颜色相同从而没有成功提取出格线;没有成功提取出与进行了装饰 的字符框对应的格线;以及由于字符框纵线之间的间隔不是等间隔从而 没有成功提取出格线。
此外,在图2的S12中确定字符框时也可以使用图10所示的字符框确 定方法。艮P,也可以构成为在图10的STE2中,分别对S11中提取出的格 线的各纵线赋予连续编号并计算这些纵线彼此之间的间隔,此后,在进 行STE3 STE8以后,在STE9中,利用S11中提取出的格线和STE8中生成 的3种字符框进行图案匹配,根据该图案匹配的结果来确定字符框。
此外,也可以将通过图2的S12而得到的字符框的分析结果反映到操
作者预先登记的字符框信息中。
图15用于说明在将通过图2的S12而得到的字符框的分析结果反映到
15操作者预先登记的字符框信息中的情况下、字符识别装置l的动作的流程
图。此外,在进行图15的流程图的动作的字符识别装置1中,追加了如下
功能在从去除了背景的票据的彩色图像数据中去除基于预先登记的字 符框信息的字符框后,对剩下的字符进行字符识别。
首先,字符识别装置l使显示器显示通过扫描仪等读取的票据的彩色
图像数据(STEP1)。例如,在显示器上,在用于登记字符框信息的票据
定义工具上显示票据的彩色图像数据。
接着,字符识别装置l确认通过操作者的鼠标或键盘操作等、在显示
器上显示的票据的彩色图像数据中指定分析范围的情况(STEP2)。此时, 操作者大致指定至少包含所要进行分析的字符框的分析范围。
接着,字符识别装置l在确认到通过操作者的鼠标或键盘操作而按下 了显示器上显示的执行字符框分析按钮等时,对在STEP2中所指定的分析 范围进行字符框分析(STEP3)。此时,通过执行图2的S3 S12来进行 字符框分析。
接着,字符识别装置l在显示器上显示字符框分析结果即字符框信息 (STEP4)。例如,如图5所示,在显示器13的结果显示栏14上显示字符
框信息。
接着,在操作者对字符框信息进行了修改的情况下,字符识别装置l 根据操作者的修改指示来修改字符框信息(STEP5)。操作者确认分析结 果正确与否,当存在错误的地方时,通过鼠标和键盘操作对该地方进行 修改。此外,也可以采用操作者追加识别种类等字符框信息以外的信息 的结构。
然后,字符识别装置l在确认到通过操作者的鼠标或键盘操作而按下 了显示器上显示的定义存储按钮等时,将STEP3中得到的字符框信息或 STEP5中修改后的字符框信息反映到预先登记的字符框信息中(STEP6)。
以往,在操作者手动登记字符框信息的情况下,在用于登记字符框 信息的票据定义工具上,操作者按照每l个框进行描绘来指定显示器上显 示的票据的彩色图像数据的字符框。这样,由于操作者按照每l个框来指 定字符框,因此登记字符框信息十分耗时。并且,对于较细的字符框而言,由于要在显示器上使该字符框暂时放大,因此要花费相应的时间。 此外,由于采用了操作者手动指定字符框的结构,因此在一些情况下所 指定的分析范围与实际的字符框发生偏离从而无法准确地登记字符框信 息。
在按照图15所示的流程图工作的字符识别装置1中,操作者只需大 致指定分析范围,即可自动获得字符框信息,能够避免产生上述问题。
权利要求
1.一种字符识别装置,其特征在于,该字符识别装置具有图像读取单元,其读取票据作为第1彩色图像数据;显示单元,其显示所述第1彩色图像数据;分析范围指定单元,其提取所述显示单元上显示的第1彩色图像数据中、与操作者所指定的分析范围对应的第2彩色图像数据;第1线段提取单元,其根据所述第2彩色图像数据中具有直线性的数据,从所述第2彩色图像数据中提取线段;背景去除单元,其从所述第2彩色图像数据中去除背景而作为第3彩色图像数据;第1格线提取单元,其从所述第3彩色图像数据中提取由所述第1线段提取单元提取出的线段的代表色,合并与该代表色相同颜色的线段来提取格线;分离单元,其从所述第3彩色图像数据中去除由所述第1格线提取单元提取出的格线而分离为字符和字符框;第2线段提取单元,其根据所述第3彩色图像数据中具有直线性的数据和由所述分离单元分离出的字符框的颜色,从所述第3彩色图像数据中提取线段;第2格线提取单元,其根据由所述第2线段提取单元提取出的线段,从所述第3彩色图像数据中提取格线;字符框确定单元,其根据由所述第2格线提取单元提取出的格线和预先登记的字符框形状图案来确定字符框;第1字符框去除单元,其根据由所述分离单元分离出的字符的颜色和由所述字符框确定单元确定的字符框的颜色,保留字符与字符框的重叠部分,并从所述第3彩色图像数据中去除字符框来提取字符;以及字符识别单元,其识别由所述第1字符框去除单元提取出的字符。
2. 根据权利要求l所述的字符识别装置,其特征在于, 所述第2格线提取单元具有第3格线提取单元,其从所述第3彩色图像数据中提取与由所述第2 线段提取单元提取出的线段的代表色相同颜色的线段,合并这些提取出 的线段来提取格线;确定单元,其确定由所述第3格线提取单元提取出的格线中、可能还存在连接关系的部位;以及连接单元,其根据由所述确定单元确定的部位的边缘成分来判断所述部位是否能够进行连接,在其判断结果为能够进行连接的情况下,连接所述部位来提取格线。
3. 根据权利要求1或2所述的字符识别装置,其特征在于,所述字符框确定单元具有间隔表生成单元,其计算在从所述第2格线提取单元所提取出的格线 的各纵线中选择任意两条纵线的情况下、所有组合各个中所述任意两条 纵线之间的间隔,生成表示该计算出的间隔的间隔表;投票表生成单元,其生成表示所述间隔表中示出的间隔的总数的投 票表;间隔暂定单元,其将所述投票表中示出的总数较大的间隔暂定为所 述字符框的间隔;间隔变更单元,其将所述字符框的形状图案的间隔变更为由所述间 隔暂定单元暂定的间隔;以及确定单元,其进行由所述间隔变更单元变更间隔后的字符框形状图 案与由所述第2格线提取单元提取出的格线之间的图案匹配,并根据该图 案匹配的结果来确定字符框。
4. 根据权利要求1 3的任意一项所述的字符识别装置,其特征在于, 该字符识别装置具有第2字符框去除单元,该第2字符框去除单元从所述第3彩色图像数据中去除根据操作者预先登记的字符框信息而确定 的字符框,来提取字符,该字符识别装置将与所述字符框确定单元所确定的字符框对应的字 符框信息反映到所述操作者预先登记的字符框信息中。
5. —种字符框确定装置,其用于确定票据内的字符框,其特征在于,该字符框确定装置具有线段提取单元,其从所述票据的图像数据中提取与字符框对应的线段;间隔表生成单元,其计算在从所述线段提取单元所提取出的线段的 各纵线中选择任意两条纵线的情况下、所有组合各个中所述任意两条纵 线之间的间隔,生成表示该计算出的间隔的间隔表;投票表生成单元,其生成表示所述间隔表中示出的间隔的总数的投 票表;间隔暂定单元,其将所述投票表中示出的总数较大的间隔暂定为所 述字符框的间隔;间隔变更单元,其将预先登记的字符框形状图案的间隔变更为由所述间隔暂定单元暂定的间隔;以及确定单元,其进行由所述间隔变更单元变更间隔后的字符框形状图案与由所述线段提取单元提取出的线段之间的图案匹配,并根据该图案 匹配的结果来确定字符框。
全文摘要
字符识别装置。本发明的目的在于提供一种能够减少字符识别时操作者的工作量、并且对字符框所使用的颜色没有限制的字符识别装置。首先将票据的彩色图像数据中由操作者指定的分析范围大致分类为背景、字符框及字符,根据该分类结果高精度地确定字符框,然后从去除了背景后的彩色图像数据中去除字符框,并对剩下的字符进行字符识别。
文档编号G06K9/34GK101551861SQ200910131440
公开日2009年10月7日 申请日期2009年3月30日 优先权日2008年3月31日
发明者小原胜利, 川岛哉, 江口真一, 矢吹真纪, 金元浩一, 长谷川将平 申请人:富士通先端科技株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1