字符辨识装置以及识别函数生成方法

文档序号:9226045阅读:532来源:国知局
字符辨识装置以及识别函数生成方法
【技术领域】
[0001] 本发明设及光学性字符辨识技术,特别设及特征空间上的字符的识别技术。
【背景技术】
[0002] 作为本技术领域的【背景技术】,有日本特开2010-39778号公报(专利文献1)。在专 利文献1中,记载有;"使用辞典生成用特征图案群,通过多项式神经网络来学习二次函数, 选择保存二次函数的主要分量的部分空间,从而削减特征空间的维度。在初始系数设定步 骤、系数修正步骤中,W使将二次函数用作识别函数时的损失函数的值变小的方式,通过梯 度下降法或者概率的梯度下降法来修正系数。在基向量导出步骤中,导出二次函数的二次 项的二次型的矩阵的特征向量和一次项的系数向量。接下来,在投影矩阵导出步骤中,从特 征向量和系数向量中,选择成为主分量的1个W上的向量,将通过所选择的向量而生成的 部分空间生成为新的特征空间"。
[0003] 现有技术文献
[0004] 专利文献
[0005] 专利文献1日本特开2010-39778号公报

【发明内容】

[0006] 发明所要解决的技术问题
[0007] 作为字符辨识中的识别函数,广泛使用在识别精度和识别速度该双方中具有高性 能的二次函数。在二次函数中,有抛物型、双曲型、楠圆型该3种。
[000引在基于W往技术的识别函数的生成方法中,有如下的方法;定义与误读相关的损 失函数,W使损失函数的值变小的方式,根据学习样本反复修正系数,从而创建识别函数 (参照例如专利文献1)。在该方法中,一般来说,识别函数不会为楠圆型。
[0009] 在图15中示意性地示出了该种情形。用等高线表示的是字符类型"X"的识别函 数的等高线。W区分字符类型"X"和其它字符类型的方式来形成等高线,有表示字符类型 "X"的圈的图形的一侧是识别函数的值大的一侧,相反侧是识别函数的值小的一侧。在该方 法中,W区分不同的字符彼此的方式来生成识别函数,但如图15所示,非字符有时位于取 高值的区域。因此,存在如下的问题;虽然辨识精度高,但非字符丢弃精度低。
[0010] 作为利用W往技术的识别函数的其它生成方法,有如下方法:对各字符类型的字 符的分布假设高斯分布,根据高斯分布的分布密度,来确定识别函数。在该方法中,如图17 那样,识别函数为楠圆型。在该情况下,由于不是W减小损失函数等的方式来直接调整系数 的方法,所W虽然辨识精度低,但丢弃精度高。
[0011] 因此,课题在于;通过将识别函数维持为楠圆型,并且W使损失函数的值变小的方 式来修正系数,从而创建识别函数,实现高的正确读取率和高的丢弃率。
[0012] 解决技术问题的技术方案
[001引如果示出本发明的代表性的一个例子,则如下所述。即,一种字符辨识装置,具有 处理器w及存储装置,其特征在于,所述存储装置保持多个字符类型的多个学习用字符图 像,所述处理器执行;特征提取处理,将所述各学习用字符图像变换为规定维数的向量;二 次函数初始设定处理,针对每个所述字符类型,定义所述规定维数的向量空间上的楠圆型 二次识别函数;损失函数定义处理,定义测量使用所述楠圆型二次识别函数来识别了所述 学习用字符图像时的误差程度的损失函数;样本位置修正幅度计算处理,计算用于W使在 使用所述楠圆型二次识别函数来识别出从所述多个学习用字符图像中选择的样本时的所 述损失函数的值变小的方式使所述样本的向量的位置移动的修正向量;系数修正处理,根 据所述修正向量,W将所述楠圆型二次识别函数的等高线原样地维持为楠圆形而使所述损 失函数的值变小的方式,修正所述楠圆型二次识别函数的参数;W及保存处理,将具有所修 正的所述参数的所述楠圆型二次识别函数,作为用于所输入的字符图像的识别和丢弃的识 别函数,保存于所述存储装置。
[0014] 发明效果
[0015] 根据本发明的一个方式,能够在字符辨识中实现高的正确读取率和高的非字符丢 弃率。
【附图说明】
[0016] 图1是示出本发明的实施例的字符辨识装置的结构的一个例子的框图。
[0017] 图2是示出由本发明的实施例的字符辨识装置实施的文档电子化的处理的流程 的典型的例子的流程图。
[001引图3是示出由本发明的实施例的字符辨识装置实施的文档电子化的处理的流程 的具体例的说明图。
[0019]图4是由本发明的实施例的字符辨识装置实施的字符截取处理的说明图。
[0020] 图5是由本发明的实施例的字符辨识装置实施的字符识别的结果的说明图。
[0021] 图6是由本发明的实施例的字符辨识装置实施的辨识结果的候选的网络的说明 图。
[0022] 图7是示出由本发明的实施例的字符辨识装置实施的特征提取的处理的例子的 说明图。
[0023]图8是由本发明的实施例的字符辨识装置实施的梯度特征提取方法的第1说明 图。
[0024]图9是由本发明的实施例的字符辨识装置实施的梯度特征提取方法的第2说明 图。
[0025] 图10是由本发明的实施例的字符辨识装置实施的字符识别用的方式的说明图。
[0026] 图11是示出本发明的实施例的字符辨识装置所保持的学习用字符图像数据库的 例子的说明图。
[0027] 图12是示出由本发明的实施例的字符辨识装置丢弃的字符的第1例的说明图。 [002引图13是示出由本发明的实施例的字符辨识装置丢弃的字符的第2例的说明图。
[0029] 图14是W往的识别函数的生成方法的第1例的说明图。
[0030] 图15是通过W往的方法所生成的识别函数的第1例的说明图。
[0031] 图16是W往的识别函数的生成方法的第2例的说明图。
[0032] 图17是通过W往的方法所生成的识别函数的第2例的说明图。
[0033] 图18是示出由本发明的实施例的字符辨识装置实施的识别函数的创建方法的流 程图。
[0034]图19是示意地示出由本发明的实施例的字符辨识装置实施的识别函数的参数的 修正的说明图。
[0035] 图20是根据本发明的实施例的字符辨识装置的楠圆型的识别函数的中屯、的移动 的说明图。
[0036] 图21是根据本发明的实施例的字符辨识装置的楠圆型的识别函数的中屯、W外的 参数的变更的说明图。
[0037] 符号说明
[003引 201 ;子化辨识装置;202 ;输入装置;203 ;显不装置;204 ;影像获取装置;205 ;通 信装置;206 ;运算装置仰U) ;207 ;外部存储装置;213 ;学习用字符图像数据库;214 ;字符 辨识用辞典。
【具体实施方式】
[0039] W下,参照图表,对本发明的字符辨识装置的实施例进行说明。本实施例的字符辨 识装置是如下的装置:对通过利用扫描仪等读取例如纸件文档而获取的输入文档图像中的 字符进行检测并辨识,并对字符进行代码化,从而使输入文档电子化。在输入文档中,,除了 一般文档W外,还有例如票据、说明书等。
[0040] 图1是示出本发明的实施例的字符辨识装置的结构的一个例子的框图。
[0041] 本实施例的字符辨识装置201进行例如印章辨识W及票据辨识,具备输入装置 202、显示装置203、影像获取装置204、通信装置205、运算装置(CPU) 206、外部存储装置 207。外部存储装置207包括学习用字符图像数据库213 W及字符识别用辞典214。
[0042] 输入装置202是例如用于输入命令等的键盘W及鼠标等。输入装置202是用于输 入为了由运算装置(CPU) 206执行的程序的控制、W及连接设备的控制而执行的命令等的 装置。
[0043] 显示装置203是适宜显示处理内容的显示器等装置。
[0044] 影像获取装置204是扫描仪等影像获取用的装置。获取的影像也可W存储于外部 存储装置207等。
[0045] 通信装置205用于进行与PC或者服务器等外部设备(图示省略)之间的数据交 换。通信装置205用于获取来自外部设备的由用户输入的执行命令,获取来自外部设备的 图像、文本等信息等目的。另外,通信装置205还用于将字符辨识装置201中的处理内容发 送到外部设备等目的。
[0046] 运算装置(CPU)206是执行在文档图像中的字符辨识中使用的字符识别用辞典 214的生成等处理的运算装置。
[0047] 外部存储装置207是硬盘驱动器(皿D) W及存储器等外部存储装置。在外部存储 装置207中,保存了学习用字符图像数据库213 W及字符识别用辞典214等各种数据。另 夕F,外部存储装置207还用于临时地存储在由运算装置(CPU) 206执行的处理的途中所生成 的数据等。
[0048] 也可W没有输入装置202、显示装置203、影像获取装置204 W及通信装置205。在 没有输入装置202的情况下,字符辨识装置201既可W在使用通信装置205从外部设备指 示了时开始处理,或者也可W通过时刻指定等自动地开始处理。在没有显示装置203的情 况下,处理结果被使用通信装置205发送到外部设备、或者存储到外部存储装置207。
[0049] 也可W经由外部存储装置207,进行执行处理的模块的输出和输入。目P,也可W例 如由运算装置206实现的某个处理部(图示省略、此处记载为处理部1)将处理结果输出到 由运算装置206实现的其它处理部(图示省略、此处记载为处理部2),处理部2在将其处理 结果作为输入受理的情况下,实际上,处理部1预先将处理结果输出到外部存储装置207而 存储,处理部2将在外部存储装置207中存储了的处理部1的输出结果作为输入获取。
[0050] 接下来,转移到由本实施例中的字符辨识装置201所实施的处理的说明。
[0化1] W下,首先,使用图2等,说明本发明的实施例的字符辨识装置201执行的文档电 子化处理。之后,使用图18等,说明作为本实施例的特征的、在文档电子化中使用的字符识 别用辞典214的生成处理。
[0052] 首先,对本发明的实施例的字符辨识装置所执行的文档电子化处理进行说明。
[0053] 图2是示出由本发明的实施例的字符辨识装置201实施的文档电子化的处理的流 程的典型的例子的流程图。另外,图3是示出由本发明的实施例的字符辨识装置201实施 的文档电子化的处理的流程的具体例的说明图。
[0化4] 在文档的图像化(扫描)501中,字符辨识装置201的CPU206通过影像获取装置204(例如扫描仪等)将文档读入并图像化。此时,在背景印刷是用彩色进行了印字的情况 等下,CPU206还有时进行将特定颜色的印字光学地去除的滤色(color化opout)等处理。 输入文档有一般文档、票据类,W及一开始就W用字符辨识装置来进行处理为目的而制作 的标记表(marksheet)用纸等。
[0055] 在预处理502中,CPU 206进行文档图像的彩色图像的二值化(白黑化)、噪声去 除、W及背景印刷等不需要部分的去除等处理。预处理后的二值图像例如如图3的票据图 像601所示。
[0化6] 在布局解析503中,CPU 206进行二值图像的布局解析,辨识图表的位置、段落构 造、W及项目和数据的位置等。关于项目和数据的位置,CPU 206在例如是票据图像601的 情况下,根据表构造的关系,解析为"支付金额"是项目名,其下的记载有"7, 890, 123"的框 是数据框等。在是论文W及技术报告书的情况等下,有时还根据文档的构造和位置关系
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1