针对文档图像的水平和垂直线检测和移除的制作方法_3

文档序号:9708720阅读:来源:国知局
种由数据处理系统执行的方法。在另一方面,本发明是一种在计算机可用的非暂时性介质中具体化的计算机装置,所述计算机可用的非暂时性介质具有嵌入在其中的用于控制数据处理设备执行所述方法的计算机可读程序代码。在另一方面,本发明在数据处理系统中具体化。
[0039]本领域技术人员将清楚的是,在不脱离本发明的精神或范围的情况下,可以在本发明的水平和垂直线检测和移除方法以及相关设备中进行各种修改和变化。因此,意图是本发明覆盖落在所附权利要求及其等同的范围内的修改和变化。
【主权项】
1.一种用于检测和移除灰度文档图像中的垂直线和水平线的方法,该方法包括以下步骤: 使用多个不同的二值化条件来从灰度文档图像产生多个第一二值图像; 独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线,以产生与所述多个第一二值图像对应的多组边界框,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线; 将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的合并的一组边界框; 从灰度文档图像产生第二二值图像;以及 使用表示检测到的线的所述合并的一组边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线。2.根据权利要求1所述的方法,其中,多个二值化条件是多个不同的二值化阈值。3.根据权利要求1或2所述的方法,还包括以下步骤: 在产生所述多个第一二值图像之前,对灰度文档图像进行偏斜校正、去噪声和下采样;以及 在合并步骤之后,扩大所述合并的一组边界框的大小。4.根据权利要求1至3中的任一项所述的方法,其中,针对每个第一二值图像的检测步骤包括以下步骤: (a)获得与第一二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者; (b)使用垂直线作为结构元素来对第一二值图像执行开运算; (C)从通过步骤(b)产生的第一二值图像提取连接成分;以及 (d)针对每个连接成分中的每个垂直像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从第一二值图像移除该像素列。5.根据权利要求4所述的方法,其中,针对每个第一二值图像的检测步骤在步骤(d)之后还包括以下步骤: (e)垂直地投影通过步骤(d)产生的第一二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界。6.根据权利要求5所述的方法,其中,针对每个第一二值图像的检测步骤在步骤(e)之后还包括以下步骤: (f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及 (g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界。7.一种用于检测和移除二值文档图像中的垂直线的方法,包括以下步骤: (a)获得与二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者; (b)使用垂直线作为结构元素来对二值图像执行开运算; (C)从通过步骤(b)产生的二值图像提取连接成分; (d)针对每个连接成分中的每个像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从二值图像移除该像素列; (e)垂直地投影通过步骤(d)产生的二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界; (f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的二值图像的对应的垂直切片以产生第二水平投影直方图; (g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界; (h)使用检测到的垂直线的左边界、右边界、顶边界和底边界对二值图像进行处理以从该二值图像移除垂直线。8.一种用于检测和移除灰度文档图像中的垂直线和水平线的计算机装置,包括: 用于使用多个不同的二值化条件来从灰度文档图像产生多个第一二值图像的部件; 用于独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线以产生与所述多个第一二值图像对应的多组边界框的部件,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线; 用于将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的合并的一组边界框的部件; 用于从灰度文档图像产生第二二值图像的部件;以及 用于使用表示检测到的线的所述合并的一组边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线的部件。9.根据权利要求8所述的计算机装置,其中,多个二值化条件是多个不同的二值化阈值。10.根据权利要求8或权利要求9所述的计算机装置,还包括: 用于在用于产生所述多个第一二值图像的部件的处理之前,对灰度文档图像进行偏斜校正、去噪声和下采样的部件;以及 用于在用于合并的部件的处理之前,扩大所述合并的一组边界框的大小的部件。11.根据权利要求8至10中的任一项所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件包括: (a)用于获得与第一二值图像的每个像素相关联的笔划宽度的部件,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者; (b)用于使用垂直线作为结构元素来对第一二值图像执行开运算的部件; (C)用于从通过部件(b)产生的第一二值图像提取连接成分的部件;以及(d)用于针对每个连接成分中的每个垂直像素列,进行以下处理的部件:计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从第一二值图像移除该像素列。12.根据权利要求11所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件在部件(d)的处理之后还包括: (e)用于垂直地投影通过部件(d)产生的第一二值图像以产生垂直投影直方图并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界的部件。13.根据权利要求12所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件在部件(e)的处理之后还包括: (f)用于针对垂直投影直方图的每个非零部分,进行以下处理的部件:水平地投影通过部件(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影部件(b)的处理之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及 (g)用于针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界的部件。
【专利摘要】本发明涉及针对文档图像的水平和垂直线检测和移除。用于文档图像的垂直和水平线检测方法包括:基于多个二值化阈值从输入灰度文档图像产生多个二值图像;独立地检测所述多个二值图像中的每个中的水平线和垂直线;以及合并来自所述多个二值图像的检测结果。用于每个二值图像的线检测处理包括:使用垂直线或水平线作为结构元素来应用开运算;以及基于笔划宽度分析来移除不是垂直线或水平线的连接成分。使用水平投影和垂直投影来获得检测到的线的边界。
【IPC分类】G06K9/00, G06K9/20
【公开号】CN105469027
【申请号】CN201510621501
【发明人】方刚
【申请人】柯尼卡美能达美国研究所有限公司
【公开日】2016年4月6日
【申请日】2015年9月25日
【公告号】EP3002712A2, EP3002712A3, US20160092417
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1