一种基于对比度增强法的降质文档图像二值化方法
【技术领域】
[0001] 本发明涉及基于对比度增强法的降质文档图像二值化方法。属于图像处理技术领 域,涉及对降质文档图像的二值化方法,可用于OCR系统对降质文档图像字符识别的预处 理,具体是一种基于对比度增强法的降质文档图像二值化方法。
【背景技术】
[0002] OCR技术(Optical Character Recognition,光学字符识别)是将纸质文字信息 录入到计算机中最高效的方法。而OCR系统的识别效率则取决于文档图像的质量。对于降 质文档图像的识别,目前的OCR技术存在的不足主要表现为二值化后的文档图像丢失了大 量的有效信息,无法得到连续、完整的笔画结构,严重影响后续的识别结果。虽然大量学者 已经对文档图像二值化研究多年,但对于从降质文档图像(如图像中存在阴影、非均匀光 照、墨迹透背、模糊等)中提取出清晰字符仍是图像处理领域的一个难点。
【发明内容】
[0003] 本发明是要解决现有方法无法从降质文档图像中提取出清晰字符的问题,而提供 了一种基于对比度增强法的降质文档图像二值化方法。
[0004] -种基于对比度增强法的降质文档图像二值化方法,按以下步骤实现:
[0005] 步骤1 :读取降质文档图像,对降质文档图像进行灰度变换,输出灰度级为256的 灰度图像;
[0006] 步骤2 :利用四叉树原理,根据灰度对比度信息,区分强灰度对比度区域与弱灰度 对比度区域;
[0007] 步骤3 :对于强灰度对比度区域,采用弱灰度对比度增强法调整区域像素点灰度 值;对于弱灰度对比度区域,采用强灰度对比度增强法调整区域像素点灰度值;
[0008] 步骤4 :根据强灰度对比度区域与弱灰度对比度区域像素点灰度值出现的频率确 定局部阈值;
[0009] 步骤5 :令强灰度对比度区域与弱灰度对比度区域像素点灰度值大于局部阈值的 像素点的灰度值为255 ;令强灰度对比度区域与弱灰度对比度区域像素点灰度值小于局部 阈值的像素点的灰度值为〇,输出二值图像。
[0010] 发明效果:
[0011] 因此本发明提出一种新的二值化算法,针对不同的降质原因,在不同的区域选择 恰当的区域对比度增强法,从而达到理想的分割效果。
[0012] 应用本实施方式算法处理的二值图像,具有最高的F-measure值(高于次高OTSU 算法4% )、最高的PSNR值(高于次高Sauvola算法5% )及较低的NRM值。说明本实施方 式算法可以最好的还原目标像素点,同时说明应用本实施方式算法输出的二值图像最接近 实际未降质文档的二值图像,且本实施方式算法的误分割率较小。说明应用本实施方式算 法处理的降质文档图像具有最优的分割质量。
【附图说明】
[0013] 图1为本发明流程图;
[0014] 图2(a)是第一次区域划分原理示意图;
[0015] 图2(b)是第二次区域划分原理示意图;其中,所述□背景区域;隱灰度对比度显 著区域;腿灰度对比度较显著区域;
[0016] 图3 (a)为待测试图像;
[0017] 图3 (b)为用OTSU方法的二值化图像;
[0018] 图3 (c)为用Niblack方法的二值化图像;
[0019] 图3 (d)为用Sauvola方法的二值化图像;
[0020] 图3 (e)为用Singh方法的二值化图像;
[0021] 图3(f)为用本发明方法的二值化图像;
[0022] 图4(a)为待测试图像;
[0023] 图4 (b)为用OTSU方法的二值化图像;
[0024] 图4 (c)为用Niblack方法的二值化图像;
[0025] 图4 (d)为用Sauvola方法的二值化图像;
[0026] 图4 (e)为用Singh方法的二值化图像;
[0027] 图4(f)为用本发明方法的二值化图像;
[0028] 图5 (a)为待测试图像;
[0029] 图5 (b)为用OTSU方法的二值化图像;
[0030] 图5 (c)为用Niblack方法的二值化图像;
[0031] 图5 (d)为用Sauvola方法的二值化图像;
[0032] 图5 (e)为用Singh方法的二值化图像;
[0033] 图5 (f)为用本发明方法的二值化图像;
[0034] 图6 (a)为待测试图像;
[0035] 图6 (b)为用OTSU方法的二值化图像;
[0036] 图6 (c)为用Niblack方法的二值化图像;
[0037] 图6 (d)为用Sauvola方法的二值化图像;
[0038] 图6 (e)为用Singh方法的二值化图像;
[0039] 图6 (f)为用本发明方法的二值化图像。
【具体实施方式】
【具体实施方式】 [0040] 一:本实施方式的一种基于对比度增强法的降质文档图像二值化方 法,按以下步骤实现:
[0041] 步骤1 :读取降质文档图像,对降质文档图像进行灰度变换,输出灰度级为256的 灰度图像;
[0042] 步骤2 :利用四叉树原理,根据灰度对比度信息,区分强灰度对比度区域与弱灰度 对比度区域;
[0043] 步骤3 :对于强灰度对比度区域,采用弱灰度对比度增强法调整区域像素点灰度 值;对于弱灰度对比度区域,采用强灰度对比度增强法调整区域像素点灰度值;
[0044] 步骤4 :根据强灰度对比度区域与弱灰度对比度区域像素点灰度值出现的频率确 定局部阈值;
[0045] 步骤5 :令强灰度对比度区域与弱灰度对比度区域像素点灰度值大于局部阈值的 像素点的灰度值为255 ;令强灰度对比度区域与弱灰度对比度区域像素点灰度值小于局部 阈值的像素点的灰度值为〇,输出二值图像。
【具体实施方式】 [0046] 二:本实施方式与一不同的是:所述步骤2具体为:
[0047] (2a)计算降质文档图像像素点坐标为(X,y)处灰度值为f(x, y)的灰度对比度 D (X, y),其计算公式为:
[0048] D(x,y) = max [Dh (x, y), Dv (x, y) ] (I)
[0049] Dh(x, y) = | f (x, y)-f (χ-l, y) (2)
[0050] Dv(x, y) = I f (x, y)-f (x, y-1) (3)
[0051] 其中,Dh(x, y)和Dv(x, y)分别是像素点f(x, y)水平方向和竖直方向的灰度对比 度,f (x-1,y)是f (X,y)水平方向左侧像素点的灰度值,f (X,y-ι)是f (X,y)竖直方向下侧 像素点的灰度值;
[0052] (2b)利用四叉树原理,根据灰度对比度对降质文档图像进行区域划分:
[0053] 第一次四分后,若任一区域内的最大灰度对比度小于等于a倍整体区域的最大灰 度对比度,即公式4,说明该区域的灰度变化不显著,则认为该区域均为背景区域,直接输出 该区域,对剩余区域继续进行细分;
[0054] Dftliax (X,y)彡 a · Dentiremax (χ, y) (4)
[0055] 其中,所述DD_(x,y)为第一次四分后任一区域内的最大灰度对比度, Daitiraiiax(Xj)为整体区域的最大灰度对比度;
[0056] (2c)第二次四分后,若任一第二次四分后形成的DD区域内的最大灰度对比度小 于等于a倍的第一次四分后任一区域内的最大灰度对比度,即公式5,说明该区域的灰度变 化不显著,则认为该区域均为背景区域,直接输出该区域;
[0057] 若任一第二次四分后形成的AC区域内的最大灰度对比度大于等于b倍的第一次 四分后形成的A区域内的最大灰度对比度,即公式6,说明该区域为灰度变化非常显著区 域,则对该区域进行弱灰度对比度增强法处理;
[0058] 若任一第二次四分后形成的BA区域内的最大灰度对比度介于a和b倍的第一次 四分后形成的B区域内的最大灰度对比度之间即公式7,说明该区域为灰度变化较显著区 域,则对该区域进行强灰度对比度增强法处理;
[0062] 其中,所述Ddd_ (X,y)第二次四分后形成的DD区域内的最大灰度对比度, DACnax(x,y)第二次四分后形成的AC区域内的最大灰度对比度,DBAmax(x,y)第二次四分后形 成的BA区域内的最大灰度对比度,D amx (χ, y)第一次四分后形成的A区域内的最大灰度对 比度,DB_(x,y)第一次四分后形成的B区域内的最大灰度对比度。
[0063] 实验证明a e [0, 0· 4],b e [0· 7, 1]。且对图像进行两次四分来确定区域的灰度 变化属性是最佳四分次数,过多的四分会导致计算量过大,且容易将噪声点误分成目标,不 能很好的将噪点处理掉。过少的四分虽然会减小计算量,但同时也将丢失过多的细节,达不 到理想的分割效果。
[0064] 其它步骤及参数与【具体实施方式】一相同。
【具体实施方式】 [0065] 三:本实施方式与一或二不同的是:所述步骤3具体 为:
[0066] (3a)对于灰度变化非常显著区域,采用弱灰度对比度增强法,将区域内各像素点 灰度值调整为