一种灰度图像处理方法与流程

文档序号:12471874阅读:2603来源:国知局

本发明涉及图像处理领域,涉及一种灰度图像处理方法。



背景技术:

近年来,随着便携式摄影设备的普及和互联网发展,数字图像和数字视频的数量正以惊人的速度增长。而灰度图像是其中常用的存储方式,彩色图像、视频常常以灰度图像作为转换的中间形式。嵌入在图像中的文字是图像语义的重要表达方式。如果能够利用计算机自动定位和识别这些文字,就可以让计算机自动理解图像的内容,进而借助已经成熟的文本检索技术来检索图像,从而为基于内容的图像处理提供一种途径。



技术实现要素:

有鉴于此,本发明提供一种解决或部分解决上述问题的灰度图像处理方法。

为达到上述技术方案的效果,本发明的技术方案为:一种灰度图像处理方法,包含以下步骤:

1)计算灰度图像的阈值,通过对灰度图像的灰度水平直方图的判别分析来选择一个全局阈值,依照全局阈值来对灰度图像进行分割,将小于阈值的像素点值设为黑色,大于阈值的像素点设置为白色,得到处理后的灰度图像;

2)将处理后的灰色图像的像素按照灰度值划分为前景像素或背景像素,从而处理后的灰色图像也被划分为前景图像和背景图像两部分,对于前景图像和背景图像中的每一个像素点p,计算一组新的阈值F=(Xmax+Xmin)/4,其中,Xmax为像素点p的邻域1cm*1cm内最大的灰度值,Xmin为像素点p的邻域1cm*1cm内最小的灰度值,F表示新的阈值,对于每一个新的阈值,结合纹理特征从灰度图像的灰度水平直方图中重新进行计算一组纹理阈值,选择一组纹理阈值中与相应的新的阈值的值最接近的作为最优的阈值,作为灰色图像的纹理特征;

3)将灰色图像的纹理特征带入,利用拉普拉斯算子提取前景图像与背景图像的边界,使用平滑算法进行边界的连接,进行投影轮廓分析来确定文本块的边界,将文本块一个个从灰度图中提出,从文本块中提取可靠的笔画作为基准,计算高斯模型参数并进行粗分割,在基于颜色均匀性分布和连通体方法进一步过滤其中的噪音,从而得到分割好的文本块;

4)从分割好的文本块中利用最近邻分类器识别其中的字符,建立词典库与字库,将字库生成模板图像,利用SIFT特征将分割好的文本块中的字符与模板图像进行匹配,再使用几何验证算法来对匹配结果进行修正,对匹配结果与词典库中的词进行一一对比,得到满足词典中规则的分割好的文本块中的词语。

本发明的有益成果是:本发明通过阈值的计算,对灰度图像进行分割,然后,对灰色图像的纹理特征进一步突出,通过确定文本块的边界并分割文本块来识别其中的字符以及词,本发明考虑全面、层层递进,不仅考虑了对文本块中字符进行匹配,同时也要对文本块中的词进行匹配。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,能实现同样功能的产品属于等同替换和改进,均包含在本发明的保护范围之内。具体方法如下:

实施例1:自动的图像处理是一个包含很多步骤的处理过程。在这些步骤中,最重要的环节就是对图像进行预处理,将图像转化为二值化图像。图像的二值化处理,就是将图像上的每一个像素点的灰度值设置为0或255,也就是将原来的彩色图像转化为整个图像呈现出明显的只有黑和白的视觉效果的灰度图像。对于含有文字的图像来说,其目的通常是将文字部分作为前景分离出来,效果直接影响到后续的文字分割与识别的效果。

一种灰度图像处理方法,包含以下步骤:

1)计算灰度图像的阈值,通过对灰度图像的灰度水平直方图的判别分析来选择一个全局阈值,依照全局阈值来对灰度图像进行分割,将小于阈值的像素点值设为黑色,大于阈值的像素点设置为白色,得到处理后的灰度图像;

2)将处理后的灰色图像的像素按照灰度值划分为前景像素或背景像素,从而处理后的灰色图像也被划分为前景图像和背景图像两部分,对于前景图像和背景图像中的每一个像素点p(x,y),计算一组新的阈值F(x,y)=(Xmax+Xmin)/4,其中,Xmax为像素点p(x,y)的邻域1cm*1cm内最大的灰度值,Xmin为像素点p(x,y)的邻域1cm*1cm内最小的灰度值,对于每一个新的阈值,结合纹理特征从灰度图像的灰度水平直方图中重新进行计算一组纹理阈值,选择一组纹理阈值中与相应的新的阈值的值最接近的作为最优的阈值,作为灰色图像的纹理特征;

3)将灰色图像的纹理特征带入,利用拉普拉斯算子提取前景图像与背景图像的边界,使用平滑算法进行边界的连接,进行投影轮廓分析来确定文本块的边界,将文本块一个个从灰度图中提出,从文本块中提取可靠的笔画作为基准,计算高斯模型参数并进行粗分割,在基于颜色均匀性分布和连通体方法进一步过滤其中的噪音,从而得到分割好的文本块;

4)从分割好的文本块中利用最近邻分类器识别其中的字符,建立词典库与字库,将字库生成模板图像,利用SIFT特征将分割好的文本块中的字符与模板图像进行匹配,再使用几何验证算法来对匹配结果进行修正,对匹配结果与词典库中的词进行一一对比,得到满足词典中规则的分割好的文本块中的词语。

实施例2:文本分割是从文本区域中将文字像素点分离出来的过程。

边缘特征是图像处理使用较早、较多的特征,边缘检测是基于像素灰度突变来分割图像的最常用的方法。基于边缘特征的方法是假设文字和背景之间有很强的对比度以及文本边缘清晰,根据文本区域丰富的边缘信息进行文本区域的检测。这一类算法通常先使用边界提取算法(如算子、算子、算子等)等获取边界;再使用平滑算法或者形态学方法进行边界连接,由此获取完整的文字边界。基于边缘的方法最大的制约因素在于当背景

轮廓和文字轮廓相互交叉粘连时,文字和背景就会被混靖在一起进行处理,最终可能被当作背景区域去除,或者得到一个包含文字又包含背景的区域。因此需要其他的方法进行验证。

本实施例通过对大量汉字和英文字母的观察,文字中的角点由大量的直线段和少量的曲线段连接在一起构成的,特别是中文字符。因此,可以认为图像中存在着大量的角点的区域是文本区域的概率非常大。而角点的个数少或者没有角点的区域是图像中的背景区域的概率很大。利用角点信息可以在一定程度上判断具有长直线及较小曲率的曲线所在的区域不是本文区域。

纹理是图像分析处理中常用的概念,它被用来描述图像的局部特性。虽然目前仍然认为“作为表面或图像属性的纹理,没有能被广泛接受的定义”,但是一般来说,纹理是指图像局部变化的重复模式,通过像素在其邻域空间中的某种确定性的规律或统计性规律来描述局部无规则而宏观有规律的特性。

采用高斯去噪方法对灰度图像进行去噪,高斯去噪方法是对图像中的所有像素点的灰度值进行加权求和之后取平均的过程,所有像素点的灰度值,全部是它自身以及邻域内的其它像素点的灰度值通过加权求和然后取平均值得到。高斯去噪方法的具体算法过程是:用一个窗口(或称卷积、模板)在整幅图像中滑动,用窗口内所有像素的加权平均灰度值去替换窗口中心像素点的值。

以上所述仅为本发明之较佳实施例,并非用以限定本发明的权利要求保护范围。同时以上说明,对于相关技术领域的技术人员应可以理解及实施,因此其他基于本发明所揭示内容所完成的等同改变,均应包含在本权利要求书的涵盖范围内。

本发明的有益成果是:本发明通过阈值的计算,对灰度图像进行分割,然后,对灰色图像的纹理特征进一步突出,通过确定文本块的边界并分割文本块来识别其中的字符以及词,本发明考虑全面、层层递进,不仅考虑了对文本块中字符进行匹配,同时也要对文本块中的词进行匹配。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1