一种基于笔划特征的自然场景文本检测算法

文档序号：8431171阅读：410来源：国知局

一种基于笔划特征的自然场景文本检测算法
【技术领域】
[0001] 本发明涉及基于图像内容的检索领域，特别是涉及一种基于笔划特征的自然场景文本检测算法。
【背景技术】
[0002] 传统的OCR技术经过多年的研宄进展，可以高质量、准确地识别印刷文档，已达到实用要求，很多公司推出了这方面的商业软件。然而传统的OCR技术只能识别分辨率高，背景简单，布局不太复杂的扫描图像。而在现实环境中则是存在大量的文本图像很难符合这样的要求，比如车牌，路标，广告牌、视频图像等自然场景中的文本。这些场景中的文本信息很丰富，例如新闻视频文本中的字幕，包含了事件发生的时间、地点和人物等关键信息。准确地识别出这些文本，对于信息检索，网页检索，身份识别和电子导游设备有重要的意义，但是由于自然场景中字符大小，字体颜色变化大，背景复杂，畸形等特点使得文本识别远远没有达到人们的期望，如果通过计算机自动地获取，是一件极具挑战和实际意义的工作。
[0003] 自然场景文本检测是是图像内容的信息提取技术的关键一环，文本检测和定位的好坏对最终的识别结果有着极其重要的影响，国内外广大研宄人员做了大量的研宄工作，提出了很多的文本检测方法。但由于自然场景复杂性特点，试图设计一套通用的自然场景文本检测系统仍然是十分困难的。如何从复杂的自然场景中快速准确地定位出文本区域及如何尽可能降低遗漏率，这就是目前自然场景文本检测在图像领域的一个研宄热点和难点。
[0004] 目前的自然场景文本检测技术主要分为两类，基于区域的和基于纹理的。基于区域的方法主要自下而上的聚合和自上而下的剪枝两部分组成，自下而上的聚合采用过程完成初始候选文本字符的确定，文本行的生成等，自上而下的剪枝则是在字符水平和文本行水平对非文本字符和非文本区域进行过滤。而基于纹理的方法则是把文本区域视为一种特殊的纹理，采用滑动窗的方法，通过采用Gabor滤波，直方图统计等方法，观察响应，从而确定滑动窗所在的区域是否是文本区域，后期通过分裂和合并算法得到最终的文本区域。

【发明内容】

[0005] 本发明的目的在于克服现有技术的不足，提供一种基于笔划特征的自然场景文本检测算法，能够从任意的自然场景图像中检测出文本区域的位置，克服了传统文本检测算法对自然场景图像中文字的字体、大小、颜色等特征敏感的不足，并且提高了算法的计算速度，在保证准确度的同时，相比于基于纹理的检测方法，大大降低了计算量，为在便携式智能设备上应用提供了条件。
[0006] 本发明的目的是通过以下技术方案来实现的：一种基于笔划特征的自然场景文本检测算法，它包括以下多个步骤：
[0007] S1:图像预处理
[0008] 进入输入图像处理，获取自然场景图像，通过图像预处理模块对自然场景图像进行预处理，提取和突出图像的边缘特征。
[0009] S2 :笔划宽度特征提取
[0010] 通过笔划宽度特征提取模块提出笔画宽度特征，利用步骤S1中的边缘检测结果和颜色一致化信息进行笔划特征提取，过滤掉背景区域，得到每个边缘像素点的笔划宽度值。
[0011] S3 :候选文本字符的生成和过滤
[0012] 通过字符水平过滤模块完成候选文本字符的生成和候选文本字符的过滤处理，采用基于笔划宽度和颜色的区域生长算法得到候选文本字符；字符水平过滤模块中包括笔划滤波器，通过笔划滤波器完成候选文本字符的过滤处理，采用笔划滤波响应和MSER区域限制滤除由笔划宽度像素聚合成的非文本候选文本字符。
[0013] S4 :文本行生成和文本行过滤
[0014] 通过文本行生成模块完成文本行的生成，对所有的候选文本字符按照一定的聚对规则进行聚对处理，得到字符对，然后再将字符对按照一定的合并规则进行合并处理，生成文本行；通过文本行过滤模块完成文本行过滤处理，在字符水平层次和文本行水平层次进行两层分类，分别对字符水平和文本行水平进行过滤，剔除非文本字符和非文本区域而得到最终的文本区域。
[0015] 步骤S2所述笔划宽度特征提取的具体过程为：
[0016]S201:在图像边缘上选择一个起始像素点p，其梯度方向为dP，从p点开始沿着梯度方向作射线r直到寻找到另一个边缘终止像素点q，q点的梯度方向为dq，若士和dq方向大致相反，即满足公式：+f，则此次射线寻找有效。
[0017] 所述的射线r的计算公式为：r=p+n?dp(n>0)，其中，n为射线r的步长。
[0018] S202 :否贝I」，此次射线寻找无效，重新规划起始像素点p的寻找方向为 △///= + |，然后沿着射线r的方向重新开始查找，知道寻找到另一个边缘终止像素点 q'，若此时dp'和dq'满足公式：+ 则此次射线寻找结果有效。
[0019] S203 :否则，重新选择新的边缘起始像素点，继续S201~S202的寻找过程。
[0020]S204 :在射线查找有效的情况下，计算笔划宽度值sw，其计算过程如下：计算起始点P和终止点q之间的线段长度W= |fFi|，遍历射线上p和q之间的所有点，若该点没有被赋予笔划宽度值，则赋予笔划宽度值sw，若该点已经被赋予过笔划宽度值，则比较其笔划宽度值sw和线段长度w的大小，取其较小者作为该起始点p的笔划宽度值Sw。
[0021] S205 :重复S201~S204过程，计算出所有候选文本像素的笔划宽度值sw。
[0022] 所述的步骤S2还包括笔划宽度修正子步骤：
[0023]S206:笔划宽度值的修正
[0024] 在笔划宽度值不能准确地表征其笔划属性时，应对其进行修正，包括以下一种或多种情况；
[0025]①拐角处笔划像素修正：重新遍历所有有效的射线，计算其像素笔划宽度中值，重新设置该射线上笔划宽度超过中值的为笔划宽度中值；
[0026] ②孤立笔划点的消除：统计笔划点周围5X5范围内计算有效笔划点的个数，消除孤立笔划点；
[0027] ③局部极大笔划点抑制：对笔划点周围超出平均值3倍的极大笔划点进行抑制，消除字符间的干扰笔划线。
[0028] 步骤S3中所述的区域生长算法为：
[0029]用4维向量{sw，I,，Ig，IJ表征笔划宽度特征图上的像素点，其中，sw表示该像素点的归一化的笔划宽度值，L、Ig、Ib分别表征该像素点的归一化的R、G、B通道的颜色值，利用区域生长算法得到候选文本区域，其相似性计算公式为：
[0030]
【主权项】
1. 一种基于笔划特征的自然场景文本检测算法，其特征在于，它包括以下多个步骤： S1，图像预处理：进入输入图像处理，获取自然场景图像，通过图像预处理模块对自然场景图像进行预处理，提取和突出图像的边缘特征； 52, 笔划宽度特征提取

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程洪;袁俊淼;杨路;
技术所有人：电子科技大学;
我是此专利的发明人

上一篇：一种基于深度学习的人证核验系统及方法
上一篇：基于特征图像全像素灰度值的elm手势识别算法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。