一种复杂环境下的自反馈文本分离方法及系统与流程

文档序号：23990800发布日期：2021-02-20 13:24阅读：92来源：国知局

[0001]
本发明属于图像模式识别和图像处理技术领域，尤其涉及一种复杂环境下的自反馈文本分离方法及系统。

背景技术：

[0002]
大数据时代带来了海量信息检索的需求，导致视频和图像中的文本检测和识别问题受到越来越多的关注，而且图像中的文本信息是理解整个图像的重要内容，此时就需要将图像中的文本分离出来。视频和图像中的文本分离应用非常广泛，比如车牌识别、互联网视频内容安全监控、嵌入式应用软件、基于文本的视频图像检索、工业产业自动化等；而且视频和图像的情况也很多样化，比如视频和图像背景复杂、光照度不均匀、失真、退化、文本字符多尺寸多字体多颜色等；这些应用场景和视频图像情况非常多样化，很难一一枚举齐全。将视频和图像中的文本分离出来后，还可能出现新的问题，比如文本字符带底色、倾斜、断线模糊、空心等，将会带来识别结果错误的问题，影响文字识别的正常使用，此时需要评价算法对文本分离结果进行评估。因此，需要一种普适性强的文本分离方法能在复杂环境下根据视频和图像的实际情况选择合适的方法进行文本检测和分离，并保证文本分离结果的有效性，方便后续正确识别文本字符，对于提高识别结果正确率等方面有着非常重要的作用。

技术实现要素：

[0003]
为解决上述技术问题，本发明的目的是提供一种复杂环境下的自反馈文本分离方法及系统；该方法与系统能提供一套完整的图像文本分离流程，自动分析图像是否有文本区域存在，当有文本区域存在时进行文本分离以及分离结果后处理。
[0004]
本发明的目的通过以下的技术方案来实现：
[0005]
一种复杂环境下的自反馈文本分离方法，包括
[0006]
a检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的纯图像结果；
[0007]
b将文本区域进行分类，并根据接收到的反馈信息更新文本特征数据；
[0008]
c将图像文本进行分离得到白底黑字文本分离结果，并根据接收到的反馈信息更新文本分离算法；
[0009]
d对文本分离结果进行评价，并记录造成评估结果不理想的原因；
[0010]
e对文本评价效果不好的图像，根据效果差的原因将分类结果进行反馈。
[0011]
一种复杂环境下的自反馈文本分离系统，包括
[0012]
所述系统包括：文本检测模块、文本分类模块，文本分离模块，文本评价模块和结果反馈模块；所述
[0013]
文本检测模块，通过文本检测器检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的纯图像结果；
[0014]
文本分类模块，通过文本分类器将文本区域进行分类，并根据结果反馈模块的信息更新文本分类器的特征数据；
[0015]
文本分离模块，通过文本分离器进行图像文本分离得到白底黑字的文本分离结果，且要根据结果反馈模块的信息更新文本分离器的文本分离算法；
[0016]
文本评价模块，通过文本评价器对文本分离结果进行评估，并记录造成评估结果不理想的原因；
[0017]
结果反馈模块，用于对文本评价模块评估的效果不好的图像，根据效果差的原因将分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0018]
与现有技术相比，本发明的一个或多个实施例可以具有如下优点：
[0019]
通过五大模块可以实现复杂环境下的自反馈文本分离，达到了各类型图像从输入到输出清晰白底黑字结果的自动化，以及文本分类器和文本分离器的自动反馈更新，在提高了图像识别结果正确性的同时，扩大了文本分离方法的普适性。
附图说明
[0020]
图1是复杂环境下的自反馈文本分离方法流程图；
[0021]
图2是复杂环境下的自反馈文本分离系统实施图；
[0022]
图3a-3d是文本分类器分类结果示例-无字纯图；
[0023]
图4a-4c是文本分类器分类结果示例-二值图；
[0024]
图5a-5c是文本分类器分类结果示例-灰度图；
[0025]
图6a-6c是文本分类器分类结果示例-白底黑字彩图；
[0026]
图7a-7d是文本分类器分类结果示例-白底彩字彩图；
[0027]
图8a-8c是文本分类器分类结果示例-彩底黑字彩图；
[0028]
图9a-9c是文本分类器分类结果示例-彩底非黑字彩图；
[0029]
图10a-10f是文本分离器文本分离结果示例图。
具体实施方式
[0030]
为使本发明的目的、技术方案和优点更加清楚，下面将结合实施例及附图对本发明作进一步详细的描述。
[0031]
如图1所示，复杂环境下的自反馈文本分离方法流程，包括：
[0032]
步骤10检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的纯图像结果；
[0033]
步骤20将文本区域进行分类，并根据接收到的反馈信息更新文本特征数据；
[0034]
步骤30将图像文本进行分离得到白底黑字文本分离结果，并根据接收到的反馈信息更新文本分离算法；
[0035]
步骤40对文本分离结果进行评价，并记录造成评估结果不理想的原因；
[0036]
步骤50对文本评价效果不好的图像，根据效果差的原因将分类结果进行反馈。
[0037]
如图2所示，上述分离方法对应的分离系统包括：文本检测模块、文本分类模块，文本分离模块，文本评价模块和结果反馈模块；所述文本检测模块，通过文本检测器检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的
纯图像结果；文本分类模块，通过文本分类器将文本区域进行分类，并根据结果反馈模块的信息更新文本分类器的特征数据；文本分离模块，通过文本分离器进行图像文本分离得到白底黑字的文本分离结果，且要根据结果反馈模块的信息更新文本分离器的文本分离算法；文本评价模块，通过文本评价器对文本分离结果进行评估，并记录造成评估结果不理想的原因；结果反馈模块，用于对文本评价模块评估的效果不好的图像，根据效果差的原因将分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0038]
上述步骤10具体包括：
[0039]
由于图像中不一定存在文本区域，有必要利用文本检测器检测图像中的文本字符，得到图像文本区域，使后续文本分离和文字识别更准确；
[0040]
根据文本区域检测结果将图像分为无字纯图和有字信息图(如图3a-图10f所示)；
[0041]
对于部分特殊图像，无法确定是否有文本字符存在的判断为无字纯图，并做标记。
[0042]
上述步骤20具体包括：
[0043]
预先设计文本分类器，对文本区域图像按属性特征进行分类，分为n类；
[0044]
根据结果反馈模块的反馈信息，当目前分类器的图像类别不能得到满意的文本分离结果时，及时增加图像分类类别为n+1类、更新文本分类器；
[0045]
文本分类器的类别由简单到复杂，比如第一类为二值图，第二类为灰度图，第三类为白底黑字彩图，第四类为白底彩字彩图，
……
，第n-1类纯色底纹黑字彩图，第n类渐变色底纹黑字彩图，第n+1类花色底纹黑字彩图，
……
，第n-1类纯色底纹彩字彩图，第n类渐变色底纹彩字彩图，第n+1类花色底纹彩字彩图。
[0046]
上述步骤30具体包括：
[0047]
根据文本分离器的设置，每种图像类别采用不同的方法进行文本分离；
[0048]
根据结果反馈模块的反馈信息，当目前分离器的文本分离结果不满足条件时，及时优化完善现有的文本分离方法，必要时增加新的文本分离方法，做到文本分离器的及时更新；
[0049]
文本分离器的文本分离方法有很多种，比如白底黑字二值图不处理，黑底白字二值图进行反色处理，灰度图进行二值化处理，
……
，彩底图片进行去底色去背景处理；
[0050]
文本分离器需要对文本分离后的文本字符区域进行倾斜纠偏后处理，得到水平或者垂直的文本字符；
[0051]
文本分离器需要对分离出来的文本字符进行修正补全后处理，得到清晰完整的文本字符。
[0052]
上述步骤40具体包括：
[0053]
利用文本评价器对的文本分离结果进行评估，得到文本字符的评价结果，并记录给出该评价结果的原因，比如清晰、倾斜、断线、模糊、空心等中的一种或者多种；
[0054]
对于评估结果满意的文本分离结果不做处理，直接输出；对于评估结果不满意的文本分离结果，将对应的分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0055]
上述步骤50具体包括：
[0056]
利用反馈机制，对于评估结果不理想的图像，根据效果差的原因将分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0057]
虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵胜男;杜兴春;周倩竹;宋菲菲;王长征
技术所有人：同方知网（北京）技术有限公司
我是此专利的发明人

上一篇：一种复合材料三点/四点弯曲疲劳测试方法及装置与流程
上一篇：一种高稳定的5G宽频天线用散热器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。