文本检测方法、装置、设备和介质与流程

文档序号:35973161发布日期:2023-11-09 15:01阅读:47来源:国知局
文本检测方法、装置、设备和介质与流程

本申请涉及图像处理,例如涉及一种文本检测方法、装置、设备和介质。


背景技术:

1、文本检测是图像处理中的一个重要部分,现有技术中的文本检测方法通常是将图像进行二值化处理,使图像的文本区域和背景区域出现明显的黑白效果。

2、当文本在图像中较为明显,即文本与背景容易区分时,现有的文本检测算法就能很容易地对文本区域和背景区域进行区分。然而,当文本的颜色与背景较为相似,即文本与背景很难区分时,现有的文本检测算法在进行二值化处理时,很容易将其误划分为背景区域,从而导致对此类文本的漏检。


技术实现思路

1、本申请目的在于:提供一种文本检测方法、装置、设备和介质,其能够在文本和背景区分难度较大的情况下,提高文本检测的完整性。

2、为达到上述目的,本申请提供了一种文本检测方法,包括:

3、对目标图像提取若干个不同尺度的初始特征信息,并对所述初始特征信息叠加,得到叠加特征信息;

4、通过预设的感受野模块对所述叠加特征信息进行特征增强,得到第一增强特征;

5、通过预设的注意力模块对所述第一增强特征进行注意力增强,得到第二增强特征;

6、根据所述第二增强特征,对所述目标图像进行文本框拟合,并通过拟合得到的文本框进行文本检测。

7、本申请还提供了一种文本检测装置,包括:

8、特征识别单元,用于对目标图像提取若干个不同尺度的初始特征信息,并对所述初始特征信息叠加,得到叠加特征信息;

9、感受野增强单元,用于通过预设的感受野模块对所述叠加特征信息进行特征增强,得到第一增强特征;

10、注意力增强单元,用于通过预设的注意力模块对所述第一增强特征进行注意力增强,得到第二增强特征;

11、文本定位单元,用于根据所述第二增强特征,对所述目标图像进行文本框拟合,并通过拟合得到的文本框进行文本检测。

12、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的一种文本检测方法和/或上述任一项所述的文本检测方法的步骤。

13、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的一种文本检测方法和/或上述任一项所述的文本检测方法的步骤。

14、本申请的一种文本检测方法,通过对目标图像进行多个尺度的特征提取,并对各个尺度的特征进行叠加,从而得到同时包含空间信息和上下文信息的叠加特征信息;通过预设的感受野模块对叠加特征信息进行特征增强,从而提高了图像的感受野,同时捕捉不同感受野的信息,实现了模拟人类视觉的效果;通过预设的注意力模块对第一增强特征进行注意力增强,得到了特征图通道之间的长范围语义依赖关系和各个位置之间的语义关联,提高了特征的置信度;基于特征增强后的特征进行文本框拟合,能够提高在文本和背景之间的区分度,从而提高文本检测的完整性。



技术特征:

1.一种文本检测方法,其特征在于,包括:

2.根据权利要求1所述的文本检测方法,其特征在于,所述通过预设的感受野模块对所述叠加特征信息进行特征增强,得到第一增强特征,包括:

3.根据权利要求1所述的文本检测方法,其特征在于,所述通过预设的注意力模块对所述第一增强特征进行注意力增强,得到第二增强特征,包括:

4.根据权利要求3所述的文本检测方法,其特征在于,所述对所述通道增强特征进行空间增强,得到所述第二增强特征,包括:

5.根据权利要求1所述的文本检测方法,其特征在于,所述根据所述第二增强特征,对所述目标图像进行文本框拟合,并通过拟合得到的文本框进行文本检测,包括:

6.根据权利要求1所述的文本检测方法,其特征在于,所述对目标图像提取若干个不同尺度的初始特征信息,包括:

7.根据权利要求1所述的文本检测方法,其特征在于,所述对目标图像提取若干个不同尺度的初始特征信息,包括:

8.一种文本检测装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的文本检测方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的文本检测方法的步骤。


技术总结
本申请的一种文本检测方法,包括:对目标图像提取若干个不同尺度的初始特征信息,并对所述初始特征信息叠加,得到叠加特征信息;通过预设的感受野模块对所述叠加特征信息进行特征增强,得到第一增强特征;通过预设的注意力模块对所述第一增强特征进行注意力增强,得到第二增强特征;根据所述第二增强特征,对所述目标图像进行文本框拟合,并通过拟合的文本框进行文本检测,从而在文本和背景区分难度较大的情况下,提高文本检测的完整性。

技术研发人员:赵佳鹏
受保护的技术使用者:广州视源电子科技股份有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1