一种高精度字符分割方法及系统

文档序号:38520840发布日期:2024-07-01 23:00阅读:21来源:国知局
一种高精度字符分割方法及系统

本发明属于图像处理和字符分割,具体涉及一种高精度字符分割方法及系统。


背景技术:

1、在基于汉字修改的隐写溯源中,通过对汉字变形,嵌入隐写信息,从而实现隐写溯源。在汉字笔画微变形的隐写溯源中,需要利用程序算法提取变形汉字中的隐写信息。在提取信息时,需要拿到每个汉字字符的精准分割图,由于汉字的结构复杂,汉字字符数量大,汉字变形微小,纸张扫描不清晰,加上屏幕拍摄摩尔纹等问题,采用传统的投影法分割字符(尤其汉字字符)会出现字符粘连,字符拆分;如图1所示,字符拆分的情况:“如”左右结构的字符被分割为两个字符,“小”被分割为两个字符;字符粘连的情况:“键字”两个字符粘连。

2、现有的基于神经网络的ocr技术已经非常成熟,字符识别准确率非常高,但是返回的字符对应的坐标信息存在较大误差,如图2所示。

3、因此,本领域亟需开发一种在投影法基础上结合ocr文本与相似度判别的高精度字符分割方法及系统。


技术实现思路

1、基于现有技术中存在的上述缺点和不足,本发明的目的之一是至少解决现有技术中存在的上述问题之一或多个,换言之,本发明的目的之一是提供满足前述需求之一或多个的一种高精度字符分割方法及系统。

2、为了达到上述发明目的,本发明采用以下技术方案:

3、一种高精度字符分割方法,包括以下步骤:

4、s1、训练字符相似度判别模型;

5、s2、对待分割处理的字符图片进行预处理;

6、s3、统计各类别字符的宽度,得到各类别字符对应的参考宽度范围;

7、s4、对经过步骤s2预处理之后的字符图片进行ocr识别,得到按行进行存储的ocr文本;

8、s5、基于各类字符对应的参考宽度范围对ocr文本按行进行动态分割;

9、s6、利用字符相似度判别模型对分割得到的字符图片与当前字符位置的ocr文本对应的标准字符图片进行相似度计算;若相似度低于第一目标阈值,则进行字符分割纠错,转至步骤s7;

10、s7、将分割得到的字符图片与当前字符前一或后一位置的ocr文本对应的标准字符图片进行相似度计算;若相似度高于第二目标阈值,则其所在行的字符串向前或者向后滚动一个字符。

11、作为优选方案,所述步骤s5中,对字符图片进行按行处理,对于每一行记录下起始位置start,值为0;

12、根据待分割字符在所在行中的位置,读取ocr文本并利用ocr文本判定待分割字符所属字符类别,然后基于对应字符类别的参考宽度范围进行动态分割。

13、作为优选方案,所述步骤s5中,在动态分割过程中,首先利用投影法与直方图波谷位置,初步确定分割的位置,记录当前分割位置;

14、计算当前分割位置距离上一个已定分割位置的间距作为当前字符宽度;

15、若当前字符宽度处于对应字符类别的参考宽度范围内,则当前分割位置正确,继续进行下一个字符的分割;

16、若当前字符宽度未处于对应字符类别的参考宽度范围内,则继续利用投影法寻找下一个分割位置,将下一个分割位置与当前分割位置的间距作为下一字符的宽度;

17、若下一字符的宽度比当前字符的参考宽度范围的最小参考宽度大,则当前分割位置正确;

18、若下一字符的宽度加上当前字符宽度大于当前字符的参考宽度范围的最大参考宽度的目标倍数,则当前分割位置正确;

19、其余情况,则将下一分割位置变更为当前分割位置进行分割。

20、作为优选方案,所述步骤s1包括:

21、数据准备:收集一组包含相似和不相似字符图片的数据集,将数据集划分为训练集和验证集;

22、搭建模型:选用vgg模型;

23、数据预处理:在将图片输入vgg模型之前,需要对图片进行预处理;预处理包括将图片的尺寸调整为固定大小、归一化像素值;

24、定义损失函数:选择使用对数损失函数、二元交叉熵损失函数、hinge损失函数或focal损失函数;

25、进行训练:使用训练集对vgg模型进行训练;通过将图片输入vgg模型并计算损失,然后使用反向传播算法来更新模型的权重和偏置,从而最小化损失函数;

26、模型评估:使用验证集对训练的模型进行评估;

27、模型应用:将新的图片对输入到模型中,模型将输出一个0到1的数值,表示两张图片的相似度。

28、作为优选方案,所述步骤s2中,预处理包括矫正和二值化,得到二值化图片。

29、作为优选方案,所述步骤s3中,字符类别包括中文字符、大写英文字符、小写英文字符、数字字符、标点字符。

30、作为优选方案,所述步骤s3中,中文字符的参考宽度范围的确定过程包括:

31、利用投影法得到每一个字符的宽度;

32、在所有的宽度中取一个众数作为中等宽度middle_width,取不超过两倍众数的宽度作为最大参考宽度max_width,利用最大参考宽度与中等宽度计算最小参考宽度min_width=middle_width-(max_width-middle_width),最终得到最小参考宽度至最大参考宽度构成的参考宽度范围。

33、作为优选方案,基于中文字符宽度与小写英文字符、大写英文字符、标点字符、数字字符宽度存在比例关系,根据统计得到的众数和中文字符宽度估计其他字符的参考宽度范围。

34、本发明还提供一种高精度字符分割系统,应用如上方案所述的高精度字符分割方法,高精度字符分割系统包括:

35、模型训练模块,用于训练字符相似度判别模型;

36、预处理模块,用于对待分割处理的字符图片进行预处理;

37、先验宽度处理模块,用于统计各类别字符的宽度,得到各类别字符对应的参考宽度范围;

38、ocr预处理模块,用于对经过预处理之后的字符图片进行ocr识别,得到按行进行存储的ocr文本;

39、分割模块,用于基于各类字符对应的参考宽度范围对ocr文本按行进行动态分割;

40、分割纠错模块,用于在利用字符相似度判别模型对分割得到的字符图片与当前字符位置的ocr文本对应的标准字符图片进行相似度计算且相似度低于第一目标阈值时,进行字符分割纠错,将分割得到的字符图片与当前字符前一或后一位置的ocr文本对应的标准字符图片进行相似度计算;若相似度高于第二目标阈值,则其所在行的字符串向前或者向后滚动一个字符。

41、本发明与现有技术相比,有益效果是:

42、本发明的高精度字符分割方法及系统,在投影法基础上结合ocr文本与相似度判别,有效地解决了字符分割粘连以及字符被强制拆分的缺陷。



技术特征:

1.一种高精度字符分割方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的高精度字符分割方法,其特征在于,所述步骤s5中,对字符图片进行按行处理,对于每一行记录下起始位置start,值为0;

3.根据权利要求2所述的高精度字符分割方法,其特征在于,所述步骤s5中,在动态分割过程中,首先利用投影法与直方图波谷位置,初步确定分割的位置,记录当前分割位置;

4.根据权利要求1所述的高精度字符分割方法,其特征在于,所述步骤s1包括:

5.根据权利要求1所述的高精度字符分割方法,其特征在于,所述步骤s2中,预处理包括矫正和二值化,得到二值化图片。

6.根据权利要求1所述的高精度字符分割方法,其特征在于,所述步骤s3中,字符类别包括中文字符、大写英文字符、小写英文字符、数字字符、标点字符。

7.根据权利要求6所述的高精度字符分割方法,其特征在于,所述步骤s3中,中文字符的参考宽度范围的确定过程包括:

8.根据权利要求7所述的高精度字符分割方法,其特征在于,基于中文字符宽度与小写英文字符、大写英文字符、标点字符、数字字符宽度存在比例关系,根据统计得到的众数和中文字符宽度估计其他字符的参考宽度范围。

9.一种高精度字符分割系统,应用如权利要求1所述的高精度字符分割方法,其特征在于,高精度字符分割系统包括:


技术总结
本发明涉及高精度字符分割方法及系统,包括:训练字符相似度判别模型;对待分割处理的字符图片进行预处理;统计各类别字符对应的参考宽度范围;对经过预处理之后的字符图片进行OCR识别,得到OCR文本;基于各类字符对应的参考宽度范围对OCR文本按行进行动态分割;利用字符相似度判别模型对分割得到的字符图片与当前字符位置的OCR文本对应的标准字符图片进行相似度计算;若相似度低于第一目标阈值,则进行字符分割纠错;将分割得到的字符图片与当前字符前一或后一位置的OCR文本对应的标准字符图片进行相似度计算;若相似度高于第二目标阈值,则其所在行的字符串向前或者向后滚动一个字符。本发明有效解决字符分割粘连以及字符被强制拆分的缺陷。

技术研发人员:张祯,陈恺,吴国华,苗功勋,周起鹏,陈加明
受保护的技术使用者:杭州电子科技大学
技术研发日:
技术公布日:2024/6/30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1