提取字符的方法、系统、电子设备及存储介质与流程

文档序号:22243735发布日期:2020-09-15 19:59阅读:来源:国知局

技术特征:

1.一种提取字符的方法,其特征在于,所述方法包括:

初始化字符图像,获得包括字符的二值图像;

根据所述二值图像中字符的大小设置扫描框;

利用所述扫描框沿着扫描路径扫描所述二值图像;

判断所述扫描框内是否存在字符;

若是,则提取所述扫描框内的字符。

2.如权利要求1所述的提取字符的方法,其特征在于,所述扫描框的高度在所述二值图像中字符的平均高度和最大高度之间取值;

所述扫描框的宽度在所述二值图像中字符的平均宽度和最大宽度之间取值。

3.如权利要求1所述的提取字符的方法,其特征在于,所述判断所述扫描框内是否存在字符的步骤包括:

判断所述扫描框是否满足提取条件,所述提取条件包括:

所述二值图像在所述扫描框内的像素值之和大于0,并且在所述扫描框边界上的像素值之和等于0;

若是,则所述扫描框内存在字符。

4.如权利要求3所述的提取字符的方法,其特征在于,所述判断所述扫描框是否满足提取条件的步骤包括:

当所述二值图像在所述扫描框内的像素值之和大于0,并且在所述扫描框边界上的像素值之和大于0时,向外延伸所述扫描框的边界,直至所述二值图像在延伸后的边界上的像素值之和等于0,则调整后扫描框满足提取条件;

所述提取所述扫描框内的字符的步骤包括:

提取调整后扫描框内的字符。

5.如权利要求3所述的提取字符的方法,其特征在于,所述提取所述扫描框内的字符的步骤包括:

向内延伸所述扫描框的边界,直至所述二值图像在调整后的边界上的像素值之和大于0;

将调整后的边界向外延伸一个像素;

提取调整后扫描框内的字符。

6.如权利要求1所述的提取字符的方法,其特征在于,在所述提取所述扫描框内的字符的步骤之后,所述方法还包括:

判断所述扫描框向下一位置延伸预设长度的范围内是否有像素点;

若是,则所述扫描框移至下一位置继续扫描所述二值图像;

将提取到的当前字符和上一字符标记为关联字符;

若否,则所述扫描框移至下一位置继续扫描所述二值图像。

7.如权利要求1-6中任一项所述的提取字符的方法,其特征在于,在所述提取所述扫描框内的字符的步骤之后,所述方法还包括:

识别提取到的字符。

8.如权利要求7所述的提取字符的方法,其特征在于,所述识别提取得到的字符的步骤包括:

获取模板字符;

初始化提取得到的字符,获得与所述模板字符大小相同的待识别字符;

计算所述待识别字符和所述模板字符的相似度;

判断所述相似度是否大于预设阈值;

若是,则识别所述待识别字符为所述模板字符。

9.如权利要求8所述的提取字符的方法,其特征在于,所述计算所述待识别字符和所述模板字符的相似度的步骤包括:

根据分割模板将所述模板字符分割为若干模板子字符;

根据所述分割模板将所述待识别字符分割为若干待识别子字符;

分别计算对应所述分割模板相同位置的模板子字符和待识别子字符的子相似度;

所述判断所述相似度是否大于预设阈值的步骤包括:

判断每个子相似度是否均大于对应的预设子阈值。

10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任一项所述的提取字符的方法。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的提取字符的方法的步骤。

12.一种提取字符的系统,其特征在于,所述系统包括:

图像初始化模块,用于初始化字符图像,获得包括字符的二值图像;

扫描框设置模块,用于根据所述二值图像中字符的大小设置扫描框;

扫描模块,用于利用所述扫描框沿着扫描路径扫描所述二值图像;

提取条件判断模块,用于判断判断所述扫描框内是否存在字符;

若是,则调用提取模块,所述提取模块用于提取所述扫描框内的字符。


技术总结
本发明公开了一种提取字符的方法、系统、电子设备及存储介质。其中,方法包括:初始化字符图像,获得包括字符的二值图像;根据所述二值图像中字符的大小设置扫描框;利用所述扫描框沿着扫描路径扫描所述二值图像;判断所述扫描框内是否存在字符;若是,则提取所述扫描框内的字符。本发明基于扫描框来扫描二值图像,无需检验字符边缘,也无需计算字符内在连通域,极大地简化了字符的提取,降低了提取字符的成本。

技术研发人员:杨寒冰
受保护的技术使用者:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
技术研发日:2019.03.08
技术公布日:2020.09.15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1