识别图像中的字符的方法及装置的制造方法
【技术领域】
[0001] 本公开涉及图像识别技术领域,尤其涉及一种识别图像中的字符的方法及装置。
【背景技术】
[0002] 在对诸如印刷数字进行识别时,需要对数字进行特征提取。在对数字进行特征提 取前,需要对图像进行相应的预处理,从而使数字的特征提取能更加顺利或使得数字的特 征能更好地显露出,梯度算子是相关技术中对图像进行预处理时的一个重要手段,然而,梯 度算子在对图像进行预处理时,计算量较大。
【发明内容】
[0003] 为克服相关技术中存在的问题,本公开实施例提供一种识别图像中的字符的方法 及装置,用以降低字符识别过程中的计算量。
[0004] 根据本公开实施例的第一方面,提供一种识别图像中的字符的方法,包括:
[0005] 确定所述图像中所包含的字符的第一个数;
[0006] 将所述图像中所包含的字符分割为所述第一个数的字符图片;
[0007] 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数 的图片单元;
[0008] 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
[0009] 在一实施例中,所述方法还可包括:
[0010] 对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,执行所述确定所 述图像中所包含的字符的个数的步骤。
[0011] 在一实施例中,所述方法还包括:
[0012] 从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述 图像中的梯度;
[0013] 通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,执行 所述根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数 的字符图片的步骤。
[0014] 在一实施例中,所述根据所述第二个数的图片单元内的非零像素点的个数识别所 述图像中的字符,可包括:
[0015] 依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的 第一组非零像素点的个数;
[0016] 依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分 辨率大小的第二组非零像素点的个数;
[0017] 根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图 像中的字符。
[0018] 在一实施例中,所述根据所述第一组非零像素点的个数和所述第二组非零像素点 的个数识别所述图像中的字符,可包括:
[0019] 依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点 的个数的差值的绝对值;
[0020] 确定所述第二个数的绝对值的和值中的最小值对应的字符模板;
[0021] 将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
[0022] 根据本公开实施例的第二方面,提供一种识别图像中的字符的装置,包括:
[0023] 第一确定模块,被配置为确定所述图像中所包含的字符的第一个数;
[0024] 第一分割模块,被配置为将所述图像中所包含的字符分割为所述第一确定模块确 定的所述第一个数的字符图片;
[0025] 第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定 大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
[0026] 识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元 内的非零像素点的个数识别所述图像中的字符。
[0027] 在一实施例中,所述装置还可包括:
[0028] 图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的 图像;之后,所述第一确定模块执行所述确定所述图像中所包含的字符的第一个数的步骤。
[0029] 在一实施例中,所述装置还可包括:
[0030] 第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向 与竖直方向确定所述第一个数的字符在所述图像中的梯度;
[0031] 第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在 所述水平方向与所述竖直方向的边界;之后,所述第一分割模块执行所述根据所述水平边 界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。
[0032] 在一实施例中,所述识别模块可包括:
[0033] 第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所 述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
[0034] 第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的 模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
[0035] 第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零 像素点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述 图像中的字符。
[0036] 在一实施例中,所述第一识别子模块可包括:
[0037] 计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所 述第二组非零像素点的个数的差值的绝对值;
[0038] 确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的 和值中的最小值对应的字符模板;
[0039] 第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板 对应的字符识别为所述字符图片中的字符。
[0040] 根据本公开实施例的第三方面,提供一种识别图像中的字符的装置,包括:
[0041] 处理器;
[0042] 用于存储处理器可执行指令的存储器;
[0043] 其中,所述处理器被配置为:
[0044] 确定所述图像中所包含的字符的第一个数;
[0045] 将所述图像中所包含的字符分割为所述第一个数的字符图片;
[0046] 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数 的图片单元;
[0047] 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
[0048] 本公开的实施例提供的技术方案可以包括以下有益效果:由于印刷字符在水平方 向与竖直方向均存在很强的边缘,并且在字符图片的分辨率确定的情况下,设定字符的非 零像素点的个数较为固定,因此通过第二个数的图片单元内的非零像素点的个数识别图像 中的字符可以简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强了字符 识别时的鲁棒性。
[0049] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。
【附图说明】
[0050] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0051] 图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图。
[0052] 图1B是根据一示例性实施例示出的图像的示意图。
[0053] 图1C是根据一示例性实施例示出的字符图片的示意图。
[0054] 图1D是根据一示例性实施例示出的图片单元的示意图。
[0055] 图1E是根据一示例性实施例一示出的二值化后的字符图片的示意图。
[0056] 图2是根据一示例性实施例一示出的识别图像中的字符的方法的流程图。
[0057] 图3A是根据一示例性实施例二示出的识别图像中的字符的方法的流程图。
[0058] 图3B是根据一示例性实施例二示出的步骤S304的流程图。
[0059] 图4是根据一示例性实施例示出的一种识别图像中的字符的装置的框图。
[0060] 图5是根据一示例性实施例示出的另一种识别图像中的字符的装置的框图。
[0061] 图6是根据一示例性实施例示出的一种适用于识别图像中的字符的装置的框图。
【具体实施方式】
[0062] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0063] 图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图,图1B是 根据一示例性实施例示出的图像的示意图,图1C是根据一示例性实施例示出的