字符识别方法和设备的制造方法_4

文档序号:9751307阅读:来源:国知局
子图像。
[0078] 当待识别字符区域不具有规则尺寸时,可以事先将待识别字符区域统一为标准高 度,这样可以有利于后续对子图像的图像内容进行识别,可以进一步提高字符识别精度。 [0079]可选地,在步骤S220之前,字符识别方法200可以进一步包括:对待识别字符区域 进行水平校正。
[0080] 在实际应用中,诸如银行卡图像的待识别图像可能存在一定的倾斜角度。因此,可 以在识别字符之前,对字符所在的区域进行校正,将其转换为水平平齐的状态(参见图10)。 由于在步骤S210中,已经确定了待识别字符区域的位置,例如已获得了待识别字符区域的 四个顶点的坐标,因此对待识别字符区域进行校正的过程非常简单,例如只需提取四个顶 点所限定的图像区域并将其旋转到水平方向即可。
[0081] 根据本发明另一方面,提供一种字符识别设备。图11示出根据本发明一个实施例 的字符识别设备1100的示意性框图。字符识别设备1100包括区域确定装置1110和字符识别 装置1120。
[0082] 区域确定装置1110用于利用回归模型确定待识别图像J的待识别字符区域。其中, 回归模型根据第一样本图像的字符区域获得,第一样本图像包括与待识别图像J相同类型 的图像。字符识别装置1120用于在待识别字符区域中进行字符识别。
[0083] 如上文所述的,可以通过图像采集装置来获得待识别图像J。图像采集装置可以是 例如智能手机、平板电脑等移动终端上的摄像头,也可以是数码相机等单独的摄像装置。这 些图像采集装置采集待识别图像J之后,可以将该待识别图像J以有线或无线的方式传送到 字符识别设备1100中,以由字符识别设备1100来识别该待识别图像J上的字符,例如银行卡 图像上的银行卡卡号。可以理解,字符识别设备1100可以在图像采集装置的本地实现,例如 图像采集装置是移动终端的摄像头,字符识别设备1100可以实现为该移动终端的处理器。 图像采集装置也可以是单独的摄像装置,字符识别设备1100可以实现为远程主机。摄像装 置可以利用诸如Wifi的无线传输方式将待识别图像J传输到远程主机。
[0084] 可选地,字符识别设备1100可以进一步包括第一训练装置(未示出),用于训练回 归模型。第一训练装置可以包括归一化模块、第一缩放模块、第一特征计算模块和回归模 块。归一化模块用于将第一样本图像的字符区域的绝对顶点坐标归一化。第一缩放模块用 于将第一样本图像缩放,以获得具有标准尺寸的第一样本图像。第一特征计算模块用于根 据预设的特征计算方法计算具有标准尺寸的第一样本图像的特征。回归模块用于利用回归 算法,根据第一样本图像的字符区域的、归一化的顶点坐标以及具有标准尺寸的第一样本 图像的特征计算回归模型。第一训练装置在计算回归模型的过程中综合考虑了第一样本图 像的字符区域的位置以及第一样本图像的特征之间的相关性,因此获得的回归模型可以较 好地抵抗干扰因素对字符识别的影响。第一训练装置可以与区域确定装置相连,其将训练 好的回归模型传送给区域确定装置1110,以由区域确定装置1110在确定待识别字符区域时 使用。
[0085] 可选地,区域确定装置1110可以包括第二缩放模块、第二特征计算模块、坐标计算 模块和反归一化模块(未示出)。第二缩放模块用于将待识别图像J缩放,以获得具有标准尺 寸的待识别图像J'。第二特征计算模块用于根据预设的特征计算方法计算具有标准尺寸的 待识别图像j'的特征f σ')。坐标计算模块用于将特征f(j')输入回归模型,以获得待识别 字符区域的、归一化的顶点坐标P(J')。反归一化模块,用于基于归一化的顶点坐标P(J')计 算待识别字符区域的绝对顶点坐标P(J)。上述的区域确定装置1110中的四个功能模块相互 协作,可以高效准确地确定待识别字符区域。
[0086] 可选地,上述预设的特征计算方法可以包括梯度特征计算方法和/或纹理特征计 算方法。上文已经对梯度特征计算方法和纹理特征计算方法进行了描述,在此不再赘述。
[0087] 可选地,字符识别装置1120可以包括二值化模块和模板识别模块(未示出)。二值 化模块用于对待识别字符区域进行二值化操作。模板识别模块用于基于二值化操作的结 果,利用字符模板来进行字符识别。二值化模块可以分割出待识别字符区域内的每个字符。 模板识别模块可以将二值化模块输出的每个字符与字符模板相匹配,以识别出字符。
[0088] 可选地,字符识别装置1120在待识别字符区域中进行字符识别是利用多类分类 器。字符识别设备1100可以进一步包括第二训练装置(未示出),用于训练多类分类器。第二 训练装置可以包括第三特征计算模块和训练模块。第三特征计算模块用于计算第二样本图 像中的字符子图像的特征。第二样本图像包括与待识别图像J相同类型的图像。训练模块用 于根据字符子图像的特征和对应的字符训练多类分类器。
[0089] 可选地,字符识别装置1120可以包括提取模块、第四特征计算模块和字符识别模 块(未示出)。提取模块用于提取待识别字符区域中的相同宽度的子图像直至遍历整个待识 别字符区域。第四特征计算模块用于计算子图像的特征。字符识别模块用于利用多类分类 器,基于子图像的特征进行字符识别。其中,两个相邻子图像之间具有重叠部分,并且其中 子图像的宽度大于或等于最大字符宽度并且小于或等于最小字符宽度与字符间隔之和。提 取模块、第四特征计算模块和字符识别模块可以相互协作以利用多类分类器进行字符识 另IJ,这样可以提高字符识别精度。
[0090] 可选地,第二训练装置还可以包括第三缩放模块(未示出),用于将字符子图像缩 放为具有标准高度,并保持字符子图像的宽高比不变。字符识别装置1120还可以包括第四 缩放模块(未示出),用于将待识别字符区域缩放为具有标准高度,并保持待识别字符区域 的宽高比不变。第三缩放模块和第四缩放模块可以分别将字符子图像和待识别字符区域缩 放为标准尚度,因此,可以进一步提尚字符识别精度。
[0091] 可选地,字符识别设备1100可以进一步包括校正装置(未示出),用于对待识别字 符区域进行水平校正。校正装置可以调整待识别字符区域的方向和/或位置,例如旋转待识 别字符区域,使得待识别字符区域最终处于水平平齐状态。对待识别字符区域进行水平校 正也可以提高字符识别精度。
[0092] 字符识别设备1100可以实现在移动终端或计算机等各种计算设备中,或者以单独 的硬件、软件、固件或其任意组合来实现。
[0093]本领域普通技术人员通过阅读上文关于字符识别方法的详细描述,能够理解上述 字符识别设备的结构、运行方式以及优点,因此这里不再赘述。
[0094]在此提供的方法和装置不与任何特定计算机、虚拟系统或者其它设备固有相关。 各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求 的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种 编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发 明的最佳实施方式。
[0095]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,以便不模糊对本说明书的理解。
[0096]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身 都作为本发明的单独实施例。
[0097]本领域那些技术人员可以理解,除了这样的特征和/或过程或者单元中的至少一 些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中 公开的所有特征以及如此公开的任何方法或者装置的所有过程或单元进行组合。除非另外 明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相 同、等同或相似目的的替代特征来代替。
[0098]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例 中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1