字符识别方法和设备的制造方法

文档序号:9751307阅读:610来源:国知局
字符识别方法和设备的制造方法
【技术领域】
[0001] 本发明涉及模式识别领域,具体涉及一种字符识别方法和设备。
【背景技术】
[0002] 在许多领域,均需要进行字符识别。下面以银行卡卡号识别为例进行说明。在金 融、财务、保险和电商等行业的业务中,经常涉及到银行卡(包括借记卡、信用卡等)信息,而 银行卡卡号是其中最关键的信息。大多数情况下,当使用银行卡卡号时,需要用户人工识别 该银行卡卡号并将其输入相关设备,这一过程费时且容易出错。目前,出现了一些可以从银 行卡图像中自动识别银行卡卡号的系统。这些系统可以通过智能手机、平板电脑等设备上 的摄像头获取银行卡图像,并自动定位和识别银行卡卡号。参见图la至ld,在其中示出了银 行卡图像的示例。类似上述自动识别银行卡卡号的系统的字符识别系统在识别精度和适应 性两方面存在不足之处。

【发明内容】

[0003] 鉴于上述问题,提出了本发明以便提供一种至少部分地解决上述问题的字符识别 方法和设备。
[0004] 根据本发明一个方面,提供了一种字符识别方法。该字符识别方法包括以下步骤。 利用回归模型确定待识别图像的待识别字符区域。在待识别字符区域中进行字符识别。回 归模型根据第一样本图像的字符区域获得。第一样本图像包括与待识别图像相同类型的图 像。
[0005] 根据本发明另一个方面,提供了一种字符识别设备。该字符识别设备包括区域确 定装置和字符识别装置。区域确定装置用于利用回归模型确定待识别图像的待识别字符区 域。字符识别装置用于在待识别字符区域中进行字符识别。回归模型根据第一样本图像的 字符区域获得。第一样本图像包括与待识别图像相同类型的图像。
[0006] 根据本发明提供的字符识别方法和设备,由于利用根据样本图像获得的回归模型 来确定待识别字符区域,因此对字符的定位具有精确度高、适应性强的特点,从而可以极大 提高字符识别的精度和可靠性。
[0007]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0008] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0009] 图la至Id示出银行卡图像的示例;
[0010] 图2示出根据本发明一个实施例的字符识别方法的流程图;
[0011] 图3示出银行卡图像的另一示例;
[0012] 图4示出银行卡的字符区域的示例;
[0013] 图5示出根据本发明一个实施例的回归模型的训练方法的流程图;
[0014] 图6示出根据本发明一个实施例的确定待识别图像的待识别字符区域的步骤的流 程图;
[0015] 图7示出根据本发明一个实施例的在待识别字符区域中进行字符识别的步骤的流 程图;
[0016] 图8示出根据本发明一个实施例的提取子图像的示意图;
[0017]图9示出银行卡图像的又一示例;
[0018] 图10示出根据本发明一个实施例的对待识别字符区域进行水平校正的示意图;以 及
[0019] 图11示出根据本发明一个实施例的字符识别设备的示意性框图。
【具体实施方式】
[0020] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例 所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。
[0021] 根据本发明实施例的字符识别方法和设备可以应用于多种字符识别领域,例如可 以对银行卡上的银行卡号、身份证上的身份证号、工作证上的工号、营业执照上的注册号等 各种号码进行识别。作为示例,下文以银行卡卡号识别为例对本发明提供的字符识别方法 和设备进行描述,这不应构成对本发明的限制。
[0022] 为了有效识别图像中的字符,本发明提供了一种字符识别方法。图2示出了根据本 发明一个实施例的字符识别方法2〇〇的流程图。如图2所示,该字符识别方法200包括步骤 S210和步骤S220。
[0023] 在步骤S210,利用回归模型确定待识别图像J的待识别字符区域。该回归模型根据 第一样本图像的字符区域获得。字符区域是指目标字符存在的区域。目标字符是期望识别 的字符,例如银行卡的卡号。待识别字符区域是指待识别图像J中的待识别字符区域。参见 图3,示出了银行卡图像的另一示例。在图3所示的银行卡图像中,由方框301包围的区域为 待识别字符区域,也就是银行卡图像中的卡号区域。第一样本图像包括与待识别图像J相同 类型的图像。相同类型的图像是指两图像来源于包括位置相似度满足预定条件的字符区域 的对象。
[0024] 下文以第一对象和第二对象来帮助阐述所述预定条件,第一对象和第二对象仅用 于区分目的,其并不代表顺序。例如,假设第一对象的字符区域在第一对象中的位置用其字 符区域的四个顶点坐标来表示,第二对象的字符区域在第二对象中的位置用其字符区域的 四个顶点坐标来表示。所述预定条件可以是第一对象和第二对象的高度(用Η表示)和宽度 (用W表示)均相同,第一对象的四个顶点的横坐标和第二对象的四个顶点的横坐标均在1/ 12W-11/12W的范围内,第一对象的四个顶点的纵坐标和第二对象的四个顶点的纵坐标均在 1/3H-2/3H的范围内,并且第一对象的字符区域的顶点的横坐标与第二对象的字符区域的 对应顶点的横坐标之间的差值不超过1/6W,第一对象的字符区域的顶点的纵坐标与第二对 象的字符区域的对应顶点的纵坐标之间的差值不超过1/3H。如图4所示,以银行卡400为例, 假设银行卡的高度为H,宽度为W。银行卡卡号通常出现在银行卡上的区域401内。区域401在 银行卡中占据1/3H*10/12W的面积,如果某个对象的字符区域超出这个范围则说明该对象 不是银行卡。换言之,相同类型的图像采集于相同类型的拍摄对象,例如均为银行卡。这样, 该两张银行卡的待识别字符区域是大小、位置大致相同的,位置相似度满足预定条件。虽然 采集其图像时,银行卡可能会歪斜等,但是银行卡图像的待识别字符区域的位置是大致相 同的。对于任意两张身份证来说,虽然局部会有不同,例如,持卡人姓名处,但是,绝大多数 区域是完全相同的。因此,两个银行卡的图像属于相同类型的图像,而一个银行卡图像与一 个身份证图像属于不同类型的图像。
[0025] 可以通过图像采集装置来获得待识别图像J,例如银行卡图像。图像采集装置可以 是例如智能手机、平板电脑等移动终端上的摄像头,也可以是数码相机等单独的摄像装置。 上述图像采集装置的示例仅用于说明目的,并不构成对本发明的限制。图像采集装置可以 是其他任何合适的、能够采集待识别图像J的装置。这些图像采集装置采集待识别图像J之 后,可以将该待识别图像J以有线或无线的方式传送到字符识别设备中,以通过字符识别方 法200来识别该待识别图像J上的字符,例如银行卡图像上的银行卡卡号。
[0026] 回归模型是根据第一样本图像的字符区域获得的。第一样本图像可以是大量的、 字符区域已知的图像。回归模型可以是例如能够描述图像的字符区域与该图像的特征之间 的相关性的模型。由于回归模型是预先已知的,因此通过回归模型可以推算出待识别图像J 的待识别字符区域,也就是说,对待识别字符区域进行定位。之后就可以进一步识别该待识 别字符区域内包含的图像内容。
[0027] 在步骤S220,在该待识别字符区域中进行字符识别。字符识别是指将字符区域的 图像内容转化为字符串(例如,银行卡卡号)的过程。字符识别可以通过多种识别方法来实 现,例如可以通过二值化操作结合模板匹配或模式分类的方式等。后文将对字符识别的方 式进行详细描述,在此不再赘述。
[0028] 根据本发明提供的字符识别方法,由于利用根据样本图像获得的回归模型来确定 待识别字符区域,因此对字符的定位比较高效准确,适应性强,因此该方法可以极大提高字 符识别的精度和可靠性。
[0029] 可选地,回归模型经训练而获得。对字符区域进行定位的目的在于估计字符在图 像中的位置(可以由字符区域的四个顶点的坐标表示)。根据本发
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1