一种票据识别区域的调整方法、装置、设备及存储介质与流程

文档序号:32978828发布日期:2023-01-17 21:44阅读:29来源:国知局
一种票据识别区域的调整方法、装置、设备及存储介质与流程

1.本技术涉及票据识别技术领域,具体而言,涉及一种票据识别区域的调整方法、装置、设备及存储介质。


背景技术:

2.目前,银行系统涉及的影像文件众多,支付业务的影像文件主要是票据凭证,票据凭证的票面信息是主要的交易数据与收付款依据,受人行监管,因此票据资金交易需要重点核对银行间的数据往来与票面信息的一致性。
3.票据相关交易,手工录入票面信息是主要的受理手段。交易系统将影像文件传至人工录入系统,人工录入系统读取影像并通过手工录入票面数据,将数据回传至交易系统。部分场景下为了提高准确度采用双人背靠背录入的方式,需要投入较多人力,繁琐、耗时、智能化程度低。为此,引入了光学字符识别(optical character recognition,ocr)功能,依托算法识别票据上的文字替代人工录入,在很大程度上解决人力耗费、交易处理时效的问题。目前主流的ocr产品对于标准化打印的票据识别率普遍能达到90%以上,基本满足业务需求;但因为手写体票据的数据不规范,经常会出现超出识别框或换行的情况,采用该产品识别不到该区域的数据,因此对于手写体票据的识别率普遍偏低,如数据有误,仍然会耗费大量的人力进行核对工作,更可能引发监管投诉。因此,需要对ocr产品对于手写体票据的识别率进行优化。


技术实现要素:

4.有鉴于此,本技术实施例提供了一种票据识别区域的调整方法、装置、设备及存储介质,能够提高光学字符识别平台对于手写体票据的识别率,利于后续大量的投入使用。
5.第一方面,本技术实施例提供了一种票据识别区域的调整方法,应用于交易系统,所述交易系统包括交易平台和光学字符识别平台,所述方法包括:
6.所述光学字符识别平台从所述交易平台获取第一手写体票据信息,采用与所述第一手写体票据信息中携带的票据种类匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;
7.所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果反馈给所述光学字符识别平台;
8.所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域;
9.所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
10.在一种可能的实施方式中,所述交易平台的任务池中包括多个携带有状态标签的
手写体票据;所述状态标签包括以下标签中的任意一种或多种:未识别、已识别、已处理、异常,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,包括:
11.所述光学字符识别平台从所述交易平台的任务池中获取携带有未识别标签的第一手写体票据的第一手写体票据信息。
12.在一种可能的实施方式中,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,包括:
13.所述交易平台根据接收到的所述识别结果将所述第一手写体票据的状态标签更新为已识别标签,并根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述第一手写体票据的状态标签添加已处理标签,若比对结果不一致,则为所述第一手写票据的状态标签添加异常标签。
14.在一种可能的实施方式中,所述生成比对结果,将所述比对结果反馈给所述光学字符识别平台,包括:
15.所述交易平台生成所述识别结果与所述第一手写体票据图片的人工录入结果的比对结果;
16.所述交易平台将所述比对结果中的所述第一手写体票据图片的异常数据反馈给所述光学字符识别平台。
17.在一种可能的实施方式中,所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域,包括:
18.所述光学字符识别平台根据所述比对结果,得到所述光学字符识别平台对所述第一手写体票据图片的异常识别数据;
19.所述光学字符识别平台根据所述第一手写体票据图片,获取所述异常识别数据的目标区域,并将所述目标区域添加到所述光学字符识别平台对所述第一手写体票据图片的识别区域中。
20.在一种可能的实施方式中,所述票据识别区域的调整方法还包括:
21.所述交易平台接收所述光学字符识别平台通过调整后的识别区域对所述第二手写体票据的识别结果;
22.所述交易平台根据每次接收到的所述光学字符识别平台对所述第二手写体票据的识别结果,生成统计报表,所述统计报表用于统计所述光学字符识别平台的识别率。
23.第二方面,本技术实施例提供了一种票据识别区域的调整装置,应用于交易系统,所述交易系统包括交易平台和光学字符识别平台,所述装置包括:
24.获取模块,用于所述光学字符识别平台从所述交易平台获取第一手写体票据信息,采用与所述第一手写体票据信息中携带的票据种类匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;
25.对比模块,用于所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果反馈给所述光学字符识别平台;
26.调整模块,用于所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域;
27.处理模块,用于所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
28.在一种可能的实施方式中,所述调整模块,包括:
29.确定单元,用于所述光学字符识别平台根据所述比对结果,得到所述光学字符识别平台对所述第一手写体票据图片的异常识别数据;
30.扩充单元,用于所述光学字符识别平台根据所述第一手写体票据图片,获取所述异常识别数据的目标区域,并将所述目标区域添加到所述光学字符识别平台对所述第一手写体票据图片的识别区域中。
31.第三方面,本技术实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面任一项所述的票据识别区域的调整方法的步骤。
32.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面任一项所述的票据识别区域的调整方法的步骤。
33.本技术实施例提供的技术方案具有以下有益效果:
34.本技术实施例提供的票据识别区域的调整方法,首先,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,根据所述第一手写体票据信息中携带的票据种类,选择与其匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;其次,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果中的异常数据反馈给所述光学字符识别平台;再次,所述光学字符识别平台根据接收到的比对结果,调整对所述第一手写体票据图片的识别区域;最后,所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
35.本技术所采用的票据识别区域的调整,在对光学字符识别平台的票据识别区域进行调整的过程中,能够将所述光学字符识别平台识别的手写体票据图片的信息与人工录入结果对比,找到所述光学字符识别平台识别异常的数据,所述光学字符识别平台通过异常数据定位手写体票据图片中与异常数据对应的异常的识别区域,并将该区域添加至原始的识别区域中,使光学字符识别平台在以后的识别过程中能够识别该区域的数据,从而提高对手写体票据的识别率,利于后续大量的投入使用。
36.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
37.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附
图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
38.图1为本技术实施例提供的一种票据识别区域的调整方法的流程示意图;
39.图2为本技术实施例提供的一种比对结果反馈方法的流程示意图;
40.图3为本技术实施例提供的一种调整识别区域的方法的流程示意图;
41.图4为本技术实施例提供的一种票据识别区域的调整装置的结构示意图;
42.图5为本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
43.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
44.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
45.在现有技术中,对手写体票据进行识别时,可能会存在以下问题:
46.采用人工录入平台对手写体票据进行识别,交易平台将手写体票据的图片发送到人工录入平台,人工录入平台采用人工对手写体票据图片上的字体进行识别,将识别的结果发送至交易平台,交易平台解析后入库;通过该种方式需要投入较多人力,效率低。
47.采用光学字符平台对手写体票据进行识别,交易平台将手写体票据的图片发送到光学字符识别平台,当手写体票据中的文字超出光学字符识别平台的识别区域后,超出识别区域的部分不能被光学字符识别平台识别到,导致光学字符识别平台对手写体票据的识别率比较低,如数据有误,仍然会耗费大量的人力进行核对工作。
48.基于上述缺陷,本技术实施例提供了一种票据识别区域的调整方法,应用于交易系统,所述交易系统包括交易平台和光学字符识别平台。
49.在一些实施例中,交易平台可以是银行系统中的用于存储票据凭证以及票据数据信息的平台;光学字符识别平台是通过图像处理和模式识别技术对光学的字符进行识别的平台,可以是ocr设备平台;交易系统是交易平台与光学字符识别平台组成的一套系统,实现交易平台和光学字符识别平台之间的票据信息传输。
50.如图1所示,票据识别区域的调整方法包括以下步骤:
51.s101,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,采用与所述第一手写体票据信息中携带的票据种类匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;
52.s102,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果反馈给所述光学字符识别平台;
53.s103,所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域;
54.s104,所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
55.下面分别对本技术实施例的上述示例性的各步骤进行说明。
56.在步骤s101中,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,采用与所述第一手写体票据信息中携带的票据种类匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台。
57.在一些实施例中,所述交易平台采用base64转码方式将第一手写体票据图片发送至光学字符识别平台。
58.具体的,交易平台中定义有请求报文体与返回报文体的数据格式,还定义有:
59.请求对象、返回对象:分别用于请求光学字符识别平台识别票据数据和接收光学字符识别平台返回的识别结果;
60.各类票据公共对象:该对象包含票据的所有字段信息公共对象;
61.各字段信息公共对象:该对象包含各字段信息;
62.业务实现基类:实现票据对象组装、按坐标截取票据图片以及数据比对校验等功能。
63.如果需要在交易平台中新增票据类型,仅需定义所需的票据类型常量,如有定义新的字段信息,在票据公共对象中增加一个新的字段名称即可,适合各业务票据的接入。
64.在一些实施例中,所述交易平台获取的月均票据量为三万张左右,每日存在业务高峰期,所述交易平台将票据信息发送至光学字符识别平台,但是光学字符识别平台响应时间为秒级,耗时较长,因此交易系统增加了异步调用方式,在某种票据的数量处于高峰期时,如一个小时内达到五千张以上,采用异步调用方式,将流程分为识别任务和解析任务,识别任务和解析任务单独进行,即对所述光学字符识别平台发送过来的识别结果先进行识别,定义执行识别任务时每隔60秒调用一次发送过来的识别结果,每次调用20笔票据的识别结果,定义执行解析任务时每隔30秒解析一次调用过来的识别结果,每次解析120笔票据的识别结果,所述交易系统可以对异步调用方式的时间间隔和处理次数进行参数化配置。
65.上述的方式,通过增加异步调用方式,将识别任务和解析任务单独进行,并采用后台批处理模式,每次调用多笔票据的数据,提高了交易平台的处理效率。
66.在一些实施例中,票据种类可以是根据不同业务来区分的票据种类,预设识别模式可以是光学字符识别平台根据不同种类的票据,分别配置的不同的识别模式。
67.作为示例,预设识别模式为光学字符识别平台中根据算法形成的多种识别模式,用于根据不同的票据采取不同的版面划分等操作,将票据图片上的表格或识别框切割开,以便于分别处理,最后再进行归一化,实现对票据图片上的数据的识别结果的汇总;票据种
类为往账贷记交易票据时,光学字符识别平台采用与往账贷记交易票据匹配的识别模式对其进行识别。
68.在步骤s102中,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果反馈给所述光学字符识别平台。
69.在一些实施例中,所述识别结果与所述第一手写体票据图片的人工录入结果比对之前,交易系统获取各个交易数据对象:纸质票据交换提回交易、纸质票据交换提出交易、往账贷记交易,并获取各个交易对象的人工录入结果,选择与交易数据对象匹配的票种,对光学字符识别平台识别的票据进行映射,获取需要的第一手写体票据图片的识别结果,然后将第一手写体票据图片的识别结果与人工录入结果比对,生成比对结果;所述光学字符识别平台设置有反馈接口,比对结果通过反馈接口回传至所述光学字符识别平台。
70.上述的方式,能够基于人工录入结果,确定出所述光学字符识别平台对第一手写体票据的识别结果中的异常数据,并将比对结果反馈给所述光学字符识别平台。
71.在步骤s103中,所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域。
72.在一些实施例中,所述光学字符识别平台对第一手写体票据图片的识别区域是根据算法设定好的打印框内的固定区域。
73.作为示例,在所述第一手写体票据图片中,所述光学字符识别平台只能识别到票据图片中自带的打印框中的数据,对于超出打印框的数据则无法识别。
74.上述的方式,通过对光学字符识别平台的识别区域进行调整,所述光学字符识别平台在后续识别票据图片时,能够识别到调整后的新的识别区域内的数据,扩大对手写体票据的识别率。
75.在步骤s104中,所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
76.在一些实施例中,识别精度可以是80%以上或90%以上,连续的预设次数可以是连续10次、20次等。
77.作为示例,所述光学字符识别平台在连续20次识别手写体票据时,识别精度均达到了80%以上,则认为所述光学字符识别平台的识别率得到了显著提高。
78.上述的方式,通过以循环的方式对所述光学字符识别平台进行多次训练,能够针对所述光学字符识别平台对手写体票据信息的异常识别数据,找到所述光学字符识别平台识别异常或不能识别的区域,提高所述光学字符识别平台的识别区域,从而提高对手写体票据的识别率。
79.上述票据识别区域的调整方法,首先,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,根据所述第一手写体票据信息中携带的票据种类,选择与其匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;其次,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果中
的异常数据反馈给所述光学字符识别平台;再次,所述光学字符识别平台根据接收到的比对结果,调整对所述第一手写体票据图片的识别区域;最后,所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。通过本技术所采用的这种方法,能够将所述光学字符识别平台识别的手写体票据图片的信息与人工录入结果对比,找到所述光学字符识别平台识别异常的数据,所述光学字符识别平台通过异常数据定位手写体票据图片中与异常数据对应的异常的识别区域,并将该区域添加至原始的识别区域中,使光学字符识别平台在以后的识别过程中能够识别该区域的数据,从而提高对手写体票据的识别率,利于后续大量的投入使用。
80.在一些实施例中,所述交易平台的任务池中包括多个携带有状态标签的手写体票据;所述状态标签包括以下标签中的任意一种或多种:未识别、已识别、已处理、异常,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,包括:
81.所述光学字符识别平台从所述交易平台的任务池中获取携带有未识别标签的第一手写体票据的第一手写体票据信息。
82.在一些实施例中,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,包括:
83.所述交易平台根据接收到的所述识别结果将所述第一手写体票据的状态标签设置已识别标签,并根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述第一手写体票据的状态标签添加已处理标签,若比对结果不一致,则为所述第一手写票据的状态标签添加异常标签。
84.在一些实施例中,状态标签还可以设置有识别中、处理中,所述光学字符识别平台从所述交易平台的任务池中获取携带有未识别标签的第一手写体票据的第一手写体票据信息并对其进行识别时,所述交易系统将所述第一手写体票据的状态标签更新为识别中,识别完成并发送至交易平台后,所述交易平台将所述第一手写体票据的状态标签更新为已识别;所述交易平台在对所述识别结果进行解析时,为所述第一手写体票据的状态标签添加处理中标签,所述交易系统根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述第一手写体票据的状态标签由处理中标签更新为已处理标签。
85.通过对所述交易平台任务池中的第一手写体票据添加状态标签,能够在处理前查询第一手写体票据的处理状态,避免对第一手写体票据重复处理,提升处理效率。
86.在一些实施例中,如图2所示,步骤s102,包括以下步骤:
87.s201,所述交易平台生成所述识别结果与所述第一手写体票据图片的人工录入结果的比对结果。
88.在一些实施例中,对比结果包括正常数据和异常数据,若所述识别结果与人工录入结果的数据一致,则为正常数据,若识别结果中与人工录入结果的数据不一致或缺少数据则标记为异常数据。
89.s202,所述交易平台将所述比对结果中的所述第一手写体票据图片的异常数据反馈给所述光学字符识别平台。
90.在一些实施例中,所述交易平台将第一手写体票据图片与异常数据一同反馈给所述光学字符平台,使所述光学字符识别平台能够在多个票据中快速定位到第一手写体票据图片。
91.在一些实施例中,如图3所示,步骤s103,包括以下步骤:
92.s301,所述光学字符识别平台根据所述比对结果,得到所述光学字符识别平台对所述第一手写体票据图片的异常识别数据。
93.在一些实施例中,异常识别数据为缺少的数据,即所述光学字符识别平台未对所述第一手写体票据图片的某些区域进行识别,在与人工录入结果对比后,将未识别的数据标记为异常识别数据。
94.s302,所述光学字符识别平台根据所述第一手写体票据图片,获取所述异常识别数据的目标区域,并将所述目标区域添加到所述光学字符识别平台对所述第一手写体票据图片的识别区域中。
95.在一些实施例中,目标区域可以是超出第一手写体票据图片上的识别框的区域,同时该区域具有手写体数据。
96.在一些实施例中,所述票据识别区域的调整方法,还包括:
97.所述交易平台接收所述光学字符识别平台通过调整后的识别区域对所述第二手写体票据的识别结果;
98.所述交易平台根据每次接收到的所述光学字符识别平台对所述第二手写体票据的识别结果,生成统计报表,所述统计报表用于统计所述光学字符识别平台的识别率。
99.在一些实施例中,所述交易平台每次接收到所述光学字符识别平台对所述第二手写体票据的识别结果后,均将当次的识别结果中的正常数据与当次的人工录入结果对应统计到统计报表中,计算所述光学字符识别平台的识别率。
100.在一些实施例中,所述交易平台将任务池中的未识别数据和已识别数据的总数以及已识别数据的数量统计到统计报表中,计算已识别数据占总数的百分比,计算结果即为所述光学字符识别平台的识别率。
101.作为示例,与人工录入结果比对,若所述光学字符识别平台识别结果中的正常数据占人工录入结果的60%,则统计所述光学字符识别平台当次的识别率为60%。
102.上述的方式,通过对所述光学字符识别平台的识别率进行统计,能够在所述交易平台上持续观察并及时掌握所述光学字符识别平台的识别率,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求后,可考虑使用所述光学字符识别平台代替人工录入票据信息。
103.综上所述,通过本技术实施例具有以下有益效果:
104.首先,所述光学字符识别平台从所述交易平台获取第一手写体票据信息,根据所述第一手写体票据信息中携带的票据种类,选择与其匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;其次,所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果中的异常数据反馈给所述光学字符识别平台;再次,所述光学字符识别平台根据接收到的比对结果,调整对所述第一手写体票据图片的识别区域;最后,所述光学字符识别平台从所述交易平台获取第二手写体票据
信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。通过本技术所采用的这种方法,能够将所述光学字符识别平台识别的手写体票据图片的信息与人工录入结果对比,找到所述光学字符识别平台识别异常的数据,所述光学字符识别平台通过异常数据定位手写体票据图片中与异常数据对应的异常的识别区域,并将该区域添加至原始的识别区域中,使光学字符识别平台在以后的识别过程中能够识别该区域的数据,从而提高对手写体票据的识别率,利于后续大量的投入使用。
105.基于同一发明构思,本技术实施例中还提供了与第一实施例中票据识别区域的调整方法对应的票据识别区域的调整装置,由于本技术实施例中的装置解决问题的原理与上述票据识别区域的调整方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
106.如图4所示,是本技术提供的票据识别区域的调整装置的结构示意图。票据识别区域的调整装置应用于交易系统,所述交易系统包括交易平台和光学字符识别平台,票据识别区域的调整装置包括:
107.获取模块401,用于所述光学字符识别平台从所述交易平台获取第一手写体票据信息,采用与所述第一手写体票据信息中携带的票据种类匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;
108.对比模块402,用于所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果反馈给所述光学字符识别平台;
109.调整模块403,用于所述光学字符识别平台根据所述比对结果调整对所述第一手写体票据图片的识别区域;
110.处理模块404,用于所述光学字符识别平台从所述交易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。
111.本领域技术人员应当理解,图4所示的票据识别区域的调整装置中的各模块的实现功能可参照前述票据识别区域的调整方法的相关描述而理解。图4所示的票据识别区域的调整装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
112.在一种可能的实施方式中,所述交易平台的任务池中包括多个携带有状态标签的手写体票据;所述状态标签包括以下标签中的任意一种或多种:未识别、已识别、已处理、异常,所述获取模块401,包括:
113.所述光学字符识别平台从所述交易平台的任务池中获取携带有未识别标签的第一手写体票据的第一手写体票据信息。
114.在一种可能的实施方式中,对比模块402,包括:
115.所述交易平台根据接收到的所述识别结果将所述第一手写体票据的状态标签更
新为已识别标签,并根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述第一手写体票据的状态标签添加已处理标签,若比对结果不一致,则为所述第一手写票据的状态标签添加异常标签。
116.在一种可能的实施方式中,对比模块402,还包括:
117.生成单元,用于所述交易平台生成所述识别结果与所述第一手写体票据图片的人工录入结果的比对结果;
118.反馈单元,用于所述交易平台将所述比对结果中的所述第一手写体票据图片的异常数据反馈给所述光学字符识别平台。
119.在一种可能的实施方式中,对比模块402,还包括:
120.接收单元,用于所述交易平台接收所述光学字符识别平台通过调整后的识别区域对所述第二手写体票据的识别结果;
121.统计单元,用于所述交易平台根据每次接收到的所述光学字符识别平台对所述第二手写体票据的识别结果,生成统计报表,所述统计报表用于统计所述光学字符识别平台的识别率。
122.在一种可能的实施方式中,调整模块403还包括:
123.确定单元,用于所述光学字符识别平台根据所述比对结果,得到所述光学字符识别平台对所述第一手写体票据图片的异常识别数据;
124.扩充单元,用于所述光学字符识别平台根据所述第一手写体票据图片,获取所述异常识别数据的目标区域,并将所述目标区域添加到所述光学字符识别平台对所述第一手写体票据图片的识别区域中。
125.对应于图1中的票据识别区域的调整方法,本技术实施例还提供了一种计算机设备500,如图5所示,该设备包括存储器501、处理器502及存储在该存储器501上并可在该处理器502上运行的计算机程序,其中,上述处理器502执行上述计算机程序时实现上述票据识别区域的调整方法。
126.具体地,上述存储器501和处理器502能够为通用的存储器和处理器,这里不做具体限定,当处理器502运行存储器501存储的计算机程序时,能够执行上述票据识别区域的调整方法,解决了现有技术中光学字符识别平台对手写体票据识别率低的问题。
127.对应于图1中的票据识别区域的调整方法,本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述票据识别区域的调整方法的步骤。
128.具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述票据识别区域的调整方法,解决了现有技术中光学字符识别平台对手写体票据识别率低的问题,本技术首先通过所述光学字符识别平台从所述交易平台获取第一手写体票据信息,根据所述第一手写体票据信息中携带的票据种类,选择与其匹配的预设识别模式识别所述第一手写体票据信息中携带的第一手写体票据图片,得到识别结果,将所述识别结果发送给所述交易平台;所述交易平台根据接收到的所述识别结果与所述第一手写体票据图片的人工录入结果进行比对,生成比对结果,将所述比对结果中的异常数据反馈给所述光学字符识别平台;所述光学字符识别平台根据接收到的比对结果,调整对所述第一手写体票据图片的识别区域;所述光学字符识别平台从所述交
易平台获取第二手写体票据信息,将所述第二手写体票据信息作为新的第一手写体票据信息,重新执行步骤所述光学字符识别平台从所述交易平台获取新的第一手写体票据信息,直至所述光学字符识别平台的识别精度在连续的预设次数内均达到预设要求。通过本技术所采用的这种方法,能够将所述光学字符识别平台识别的手写体票据图片的信息与人工录入结果对比,找到所述光学字符识别平台识别异常的数据,所述光学字符识别平台通过异常数据定位手写体票据图片中与异常数据对应的异常的识别区域,并将该区域添加至原始的识别区域中,使光学字符识别平台在以后的识别过程中能够识别该区域的数据,从而提高对手写体票据的识别率,利于后续大量的投入使用。
129.在本技术所提供的实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
130.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
131.另外,在本技术提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
132.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
133.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
134.需要说明的是,本技术实施例中所用到的术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
135.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语是为了描述本技术实施例的目的,不是在限制本技术。
136.最后应说明的是:以上所述实施例,仅为本技术的具体实施方式,用以说明本技术的技术方案,而非对其限制,本技术的保护范围并不局限于此,尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻
易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本技术实施例技术方案的精神和范围。都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1