银行回单识别方法、系统、设备及存储介质与流程

文档序号:31129204发布日期:2022-08-13 04:53阅读:289来源:国知局
银行回单识别方法、系统、设备及存储介质与流程

1.本发明涉及深度学习与计算机技术领域,具体涉及一种基于深度学习的银行回单识别方法、系统、电子设备以及存储介质。


背景技术:

2.银行回单是为企业客户提供其网银付款交易查询、下载、打印(补打)以及验证功能的有效凭证。回单的内容主要包括日期、编号、户名、账号、币种、金额、摘要以及开户行等详细信息,对于每一笔账务,均有相应的一张回单。银行回单作为企业编制记账凭证的原始依据,在记账过程中涉及大量回单信息的录入,需要耗费大量的人力、物力和财力。
3.随着ocr技术的迅速发展,印刷体文字识别技术已经相当成熟,并得到了广泛应用。目前,银行回单ocr技术可识别账户名、收付款账户和金额等信息;已被应用在erp智能记账、rpa财务机器人、财务影像系统等行业,通过ocr识别技术可快速将银行回单信息自动录入到系统中,大大节省了录入时间。
4.传统的银行回单ocr技术往往依赖于识别对象的特点,需要根据银行回单格式设计个性化的模板。但国内各大银行的电子回单格式并不相同,甚至是同一家银行也存在格式不统一的问题,这就需要定制大量的银行回单模板,导致识别过程过分依赖人工干预,识别效率较低。


技术实现要素:

5.针对以上技术问题,本发明提供一种银行回单识别方法,以满足对不同样式银行回单进行信息提取的需求,提高银行回单的识别效率。相应的,本发明还提供一种银行回单识别系统、电子设备以及存储介质。
6.根据本发明的一方面,提供一种银行回单识别方法,包括如下步骤:
7.获取待识别的银行回单图像;
8.检测出所述银行回单图像的表格区域;
9.采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;
10.将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;
11.对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。
12.在本发明的一实施方式中,所述检测出所述银行回单图像的表格区域包括:
13.采用基于u-net网络的语义分割模型对所述银行回单图像的表格区域进行检测;
14.采用生成对抗网络对检测出的表格区域的整体形状进行约束。
15.在本发明的一实施方式中,所述采用基于u-net网络的语义分割模型对所述银行回单图像的表格区域进行检测包括:
16.所述银行回单图像被分割为多个联通区域;
17.所述检测出所述银行回单图像的表格区域还包括:
18.选取最大联通区域作为候选表格区域;
19.填充候选表格区域内的联通区域使其作为表格区域的一部分;以及
20.基于候选表格区域的边界轮廓确定表格区域的四个顶点。
21.在本发明的一实施方式中,所述基于候选表格区域的边界轮廓确定表格区域的四个顶点包括:
22.检测出候选区域边界的轮廓;
23.将所述轮廓的曲线折线化,对图像轮廓点进行多边形拟合;
24.确定拟合得到的多边形的所有顶点的位置;
25.以距离所述银行回单图像四个顶点最近的四个点,作为表格区域的四个顶点。
26.在本发明的一实施方式中,所述采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图包括:
27.采用投影法对表格区域的图像进行列分割,得到若干包含一行文字的图片;
28.采用基于长短时记忆网络和条件随机场的序列标注模型对所述若干包含一行文字的图片进行行分割,得到多个被判定为文字区域的子图。
29.在本发明的一实施方式中,所述对所述待识别的文字区域进行文字识别包括:
30.通过基于注意力机制的文字识别模型对所述待识别的文字区域进行文字识别。
31.在本发明的一实施方式中,所述对所述待识别的文字区域进行文字识别还包括:
32.建立一映射表,所述映射表的键为银行回单中同一目标字段的多种别称字样,值为归类后的字段名;
33.通过所述映射表将银行回单中同一目标字段的不同别称字样映射为归类后的字段名。
34.根据本发明的另一方面,提供一种银行回单识别系统,它包括,
35.获取模块,用以获取待识别的银行回单图像;
36.第一检测模块,用以检测出所述银行回单图像的表格区域;
37.第二检测模块,用以采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;
38.串联模块,用以将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;以及
39.识别模块,用以对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。
40.根据本发明的另一方面,提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述银行回单识别方法的步骤。
41.根据本发明的又一方面,提供一种电子设备,所述电子设备包括:
42.处理器;
43.存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述银行回单识别方法的步骤。
44.本发明可以自动检测、识别国内所有银行回单,无需人工干预,不区分模板,并输出结构化数据,有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。具体而言:
45.1、本发明中模型训练的复杂度很低,计算效率高。
46.2、本发明还具有不区分模板、支持各大银行,高效准确的优点。
附图说明
47.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
48.图1是本发明一实施例中银行回单识别方法的流程图。
49.图2是本发明一实施例中银行回单识别方法的局部流程图。
50.图3是本发明一实施例中注意力机制模块示意图。
51.图4是本发明一实施例中生成对抗网络示意图。
52.图5是本发明一实施例中页面分割算法示意图。
53.图6是本发明一实施例中序列标注说明示意图。
54.图7是本发明一实施例中基于注意力机制的文字识别模型框架图;
55.图8是本发明一实施例中识别结果结构化输出示意图。
56.图9是本发明一实施例中银行回单识别系统的模块图。
57.图10是本发明一实施例中电子设备的结构示意图。以及
58.图11是本发明一实施例中计算机可读存储介质的结构示意图。
具体实施方式
59.为了使本发明的叙述更加详尽与完备,可参照所附图及以下所述各种实施例,图中相同的号码代表相同或相似的组件。另一方面,众所周知的组件与步骤并未描述于实施例中,以避免对本发明造成不必要的限制。在实施方式与权利要求中,涉及“连接”的描述,其可泛指一组件通过其他组件而间接耦合至另一组件,或是一组件无须通过其他组件而直接连接至另一组件。在实施方式与权利要求中,涉及“联机”的描述,其可泛指一组件通过其他组件而间接与另一组件进行有线与/或无线通信,或是一组件无须通过其他组件而实体连接至另一组件。在实施方式与权利要求中,除非内文中对于冠词有所特别限定,否则“一”与“该”可泛指单一个或多个。本文所使用的“约”、“大约”或“大致”是用以修饰任何可微小变化的数量,但这种微小变化并不会改变其本质。在实施方式中若无特别说明,则代表以“约”、“大约”或“大致”所修饰的数值的误差范围一般是容许在百分之二十以内,较佳地是于百分之十以内,而更佳地则是于百分之五以内。
60.根据本发明的一方面,提供一种银行回单识别方法。图1是本发明一实施例中银行回单识别方法的流程图。如图1所示,该银行回单识别方法可以包括如下步骤:
61.s100,获取待识别的银行回单图像。
62.s200,检测出所述银行回单图像的表格区域。具体可以包括如下步骤:
63.采用基于u-net网络的语义分割模型对所述银行回单图像的表格区域进行检测。以及
64.采用生成对抗网络对检测出的表格区域的整体形状进行约束。
65.在本发明的一实施方式中,所述采用基于u-net网络的语义分割模型对所述银行回单图像的表格区域进行检测可以包括:
66.所述银行回单图像被分割为多个联通区域。
67.图2是本发明一实施例中银行回单识别方法的局部流程图。如图2所示,所述检测出所述银行回单图像的表格区域还包括:
68.s211,选取最大联通区域作为候选表格区域。通常在语义分割模型进行分类后,会有一部分像素点被分割为表格区域内部,这样会形成多块区域。因此,只取最大的联通区域作为候选表格区域,而其他较小的联通区域作为离群点舍弃。
69.s212,填充候选表格区域内的联通区域使其作为表格区域的一部分。同样地,在最大的联通区域内部也可能存在一定像素点被分类为背景,这些像素点被修改分类为表格区域内部
70.s213,基于候选表格区域的边界轮廓确定表格区域的四个顶点。在取得候选区域后,要通过后处理将其转化为四边形区域,具体可以包括:首先,检测出候选区域边界的轮廓。其次,将所述轮廓的曲线折线化,对图像轮廓点进行多边形拟合。再次,确定拟合得到的多边形的所有顶点的位置。最后,以距离所述银行回单图像四个顶点最近的四个点,作为表格区域的四个顶点。
71.s300,采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图。具体可以包括:
72.采用投影法对表格区域的图像进行列分割,得到若干包含一行文字的图片。以及
73.采用基于长短时记忆网络和条件随机场的序列标注模型对所述若干包含一行文字的图片进行行分割,得到多个被判定为文字区域的子图。
74.s400,将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域。
75.s500,对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。具体地,可以通过基于注意力机制的文字识别模型对所述待识别的文字区域进行文字识别。
76.进一步地,所述对所述待识别的文字区域进行文字识别还可以包括:
77.s600,建立一映射表,所述映射表的键为银行回单中同一目标字段的多种别称字样,值为归类后的字段名。通过所述映射表将银行回单中同一目标字段的不同别称字样映射为归类后的字段名。
78.本发明可以自动检测、识别国内所有银行回单,无需人工干预,不区分模板,并输出结构化数据,有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。
79.在本发明一实施例中,可以采用一个带有注意力机制的基于u-net网络的语义分割模型检测出所述银行回单图像的表格区域。图3是本发明一实施例中注意力机制模块示意图。结合图3,在该模型中输入为一张银行回单图像,首先通过多层卷积进行特征提取,在每一层卷积使用两个3*3的卷积层和一个2*2的池化层来对数据进行处理其中每一层特征。每一层特征提取中采用的滤波器数量逐层递增,分别为64、128、256和512。设初始输入为x0,则第i层的特征提取计算公式为:
80.ci=conv
3*3
(conv
3*3
(xi))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
81.x
i+1
=maxpooling
2*2
(ci)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
82.在进行四次相同结构的特征提取与下采样后,利用两层卷积核为1*1的卷积层代替全连接层对提取的特征进行处理,公式为:
83.d4=conv
1*1
(con v
1*1
(x4))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
84.然后,对提出的特征进行上采样,上采样采用双线性插值法进行。在上采样过程中,每一层上采样的结果会与特征提取阶段对应层数的特征进行融合,融合方式为利用上采样的结果与特征提取阶段对应层数的特征图计算一个注意力权重,然后与特征图相乘获得注意力权重分配后的特征,然后与上采样的结果串联,再经过一个3*3的卷积层进行特征提取。重复上采样的过程,直到结果还原到原图的尺寸,计算公式为:
85.gi=upsampling(d
i+1
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
86.di=conv
3*3
([gi;ai(gi,ci)])
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)最后,通过一个1*1的卷积层进行处理,得到一个和原图尺寸相同的具有k个通道数的特征图,其中k为需要分类的类别数,并利用softmax对图上的每个像素点进行分类,判断其是否为表格区域,公式为:
[0087]
c=softmax(conv
1*1
(d0))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0088]
需要说明的是,除了表格区域外,银行回单的拍摄背景和表头等信息都不是本发明关注的区域,因此,在上采样的特征融合过程中,采用注意力机制设置门限来对特征提取阶段的特征进行过滤,从而使模型可以为表格区域分配更多的权重,注意力机制实现的原理如图3所示,其中gi为在解码过程中上采样得到的第i层特征图,ci为图像特征提取过程中对应的第i层特征图,z为该层特征图的滤波器维数。在注意力机制层,首先将gi与ci进行串联,然后通过一个1*1的卷积层将输出的滤波器变成1,再经过一个sigmoid激活函数映射到[0,1]的值域,并将其与ci的值进行逐元素相乘并输出。注意力机器模块的输出将在网络中与gi进行串联,送入下一个卷积神经网络。注意力机制的计算过程为;
[0089]
ti=relu(con v
1*1
([gi;ci]))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0090]ai
=σ(conv
1*1
(ti))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0091][0092]
进一步地,采用一个生成对抗网络对检测出的表格区域的整体形状进行约束。图4是本发明一实施例中生成对抗网络示意图。如图4所示,生成对抗网络由两个模块组成,分别是生成模型g和判别模型d。生成模型采用基于注意力机制的u-net,而判别模型则选择alexnet模型。原始图像通过g生成表格区域检测图,并将其作为负类输入到d中,同时将正确的表格区域图送入判别模型d中作为正类。通过交替训练判别模型和语义分割模型,最终使语义分割模型能学习到表格区域的形状。
[0093]
在本发明一实施例中,采用图像页面分割算法进行文字检测,在检测出表格区域并对表格四边形区域进行拉伸和倾斜矫正后,下一步任务是对只包含表格区域的图片进行文字检测。该任务采用页面分割的方式解决。图5是本发明一实施例中页面分割算法示意图。如图5所示,页面分割思路是先将银行回单图像进行列分割,拆成一系列包含一行文字的图片,然后对银行回单图像进行行分割,将表格内不同列的结果分割开来。列分割采用投影法进行,行分割采用序列标注的方法实现。投影法首先将图像进行二值化、统一为黑底白字的标准,并计算每一列所有像素点的像素值之和,然后通过先验知识确定阈值来寻找合
理的分割点。序列标注模型则选择双向长短时记忆网络(bi-long short-term memory,bi-lstm)和条件随机场(conditional random field,crf),输入是一行文本的图片x=(x1,x2,x2,

,xn),被二值化为宽度为5,高度为25的像素值,送入bi-lstm网络,获得输出:
[0094][0095][0096][0097]
上述输出值经过softmax激活函数后,获得一个标签值。标签采用iobes:若该组输入为一个文字区域的开始,则将其标注为b;若该组输入为一个文字区域内部,则将其标注为i;若该组输入为文字区域结尾,标注为e;若该组输入单独成为一个文字区域,则标注为s;若该组输入不属于文字区域,则标注为o。
[0098]
然而,在iobes标注方式下,存在很多不合法标注结果,例如在o标签后不能接i标签,因为一个图像区域的开始应该是b标签;i标签后也不能接o标签和b标签,因为一个图像区域的结尾应该是e标签。为此,在bi-lstm网络后拼接条件随机场模块,学习标签之间的约束关系。crf模块为每一个模型预测的序列y=(y1,y2,y2,

,yn),计算一个分数:
[0099][0100]
其中,a是一个矩阵,a
ij
表示从标签i转移到j的概率,表示i的第yi维的值,代表单独第i个输出的标签为yi的概率。进一步,将所有可能的标签序列分数经过softmax函数,如下所示:
[0101][0102]
预测时,利用维特比算法计算出分数最高的标签序列,作为整个序列标注的输出。
[0103]
在本发明一实施例中,需要通过后处理操作将被判定为文字区域的子图串联起来,得到检测的文字区域。后处理操作旨在找到所有被bie序列包围的子图序列。图6是本发明一实施例中序列标注说明示意图。如图6中的

付款人账号’字段对应的图片区域,另外,考虑到所有分类中,b、e、s的标签数量较少,i和o的标签数量较多,数据不均衡,使得部分b和e标签未能被成功识别。因此,本发明定义以下规则对齐进行修正:如果多个o标签后接多个i标签,则将第一个i标签设置为b标签;如果多个i标签后接多个o标签,则将最后一个i标签修改为e标签。后处理操作将被判定为文字区域的子图串联起来,得到待识别的文字区域,完成文字检测。
[0104]
在本发明一实施例中,需要对分割后的包含字符串的图片进行文字识别,将图像数据转化为文字数据。采用基于注意力机制的生成模型,模型通过卷积神经网络提取特征,然后利用一个带有注意力机制的循环神经网络进行文本生成,模型结构如图7所示。在图像特征提取结算,原始的图片输入首先经过一个包含三个卷积层与对应池化层的神经网络进行特征提取,每个卷积模块的卷积核大小为3*3,卷积过程为:
[0105]
xi=maxpooling(conv
3*3
(conv
3*3
(x
i-1
)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0106]
其中,x0位原始图片的输入,x3代表卷积神经网络的输出,是一个3维张量,张量维
度为[h/8,w/8,256],h为图像的高度,w为图像的宽度,256为最后一层滤波器数量。该输出进一步被送入长短时记忆网络进行特征深层次特征提取,但由于lstm网络的输入是一个二维张量,而且其第一位与w相关,因此需要对卷积神经网络的输出进行转置和整合,首先将第一维和第二维进行转置,然后将第二维和第三维合并:
[0107]
u=reshape(tranpose(x3))
ꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0108]
经过上述操作后,u被输入一个双向长短期记忆网络作进一步特征提取:
[0109][0110]
其中为输出,它包含了图像的信息,在后续计算中将作为注意力机制信息,从而获得要生成的文字在图像中的位置。
[0111]
进一步地,使用一个基于注意力机制的文字生成模块输出识别文字。在输出的过程中,首先将字符《s》作为初始输入送进网络中,然后每次将生成的字符作为下一个单元的输入,直到生成字符《/s》终止,其中《s》和《/s》代表开始和结束的标识。本发明采用的注意力机制计算公式如下所示:
[0112][0113][0114][0115][0116]
具体来说,对于每个lstm网络的输出h
t
,首先将它和提取出的图片特征中的每个向量计算一个分数,然后将这些分数经过一个softmax函数计算出图片特征中每个向量的权重α
t
(s),再将中的每个向量计算加权和c
t
,与h
t
串联后经过一个全连接层计算出包含图像信息的向量最终,将经过一个全连接层和softmax函数进行分类,公式为:
[0117][0118]
其中,ws为训练参数,获得s
t
后,只需取s
t
中最大的一维作为预测结果,根据分类结果得到对应的文字。生成的文字继续作为下一个lstm网络的输入,重复以上过程,直到生成《/s》为止。借助以上步骤,便可以获得目标字符串。
[0119]
在本发明一实施例中,需要建立映射表将同一识别项目的不同别称映射到同一类。在获得生成的字符串后,对于结果,直接取生成的结果作为最后的输出结果,而对于提示字段来说,由于各大银行对同一字段的叫法有所出入,本发明人工建立一个映射表将同一字段的不同别称映射到同一类中,映射表的key为银行回单中实际出现的文字,value为归类后的字段名。例如:付款人户名、付款人姓名、汇款人姓名这几项都属于同一字段,同一将其映射到付款人户名这一类。同时,为了增加容错率,如果模型生成的字符串不在映射表的key中,将映射表中的key与其编辑距离最短的字段名作为修正后的模型输出值。最终,如图8所示,将所有识别文字转化为结构化内容。
[0120]
根据本发明的另一方面,提供一种银行回单识别系统。图9是本发明一实施例中银行回单识别系统的示意图。如图9所示,所述银行回单识别系统300包括获取模块310、第一
检测模块320、第二检测模块330、串联模块340以及识别模块350。所述获取模块310用以获取待识别的银行回单图像。所述第一检测模块320用以检测出所述银行回单图像的表格区域。所述第二检测模块330用以采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图。所述串联模块340用以将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域。以及所述识别模块350用以对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。本发明可以自动检测、识别国内所有银行回单,无需人工干预,不区分模板,并输出结构化数据,有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。在本发明的另一实施方式中,所述银行回单识别系统还包括一映射模块,所述映射模块用以建立一映射表,所述映射表的键为银行回单中同一目标字段的多种别称字样,值为归类后的字段名,通过所述映射表将银行回单中同一目标字段的不同别称字样映射为归类后的字段名。
[0121]
根据本发明的又一方面,提供一种电子设备,所述电子设备包括:
[0122]
处理器;
[0123]
存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述银行回单识别方法的步骤。
[0124]
下面参照图10来描述根据本技术的一个实施例中的电子设备600。其中,图10显示的电子设备600仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0125]
如图10所示,电子设备600以通用计算设备的形式表现。设备600的组件可以包括但不限于:至少一个处理器610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理器610)的总线630、显示单元640等。
[0126]
其中,存储单元存储有程序代码,程序代码可以被处理器610执行,使得处理器610执行本说明书上述电子处方流转处理银行回单识别方法部分中描述的根据本技术各种示例性实施方式的步骤。例如,处理器610可以执行以上银行回单识别方法中的步骤。
[0127]
存储单元620可以包括易失性存储单元形式的存储介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。
[0128]
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0129]
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
[0130]
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得租户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络102适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据
备份存储系统等。
[0131]
本发明可以自动检测、识别国内所有银行回单,无需人工干预,不区分模板,并输出结构化数据,有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。
[0132]
根据本发明的另一方面,提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述银行回单识别方法的步骤。
[0133]
参考图11,在一种实施方式中,用于实现上述银行回单识别方法的程序产品800可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,且可以在服务器上运行。然而,本领域技术人员应能理解,本技术所指的程序产品不限于此,计算机存储介质可以是任何包含或存储程序的有形介质,且该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0134]
需要注意的是,本技术可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本技术的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本技术的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0135]
另外,本技术的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本技术的银行回单识别方法或技术方案。本领域技术人员应能理解,计算机程序指令在计算机存储介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机存储介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
[0136]
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线,例如光纤、同轴等)和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、rf、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
[0137]
作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何银行回单识别方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括(但不限于)易失性存储器,诸如随机存储器(ram,dram,sram);以及非易失性存储器,诸如闪存、各种只读存储器(rom,prom,eprom,eeprom)、磁性和铁磁/铁电存储器(mram,feram);以及磁性和光学存储设备(硬盘、磁带、cd、dvd);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息或数据。
[0138]
总而言之,本发明可以自动检测、识别国内所有银行回单,无需人工干预,不区分模板,并输出结构化数据,有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。
[0139]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1