1.本说明书涉及图文识别技术领域,尤其是涉及一种基于图文识别的跨境汇款数据处理方法及装置。
背景技术:2.用户在银行外币跨境汇款的操作过程中,需手动输入填写的收款方信息为外文,且其项目数量多,跨境汇款整体流程耗时长。因此亟需一种可以实现对收款方信息图片进行图文识别的数据处理方案,以减少在银行外币跨境汇款中需手动输入项目的数量,提高跨境汇款效率。
技术实现要素:3.鉴于在银行外币跨境汇款中需手动输入项目的数量多,跨境汇款过程效率低,提出了本方案以便克服上述问题或者至少部分地解决上述问题。
4.一方面,本说明书的一些实施例的目的在于提供一种基于图文识别的跨境汇款数据处理方法,所述方法包括:
5.接收输入的收款方信息图片;
6.识别所述收款方信息图片的图片类型;
7.确定所述收款方信息图片中的目标区域;
8.调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,获得识别结果;
9.从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息;
10.将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中。
11.优选的,所述识别所述收款方信息图片的图片类型,包括:
12.通过平滑滤波器对所述收款方信息图片进行预处理,以减少所述收款方信息图片的噪声和伪影;
13.调用基于卷积神经网络预训练的图片类型识别模型,识别所述收款方信息图片的图片类型。
14.优选的,所述调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,包括:
15.调用与所述图片类型对应的文字识别模型,对所述目标区域图片进行识别,得到与所述图片类型对应的文字识别结果;
16.将所述文字识别结果储存到缓存中。
17.优选的,所述确定所述收款方信息图片中的目标区域,包括:
18.基于预训练的滑动窗口分类检测器,对所述收款方信息图片依据不同长宽比和步长的矩形框进行遍历,筛选满足置信度的子区域;
19.采用非极大值抑制方法对所述满足置信度的子区域进行筛选;
20.将经过所述筛选得到的子区域作为所述输入的收款方信息中的目标区域。
21.优选的,所述从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息,包括:
22.根据以下公式计算所述识别结果分别与所述收款方信息数据集中各个收款方信息的相似度:
[0023][0024]smax
=max(sj),j=1,
…m[0025]
其中,m为收款方信息数据集中收款方信息的总条数,sj为所述识别结果与所述收款方信息数据集中第j条收款方信息的相似度,s
max
为所述识别结果与所述收款方信息数据集中各条收款方信息的相似度中的最大值,pj为所述收款方信息数据集中第j条收款方信息中出现的外文字符总数的倒数,n
ij
为所述收款方信息数据集中第j条收款方信息中第i种外文字符在所述识别结果中出现的次数,k为所述收款方信息数据集中第j条收款方信息中外文字符种类的总数量,i=1至i=k依次对应所述收款方信息数据集中第j条收款方信息中包括的k种外文字符;
[0026]
将s
max
对应的所述收款方信息数据集中收款方信息和s
max
均保存到缓存中。
[0027]
优选的,所述将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中,包括:
[0028]
若所述收款方信息数据集中收款方信息与所述识别结果的相似度满足设定条件,则将所述识别结果输入至跨境汇款页面中对应的交互组件中;
[0029]
若所述收款方信息数据集中收款方信息与所述识别结果的相似度不满足设定条件,则将所述识别结果和所述收款方信息数据集中收款方信息,通过服务器发送至人工客服终端,以请求人工客服终端判别。
[0030]
另一方面,本说明书的一些实施例还提供一种基于图文识别的跨境汇款数据处理装置,所述装置包括:
[0031]
接收模块,用于接收输入的收款方信息图片;
[0032]
图片类型识别模块,用于识别所述收款方信息图片的图片类型;
[0033]
目标区域确定模块,用于确定所述收款方信息图片中的目标区域;
[0034]
文字识别模块,用于调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,获得识别结果;
[0035]
查询匹配模块,用于从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息;
[0036]
传输模块,用于将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中。
[0037]
另一方面,本说明书的一些实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时,执行上述方法的指令。
[0038]
另一方面,本说明书的一些实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
[0039]
另一方面,本说明书的一些实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
[0040]
本说明书的一些实施例提供的一个或者多个技术方案,至少具有如下的技术效果:
[0041]
本说明书的实施例可从收款方信息图片中自动提取收款方信息,并确认提取的收款方信息是否与预设的收款方信息数据集中的收款方信息匹配;当提取的收款方信息与收款方信息数据集中的收款方信息匹配时,自动将提取的收款方信息输入至跨境汇款页面中对应的交互组件中,从而减少了在银行外币跨境汇款中需手动输入项目的数量,提高了跨境汇款效率。
[0042]
上述说明仅是本说明书的一些实施例技术方案的概述,为了能够更清楚了解本说明书的一些实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本说明书的一些实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本说明书的一些实施例的具体实施方式。
附图说明
[0043]
为了更清楚地说明本说明书的一些实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0044]
图1示出了本说明书一些实施例中基于图文识别的跨境汇款数据处理系统的示意图;
[0045]
图2示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法的流程图;
[0046]
图3示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中识别所述收款方信息图片的图片类型的流程图;
[0047]
图4示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中,预处理所述收款方信息图片时移动窗口处理区域示意图;
[0048]
图5示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中确定所述收款方信息图片中的目标区域的流程图;
[0049]
图6示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,获得识别结果的流程图;
[0050]
图7示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中,从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息的流程图;
[0051]
图8示出了本说明书一些实施例中一种基于图文识别的跨境汇款数据处理方法中将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中的流程图;
[0052]
图9示出了本说明书一些实施例中装置的结构框图;
[0053]
图10示出了本说明书一些实施例中计算机设备的结构框图。
[0054]
【附图标记说明】
[0055]
10、跨境汇款数据处理系统;
[0056]
11、用户终端;
[0057]
12、人工客服终端;
[0058]
13、服务器;
[0059]
91、接收模块;
[0060]
92、图片类型识别模块;
[0061]
93、目标区域确定模块;
[0062]
94、文字识别模块;
[0063]
95、查询匹配模块;
[0064]
96、传输模块;
[0065]
1002、计算机设备;
[0066]
1004、处理器;
[0067]
1006、存储器;
[0068]
1008、驱动机构;
[0069]
1010、输入/输出接口;
[0070]
1012、输入设备;
[0071]
1014、输出设备;
[0072]
1016、呈现设备;
[0073]
1018、图形用户接口;
[0074]
1020、网络接口;
[0075]
1022、通信链路;
[0076]
1024、通信总线。
具体实施方式
[0077]
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书的一些实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的一些实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0078]
用户在银行外币跨境汇款的操作过程中,需手动输入填写的收款方信息为外文,且其项目数量多,跨境汇款整体流程耗时长。鉴于在银行外币跨境汇款中需手动输入项目的数量多,跨境汇款过程效率低,提出了本方案以便克服上述问题或者至少部分地解决上述问题。
[0079]
参照附图1,本说明书的一些实施例提供一种基于图文识别的跨境汇款数据处理系统,该跨境汇款数据处理系统10可以包括:用户终端11和服务器13。用户终端11可以发送收款方信息图片至服务器13,服务器13可以接收所述收款方信息图片,对所述收款方信息图片进行处理,获得对应识别结果,服务器13将所述识别结果发送至用户终端11,通过所述基于图文识别的跨境汇款数据处理系统,可以实现对收款方信息图片进行图文识别,减少
在银行外币跨境汇款中需手动输入项目的数量,提高跨境汇款效率。
[0080]
参照附图1,在另一些实施例中,除了用户终端11、和服务器13外,该跨境汇款数据处理系统10还可以包括人工客服终端12。服务器13在发送识别结果至用户终端前,需根据内置预设条件脚本判断是否发送识别结果:若识别结果满足预设条件,则将所述识别结果发送至用户终端11;若识别结果不满足预设条件,则将所述识别结果发送至人工客服终端12进行判别;在人工客服终端12将判别结果上传至服务器13后,服务器13将所述判别结果发送至用户终端11,所述基于图文识别的跨境汇款数据处理系统增加了人工客服终端12,可以提高对收款方信息图片进行图文识别的精确率。
[0081]
参照附图2,本说明书的一些实施例提供一种基于图文识别的跨境汇款数据处理方法,可以应用于上述的服务器侧,所述方法包括:
[0082]
s100:接收输入的收款方信息图片;
[0083]
s200:识别所述收款方信息图片的图片类型;
[0084]
s300:确定所述收款方信息图片中的目标区域;
[0085]
s400:调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,获得识别结果;
[0086]
s500:从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息;
[0087]
s600:将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中。
[0088]
本说明书的实施例可从收款方信息图片中自动提取收款方信息,并确认提取的收款方信息是否与预设的收款方信息数据集中的收款方信息匹配;当提取的收款方信息与收款方信息数据集中的收款方信息匹配时,自动将提取的收款方信息输入至跨境汇款页面中对应的交互组件中,从而减少了在银行外币跨境汇款中需手动输入项目的数量,提高了跨境汇款效率。
[0089]
一些实施例中,输入的收款方信息图片数量可以为一个或者多个,所述收款方信息图片可以为用户终端本地预存的文件,或者用户通过即时拍照上传的文件。所述收款方信息图片分为收款单位信息图片和收款账号信息图片,所述收款方信息图片中包含跨境汇款需要填写的内容。
[0090]
本说明书的实施例中,通过对所述收款方信息图片实现图片类型区分,便于将后续识别结果与跨境汇款中待填写项目对应。
[0091]
收款单位信息包括收款单位名称、收款单位所在国家/地区、收款单位所在省/市/州,以及收款单位详细地址,收款账号信息包括收款银行全称、国际资金清算系统(society for worldwide interbank financial telecommunications,swift)代码、收款银行账号,以及收款币种,其中,所述收款币种在所述收款方信息图片中并不一定都会出现,当所述收款方信息图片中不包含收款币种信息时,用户可以在移动终端汇款界面手动选择收款币种。
[0092]
当收款单位为the johns hopkins university(约翰斯
·
霍普金斯大学),则其对应的收款方信息表格如表1所示:
[0093]
表1收款方信息表
[0094][0095]
参照附图3,在一些实施例中,所述识别所述收款方信息图片的图片类型可以包括:
[0096]
s210:通过平滑滤波器对所述收款方信息图片进行预处理,以减少所述收款方信息图片的噪声和伪影;
[0097]
s220:调用基于卷积神经网络预训练的图片类型识别模型,识别所述收款方信息图片的图片类型。
[0098]
具体而言,图像中各种妨碍人们对其信息接受的因素即可称为图像噪声,在图像分类处理之前需要对图像噪声予以纠正以提升图像质量,其纠正效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性。所述收款方信息图片中存在不必要或者多余的干扰信息,将所述收款方信息图片通过平滑滤波器,可以实现在尽量保留所述收款方信息图片的细节特征的条件下对其图像噪声进行抑制。
[0099]
图像经所述平滑滤波器预处理之后,图像中每个像素点的值均被滤波掩模确定的邻域内像素的平均灰度值替换,计算处理步骤为:
[0100]
选取奇数点方阵移动窗口,所述奇数点方阵可以为3*3方阵,或者5*5方阵,所述两种方阵既保证了平滑效果,便于遍历所述收款方信息图片全部区域,也不会造成所述收款方信息图片模糊;
[0101]
将窗口中心与所述收款方信息图片中待替换的窗口中心像素位置重合,确定所述收款方信息图片中待替换灰度值的像素;
[0102]
对所述窗口中像素灰度值从小到大排序,以便于选取中间灰度值;
[0103]
选取所述排序后的灰度值中的中间值;
[0104]
将中间值赋给所述收款方信息图片中待替换的窗口中心像素,实现该像素点的值被滤波掩模确定的邻域内像素的平均灰度值替换;
[0105]
调整所述移动窗口位置,将窗口中心与下一个待替换的像素位置重合,所述待替换的像素位置与之前窗口中心位置相邻;
[0106]
重复以上步骤,直至除所述收款方信息图片的边缘区域中不能与移动窗口中心重叠的像素以外,其他像素的值均被滤波掩模确定的邻域内像素的平均灰度值替换。
[0107]
所述平滑滤波器不但可实现滤除椒盐噪声和脉冲噪声,还可以保持图像的边缘特性,不会使图像产生显著的模糊。
[0108]
例如:假设需要预处理的收款方信息图片的部分灰度值矩阵为:
[0109]
[0110]
选取3*3的移动窗口;
[0111]
将窗口中心与所述收款方信息图片中待替换的窗口中心像素(即上述灰度值矩阵中灰度值为1的像素)位置重合;
[0112]
对所述窗口中灰度值从小到大排序:1,2,3,3,5,7,7,8,9;
[0113]
选取中间灰度值:5;
[0114]
将中间灰度值赋给所述收款方信息图片中的窗口中心像素,即将窗口中心像素的像素值由1变为5。
[0115]
经一次滤波掩模确定的邻域内像素的平均灰度值替换处理后的所述收款方信息图片灰度值矩阵为:
[0116][0117]
调整所述移动窗口位置,将窗口中心与下一个待替换的像素位置重合,所述待替换的像素位置与之前窗口中心位置相邻,所述移动窗口当前的和下一个待处理的收款方信息图片处理区域可以参考附图4,其中,实线圈定区域为当前移动窗口及中心,虚线圈定区域为下一个待处理的移动窗口及中心;
[0118]
重复上述步骤,将所述滤波掩模确定的邻域内像素的平均灰度值替换的计算处理过程,应用于所述需要识别的收款方信息图片所有像素,其中,所述收款方信息图片的边缘区域中不能与移动窗口中心重叠的像素除外。由此即可实现对所述收款方信息图片平滑滤波预处理,不但可以滤除椒盐噪声和脉冲噪声,而且还可以保持图像的清晰度。
[0119]
一些实施例中,图片类型识别模型可以基于vggnet卷积神经网络预训练得到,vggnet是一种常用于图像分类领域的深度学习神经网络结构,能够在获得更多图像特征的同时控制参数的个数,避免过多的计算量以及过于复杂的结构。在训练前首先需要采集不同收款方信息图片,收款方信息图片包括收款单位信息图片及收款账号信息图片,对所述收款方信息图片经过高斯滤波预处理,得到收款方信息样本图片集,将所述收款方信息样本图片集选取转化为图像尺寸均为224
×
224
×
3的训练集和测试集,训练集和测试集的比例为7:3;
[0120]
vggnet卷积神经网络总共包括9层(含输入层),分别是:输入层、第1层卷积层、第2层卷积层、第3层卷积层、第4层卷积层、第5层卷积层、第1层全连接层、第2层全连接层、第3层全连接层和归一化指数函数层,层与层之间使用最大化池分开。通过所述训练集对vggnet卷积神经网络进行训练,基于所述测试集对vggnet卷积神经网络进行测试,从而建立图片类型识别模型,实现将所述收款方信息图片分类识别为收款单位信息图片或收款账号信息图片,并将所述收款单位信息图片集和收款账号信息图片集分别保存到收款方信息数据集中。
[0121]
参照附图5,在一些实施例中,所述确定所述收款方信息图片中的目标区域,可以包括:
[0122]
s310:基于预训练的滑动窗口分类检测器,对所述收款方信息图片依据不同长宽比和步长的矩形框进行遍历,筛选满足置信度的子区域;
[0123]
确定所述收款方信息图片中的目标区域需依次经过目标检测、子区域划分、子区
域筛选,其中,所述收款方信息图片中包括非目标区域和目标区域,所述非目标区域包括空白区域和非目标文字区域。在确定所述收款方信息图片中的目标区域的条件下,才能进行后续文字识别进程,调用与所述图片类型对应的文字识别模型得到对应的文字识别结果。
[0124]
在一些实施例中,所述滑动窗口分类检测器是一种用于确定目标对象所在区域的目标对象检测算法,其可产生不同长宽比、步长的矩形框,并且所述滑动窗口分类检测器通过目标检测算法实现预训练。
[0125]
将所述收款方信息图片通过所述滑动窗口分类检测器后,所述收款方信息图片被所述不同长宽比、步长的矩形框划分为不同子区域;其中,所述目标检测算法可以为hog detector、sppnet等,为了保证目标检测的精度和速度,所述滑动窗口分类检测器采用yolo v4算法实现预训练。
[0126]
所述目标检测算法可以计算所述每个子区域的置信度,从而得到子区域列表及其对应的置信度得分列表,所述置信度表示一种自信程度,即所述子区域内确实有物体的自信程度和所述子区域将整个物体的所有特征都包括进来的自信程度,其计算公式如下:
[0127][0128]
其中,表示第l张收款方信息图片中第q个子区域的置信度,pr代表当前子区域是否有物体的概率,此处的物体不区分类别,泛指非背景的对象,为所述子区域和目标物可能的真实区域的重叠度,注意,此处目标物真实区域并不是实际存在的,所述重叠度表示一种概率上的可能程度,重叠度的计算原理详见下方。
[0129]
所述置信度的范围在[0,1]之间,在低置信度的情况下对应的子区域数量过多,因此需要设定子区域高置信度条件,通常高置信度条件在[0.65,1)之间。
[0130]
在所述目标检测算法标记可能性高的区域之后,将不满足所述设定的置信度条件的所述子区域及其对应的置信度得分从列表中剔除,筛选之后同一目标物通常对应多个不同的子区域,所述不同子区域之间存在重叠区域。
[0131]
s320:采用非极大值抑制方法对所述满足置信度的子区域进行筛选;
[0132]
s330:将经过所述筛选得到的子区域作为所述输入的收款方信息中的目标区域。
[0133]
采用非极大值抑制方法可以对所述重叠的不同子区域进行筛选:
[0134]
将所述置信度得分进行排序;选择所述最大置信度的对应的子区域,将其添加到最终输出列表中,并将所述最大置信度的对应的子区域从所述子区域列表中删除;
[0135]
计算所述每个子区域的面积,计算所述最大置信度的对应的子区域与其它子区域的重叠度,重叠度的计算原理如下:
[0136][0137]
其中,iou为重叠度,i为两个子区域重叠的部分,u为两个子区域整体所占的面积;
[0138]
在所述子区域列表中删除重叠度大于阈值的子区域,降低阈值,重复上述过程,直至子区域列表为空,所述最终输出列表中的子区域即为所述输入的收款方信息图片中的目标区域。
[0139]
参照附图6,在一些实施例中,所述调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息并获得识别结果,可以包括:
[0140]
s410:调用与所述图片类型对应的文字识别模型,对所述目标区域图片进行识别,得到与所述图片类型对应的文字识别结果;
[0141]
s420:将所述文字识别结果储存到缓存中。
[0142]
对于不同图片类型下的基于卷积神经网络的文字识别模型,首先需要采集不同收款方信息图片,所述收款方信息图片包括手写体收款方信息图片与印刷体收款方信息图片,定义和标记外文标签信息,对所述收款方信息图片进行预处理,将所述收款方信息图片转化为32
×
32的像素图片,得到收款方信息样本图像训练集和测试集,训练集和测试集的比例为7∶3。
[0143]
构造基于卷积神经网络的文字识别模型,所述卷积神经网络包括1层输入层、7层卷积层、6层池化层和1层全连接层,通过训练集训练卷积神经网络,并通过测试集对卷积神经网络进行测试,从而得到所述文字识别模型。
[0144]
调用与所述图片类型对应的基于卷积神经网络的文字识别模型,识别目标区域图片,可以得到与所述图片类型对应的目标区域图片文字识别结果,并将所述文字识别结果储存到缓存中。
[0145]
参照附图7,在一些实施例中,所述从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息,可以包括:
[0146]
s510:根据以下公式计算所述识别结果分别与所述收款方信息数据集中各个收款方信息的相似度:
[0147][0148]smax
=max(sj),j=1,
…m[0149]
其中,m为收款方信息数据集中收款方信息的总条数,sj为所述识别结果与所述收款方信息数据集中第j条收款方信息的相似度,s
max
为所述识别结果与所述收款方信息数据集中各条收款方信息的相似度中的最大值,pj为所述收款方信息数据集中第j条收款方信息中出现的外文字符总数的倒数,n
ij
为所述收款方信息数据集中第j条收款方信息中第i种外文字符在所述识别结果中出现的次数,k为所述收款方信息数据集中第j条收款方信息中外文字符种类的总数量,i=1至i=k依次对应所述收款方信息数据集中第j条收款方信息中包括的k种外文字符;
[0150]
s520:将s
max
对应的所述收款方信息数据集中收款方信息和s
max
均保存到缓存中。
[0151]
具体而言,所述收款方信息数据集中收款方信息分别包含的收款单位信息以及收款账号信息,和通过与所述图片类型对应的文字识别模型得到的所述识别结果互相对应;从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息,首先将所述收款方信息数据集中收款单位信息与所述识别结果匹配。
[0152]
例如:假设所述识别结果的收款单位信息为剑桥大学(university of cambridge),所述收款方信息数据集中第j条收款方信息的收款单位为利物浦大学(university of liverpool),利物浦大学与剑桥大学英文字符匹配表格如表2所示;
[0153]
表2第j条收款单位信息与识别结果英文字符匹配表
[0154]
[0155][0156]
对于利物浦大学(university of liverpool),共有13种英文字符,21个英文字符,将识别结果中对应字符出现次数乘以并求和,即可得到所述识别结果剑桥大学(university of cambridge)与所述收款方信息数据集中收款单位利物浦大学(university of liverpool)的相似度为71.43%,远不足100%,因此可以判断所述识别结果剑桥大学(university of cambridge)与所述收款方信息数据集中收款单位利物浦大学(university of liverpool)不匹配;
[0157]
重复上述过程,可以得到所述收款方信息数据集中其他收款方信息与所述识别结果的相似度,将最大相似度对应的所述收款方信息数据集中收款方信息和对应的最大相似度的值均保存到缓存中。
[0158]
参照附图8,在一些实施例中,所述将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中,可以包括:
[0159]
s610:若所述收款方信息数据集中收款方信息与所述识别结果的相似度满足设定条件,则将所述识别结果输入至跨境汇款页面中对应的交互组件中;
[0160]
s620:若所述收款方信息数据集中收款方信息与所述识别结果的相似度不满足设定条件,则将所述识别结果和所述收款方信息数据集中收款方信息,通过服务器发送至人工客服终端,以请求人工客服终端判别。
[0161]
在一些实施例中,在将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件之前,需要判断所述匹配的相似度,确认所述输入至对应的交互组件中信息的正确性。
[0162]
考虑到计算误差,设定相似度阈值为98%,若所述收款方信息数据集中收款方信息与所述识别结果的相似度超过98%,则将所述识别结果输入至跨境汇款页面中对应的交互组件中;
[0163]
所述收款方信息数据集中收款方信息与所述识别结果的相似度低于98%,则将所述识别结果和所述收款方信息数据集中收款方信息,通过服务器发送至人工客服终端,以请求人工客服终端判别;
[0164]
在人工客服终端将判别结果上传至服务器后,服务器将人工客服终端判别结果发送至用户终端中跨境汇款页面中对应的交互组件中,并将所述判别结果更新至所述收款方信息数据集中。
[0165]
与上述的基于图文识别的跨境汇款数据处理方法对应,本说明书的一些实施例还提供了一种基于图文识别的跨境汇款数据处理装置,其可以配置于上述的服务器,参考图9所示,在一些实施例中,基于图文识别的跨境汇款数据处理装置可以包括:
[0166]
接收模块91,用于接收输入的收款方信息图片;
[0167]
图片类型识别模块92,用于识别所述收款方信息图片的图片类型;
[0168]
目标区域确定模块93,用于确定所述收款方信息图片中的目标区域;
[0169]
文字识别模块94,用于调用与所述图片类型对应的文字识别模型识别所述目标区域中的文字信息,获得识别结果;
[0170]
查询匹配模块95,用于从预设的收款方信息数据集中查询与所述识别结果匹配的收款方信息;
[0171]
传输模块96,用于将与所述识别结果匹配的收款方信息输入至跨境汇款页面中对应的交互组件中。
[0172]
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0173]
需要说明的是,本说明书的实施例中,所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权同意且经过各方充分授权的信息和数据。
[0174]
本说明书的实施例还提供一种计算机设备。如图10所示,在本说明书一些实施例中,所述计算机设备1002可以包括一个或多个处理器1004,诸如一个或多个中央处理单元(cpu)或图形处理器(gpu),每个处理单元可以实现一个或多个硬件线程。计算机设备1002还可以包括任何存储器1006,其用于存储诸如代码、设置、数据等之类的任何种类的信息,一具体实施例中,存储器1006上并可在处理器1004上运行的计算机程序,所述计算机程序被所述处理器1004运行时,可以执行上述任一实施例所述的基于图文识别的跨境汇款数据处理方法的指令。非限制性的,比如,存储器1006可以包括以下任一项或多种组合:任何类型的ram,任何类型的rom,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备1002的固定或可移除部件。在一种情况下,当处理器1004执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备1002可以执行相关联指令的任一操作。计算机设备1002还包括用于与任何存储器交互的一个或多个驱动机构1008,诸如硬盘驱动机构、光盘驱动机构等。
[0175]
计算机设备1002还可以包括输入/输出接口1010(i/o),其用于接收各种输入(经由输入设备1012)和用于提供各种输出(经由输出设备1014)。一个具体输出机构可以包括呈现设备1016和相关联的图形用户接口1018(gui)。在其他实施例中,还可以不包括输入/输出接口1010(i/o)、输入设备1012以及输出设备1014,仅作为网络中的一台计算机设备。计算机设备1002还可以包括一个或多个网络接口1020,其用于经由一个或多个通信链路1022与其他设备交换数据。一个或多个通信总线1024将上文所描述的部件耦合在一起。
[0176]
通信链路1022可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1022可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
[0177]
本技术是参照本说明书一些实施例的方法、设备(系统)、计算机可读存储介质和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理器的处理器以产生一个机器,使得通过计算机或其他可编程数据处理器的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0178]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理器以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0179]
这些计算机程序指令也可装载到计算机或其他可编程数据处理器上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0180]
在一个典型的配置中,计算机设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0181]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0182]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算机设备访问的信息。按照本说明书中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0183]
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面
的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0184]
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理器来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0185]
还应理解,在本说明书实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0186]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0187]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0188]
以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。