发票核验方法、装置、计算机设备和可读存储介质与流程

文档序号:22918885发布日期:2020-11-13 16:04阅读:245来源:国知局
发票核验方法、装置、计算机设备和可读存储介质与流程

本申请涉及字符识别技术领域,特别是涉及一种发票核验方法、装置、计算机设备和可读存储介质。



背景技术:

发票是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。在企业运营过程中,基于发票的财务报销是非常重要的环节之一。

目前,在财务报销过程中,报销人员需要提供纸质发票或者电子发票,然后由财务人员对发票进行人工审核,如对发票的合法性进行核验。不合法的发票,即伪造出的发票会为企业的入账等操作带来不必要的麻烦,甚至造成财务损失。

但是,若存在大量的财务报销票据,则需要耗费财务人员大量的时间去核验发票的合法性,导致财务报销过程中发票合法性的核验效率低下。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提升发票合法性的核验效率的发票核验方法、装置、计算机设备和可读存储介质。

第一方面,本申请实施例提供一种发票核验方法,所述方法包括:

获取发票图像和对应的交易流水图像,根据所述发票图像获取第一识别结果,并根据所述交易流水图像获取第二识别结果;所述第一识别结果包括多个发票字段以及各所述发票字段关联的发票识别信息,所述第二识别结果包括多个流水字段以及各所述流水字段关联的流水识别信息;

根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;

若各所述发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定所述发票图像核验通过。

在其中一个实施例中,所述根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配,包括:

根据各所述发票字段和各所述流水字段之间的映射关系,确定目标发票字段对应的目标流水字段;

检测所述目标发票字段关联的发票识别信息是否与所述目标流水字段关联的流水识别信息一致;

若一致,则确定所述目标发票字段关联的发票识别信息与所述目标流水字段关联的流水识别信息匹配。

在其中一个实施例中,所述根据所述交易流水图像获取第二识别结果,包括:

对所述交易流水图像进行预处理,得到预处理后的交易流水图像;

将所述预处理后的交易流水图像输入至文本定位网络中,得到所述预处理后的交易流水图像中各目标区域的位置框坐标;

从所述预处理后的交易流水图像中截取与各所述位置框坐标分别对应的目标图像;

根据各所述目标图像,获取所述第二识别结果。

在其中一个实施例中,所述根据各所述目标图像,获取所述第二识别结果,包括:

将各所述目标图像输入至文本类型分类网络中,得到各所述目标图像分别对应的分类结果;所述分类结果用于表征所述目标图像对应的文本类型,所述文本类型包括中文类型、数字类型或字母类型;

对于每个所述目标图像,采用与所述目标图像对应的文本类型匹配的目标识别模型对所述目标图像进行识别,得到所述目标图像的字符识别结果;

根据各所述目标图像的字符识别结果确定所述第二识别结果。

在其中一个实施例中,所述字符识别结果包括流水字段或流水识别信息,所述根据各所述目标图像的字符识别结果确定所述第二识别结果,包括:

根据各所述目标图像对应的位置框坐标之间的距离关系,将各所述目标图像的字符识别结果中的每个流水字段和对应的流水识别信息相关联,关联后得到所述第二识别结果。

在其中一个实施例中,所述目标识别模型的训练过程包括:

获取各所述文本类型对应的多个样本交易流水图像;

对于每个所述文本类型,基于所述文本类型对应的多个样本交易流水图像,训练所述文本类型对应的初始识别模型,得到所述文本类型对应的目标识别模型。

在其中一个实施例中,所述根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配之后,还包括:

若存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,则确定所述发票图像核验未通过。

第二方面,本申请实施例提供一种发票核验装置,所述装置包括:

第一获取模块,用于获取发票图像和对应的交易流水图像,根据所述发票图像获取第一识别结果,并根据所述交易流水图像获取第二识别结果;所述第一识别结果包括多个发票字段以及各所述发票字段关联的发票识别信息,所述第二识别结果包括多个流水字段以及各所述流水字段关联的流水识别信息;

核验模块,用于根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;

第一确定模块,用于若各所述发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定所述发票图像核验通过。

第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面的方法的步骤。

第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

本申请实施例提供的技术方案带来的有益效果至少包括:

通过获取发票图像和对应的交易流水图像,根据发票图像获取第一识别结果,第一识别结果包括多个发票字段以及各发票字段关联的发票识别信息,并根据交易流水图像获取第二识别结果,第二识别结果包括多个流水字段以及各流水字段关联的流水识别信息;根据各发票字段和各流水字段之间的映射关系,检测每个发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;若各发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定发票图像核验通过;由此,通过交易流水图像对发票图像进行合法性核验,将发票图像的识别结果和交易流水图像的识别结果进行匹配,若匹配一致,则确定发票图像核验通过,即发票非伪造发票,从而避免了传统技术中需要人工对发票的合法性进行核验导致的核验效率低的问题。本申请实施例可以提升发票合法性的核验效率。

附图说明

图1为一个实施例中发票核验方法的流程示意图;

图2为另一个实施例中发票核验方法的流程示意图;

图3为另一个实施例中步骤s100的部分细化步骤示意图;

图4为另一个实施例中步骤s104的细化步骤示意图;

图5为另一个实施例中目标识别模型的训练过程的流程示意图;

图6为另一个实施例中发票核验方法的流程示意图;

图7为一个实施例中发票核验装置的结构框图;

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的发票核验方法、装置、计算机设备和可读存储介质,旨在解决传统技术中,人工对发票的合法性进行核验,导致发票合法性的核验效率低的技术问题。下面将通过实施例并结合附图具体地对本申请的技术方案进行详细说明。下面这几个具体地实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。

需要说明的是,本申请实施例提供的发票核验方法,其执行主体可以是发票核验装置,该发票核验装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,计算机设备可以是服务器。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。可以理解的是,下述方法实施例提供的发票核验方法,也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。

在一个实施例中,如图1所示,提供了一种发票核验方法,包括以下步骤:

步骤s100,获取发票图像和对应的交易流水图像,根据发票图像获取第一识别结果,并根据交易流水图像获取第二识别结果。

本申请实施例中,发票图像和交易流水图像可以是报销人员提供的电子票据图像,也可以是对纸质发票和纸质交易流水拍摄得到的图像。该发票图像和交易流水图像可以是人工输入计算机设备的,也可以是用户终端发送至计算机设备的,在此均不做具体限制。

计算机设备根据发票图像获取第一识别结果,该第一识别结果包括多个发票字段以及各发票字段关联的发票识别信息。计算机设备根据交易流水图像获取第二识别结果,该第二识别结果包括多个流水字段以及各流水字段关联的流水识别信息。

在一种可能的实施方式中,计算机设备可以对交易流水图像进行文本定位,定位得到流水字段区域以及流水信息区域,计算机设备采用ocr(opticalcharacterrecognition,光学字符识别)模型对定位得到的各区域进行字符识别,识别得到多个流水字段以及流水识别信息,计算机设备可以将各流水字段与对应的流水识别信息进行关联。其中,ocr模型例如可以是cnn(convolutionalneuralnetworks,卷积神经网络)+rnn(recurrentneuralnetworks,循环神经网络)+ctc(connectionisttemporalclassification,连续时间序列分类),等等。作为一种实施方式,计算机设备根据发票图像获取第一识别结果的过程可以与上述计算机设备根据交易流水图像获取第二识别结果的过程类似。

本申请实施例中,发票字段例如可以包括“金额”、“名称”、“开票日期”等,流水字段则对应可以包括“交易金额”、“商户名称”、“交易日期”,等等。

作为一种实施方式,为了提升字符识别的准确性,在字符识别之前,计算机设备还可以对发票图像和交易流水图像分别进行预处理,例如去除光照、阴影等干扰,再对预处理后的交易流水图像和预处理后的发票图像进行识别结果的获取。

步骤s200,根据各发票字段和各流水字段之间的映射关系,检测每个发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配。

本申请实施例中,各发票字段和各流水字段之间的映射关系可以以映射表的形式预先存储在计算机设备中。计算机设备根据映射表中的映射关系则可以确定各发票字段对应的流水字段,例如,计算机设备根据映射表中包括的映射关系,确定发票字段“金额”对应的流水字段为“交易金额”、发票字段“开票日期”对应的流水字段为“交易日期”、发票字段“名称”对应的流水字段为“商户名称”,等等。

计算机设备确定各发票字段对应的流水字段后,根据发票字段关联的发票识别信息和流水字段关联的流水识别信息,检测发票字段关联的发票识别信息是否与对应的流水字段关联的流水识别信息匹配。例如,发票字段“金额”关联的发票识别信息为“100.00”,流水字段为“交易金额”关联的流水识别信息为“100.00”,计算机设备则确定发票字段“金额”关联的发票识别信息与对应的流水字段“交易金额”关联的流水识别信息匹配。

步骤s300,若各发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定发票图像核验通过。

计算机设备若检测到第一识别结果包括的各发票字段关联的发票识别信息和第二识别结果包括的各流水字段关联的流水识别信息均对应匹配,例如,计算机设备检测到发票字段“金额”关联的发票识别信息和流水字段为“交易金额”关联的流水识别信息匹配、发票字段“开票日期”关联的发票识别信息和流水字段为“交易日期”关联的流水识别信息匹配、发票字段“名称”关联的发票识别信息和流水字段为“商户名称”关联的流水识别信息匹配,则表征该交易流水图像是该发票图像对应的真实交易流水,从而确定发票图像核验通过。由此,可以确保报销业务的真实性和有效性,同时可以提高财务人员的工作效率。

在一种可能的实施方式中,在批量进行发票核验的场景下,计算机设备还可以获取多对发票图像和交易流水图像,并对每个发票图像和该发票图像对应的交易流水图像添加相同的标识后存储在数据库中,计算机设备检测到发票核验指令时,则从数据库中获取具有相同标识的发票图像和交易流水图像,并对获取的每对发票图像和交易流水图像执行上述发票核验方法的过程。

本申请实施例通过获取发票图像和对应的交易流水图像,根据发票图像获取第一识别结果,并根据交易流水图像获取第二识别结果;第一识别结果包括多个发票字段以及各发票字段关联的发票识别信息,第二识别结果包括多个流水字段以及各流水字段关联的流水识别信息;根据各发票字段和各流水字段之间的映射关系,检测每个发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;若各发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定发票图像核验通过。由此,通过交易流水图像对发票图像进行合法性核验,将发票图像的识别结果和交易流水图像的识别结果进行匹配,若匹配一致,则确定发票图像核验通过,即发票非伪造发票,从而避免了传统技术中需要人工对发票的合法性进行核验导致的核验效率低的问题。本申请实施例可以提升发票合法性的核验效率。

在一个实施例中,基于上述图1所示实施例,本实施例涉及的是计算机设备如何根据各发票字段和各流水字段之间的映射关系,检测每个发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配的过程。如图2所示,步骤s200可以包括步骤s201、步骤s202和步骤s203:

步骤s201,根据各发票字段和各流水字段之间的映射关系,确定目标发票字段对应的目标流水字段。

本申请实施例中,计算机设备可以在预设的包含各发票字段和各流水字段之间的映射关系的映射表中,查找与各发票字段分别对应的流水字段,或者在该映射表中查找与各流水字段分别对应的发票字段,则可以确定每个目标发票字段对应的目标流水字段。例如,确定目标发票字段“金额”对应的目标流水字段为“交易金额”,等等。

步骤s202,检测目标发票字段关联的发票识别信息是否与目标流水字段关联的流水识别信息一致。

对于每个目标发票字段和其对应的目标流水字段,计算机设备检测该目标发票字段关联的发票识别信息是否与其对应的目标流水字段关联的流水识别信息一致,例如,检测目标发票字段“金额”关联的发票识别信息是否与对应的目标流水字段“交易金额”关联的流水识别信息相同。

步骤s203,若一致,则确定目标发票字段关联的发票识别信息与目标流水字段关联的流水识别信息匹配。

计算机设备若检测到目标发票字段关联的发票识别信息与目标流水字段关联的流水识别信息一致,则确定目标发票字段关联的发票识别信息与目标流水字段关联的流水识别信息匹配。

由于发票图像和交易流水图像中存在类别名称不一致,但实际指代的内容一致的字段,本申请实施例通过对发票图像中的发票字段和交易流水图像中的流水字段建立映射关系,计算机设备则可以基于该映射关系对发票图像和交易流水图像中的对应字段进行匹配,从而可以通过交易流水图像对发票图像进行合法性核验,提升发票合法性的核验效率。

在一个实施例中,基于上述图1所示实施例,本实施例涉及的是计算机设备如何根据交易流水图像获取第二识别结果的过程。如图3所示,该过程可以包括:

步骤s101,对交易流水图像进行预处理,得到预处理后的交易流水图像。

交易流水图像中可能存在阴影、光照等干扰,本申请实施例中,为了提升交易流水图像对应的第二识别结果的准确性,计算机设备首先对交易流水图像进行预处理,得到预处理后的交易流水图像。

作为一种实施方式,计算机设备可以采用前景提取算法确定交易流水图像中的前景区域和背景区域,计算机设备获取前景区域和背景区域的像素值,若检测到前景区域的像素值和背景区域的像素值的差异较小,计算机设备则调整背景区域的像素值来增大前景区域和背景区域的差异,以将背景区域的阴影弱化。计算机设备还可以通过检测交易流水图像中各像素值的大小,确定交易流水图像是否存在光线较强或者较暗的情况,若存在,计算机设备则调整对应区域的像素值的大小,对光线的强弱进行调整。

步骤s102,将预处理后的交易流水图像输入至文本定位网络中,得到预处理后的交易流水图像中各目标区域的位置框坐标。

计算机设备将预处理后的交易流水图像输入至文本定位网络中,得到预处理后的交易流水图像中各目标区域的位置框坐标,目标区域可以是流水字段区域以及流水信息区域,目标区域的位置框坐标可以是位置框中心点的坐标以及位置框的宽和高。

步骤s103,从预处理后的交易流水图像中截取与各位置框坐标分别对应的目标图像。

计算机设备根据每个位置框坐标,从预处理后的交易流水图像中截取与各位置框坐标分别对应的目标图像,可以理解的是,不同的目标图像包括交易流水图像中不同的流水字段或流水信息。

步骤s104,根据各目标图像,获取第二识别结果。

计算机设备对各目标图像进行字符识别,得到包括多个流水字段以及各流水字段关联的流水识别信息的第二识别结果。

在步骤s104一种可能的实施方式中,参见图4,步骤s104可以包括如图4所示的步骤s1041、步骤s1042和步骤s1043:

步骤s1041,将各目标图像输入至文本类型分类网络中,得到各目标图像分别对应的分类结果。

本申请实施例中,计算机设备可以采用不同文本类型的图像样本训练分类网络,分类网络例如可以是基于残差网络resnet18的神经网络,通过迭代训练得到文本类型分类网络,该文本类型分类网络可以对图像的文本类型进行分类。

计算机设备将各目标图像输入至文本类型分类网络中,则得到各目标图像分别对应的分类结果,分类结果用于表征目标图像对应的文本类型,文本类型包括中文类型、数字类型或字母类型,即目标图像中包括的字符是中文类型、数字类型或字母类型。

步骤s1042,对于每个目标图像,采用与目标图像对应的文本类型匹配的目标识别模型对目标图像进行识别,得到目标图像的字符识别结果。

本申请实施例中,由于不同文本类型的图像对应的特征复杂度不同,计算机设备可以预先训练针对不同文本类型的目标识别模型。计算机设备通过文本类型分类网络得到各目标图像分别对应的分类结果后,对于每个目标图像,计算机设备将该目标图像输入至与该目标图像对应的文本类型匹配的目标识别模型中,对目标图像进行识别,得到目标图像的字符识别结果。

由此,计算机设备通过训练与不同文本类型分别匹配的目标识别模型,在发票核验过程中,采用与目标图像对应的文本类型匹配的目标识别模型对目标图像进行识别,可以避免不同文本类型在识别过程中的相互干扰,提高识别效率。

步骤s1043,根据各目标图像的字符识别结果确定第二识别结果。

计算机设备将目标图像中流水字段区域识别的流水字段与对应的流水信息区域识别的流水识别信息进行关联,得到第二识别结果。

在步骤s1043一种可能的实施方式中,字符识别结果包括流水字段或流水识别信息,步骤s1043可以包括步骤a:

步骤a,根据各目标图像对应的位置框坐标之间的距离关系,将各目标图像的字符识别结果中的每个流水字段和对应的流水识别信息相关联,关联后得到第二识别结果。

本申请实施例中,计算机设备可以根据目标图像对应的位置框坐标,检测相邻目标图像对应的位置框之间的距离,例如可以是检测相邻目标图像对应的位置框的中心点坐标之间的距离,若该距离小于阈值,则表征相邻目标图像为流水字段区域以及该流水字段区域对应的流水信息区域,计算机设备则将该相邻目标图像分别对应的流水字段和流水识别信息进行关联,由此,得到第二识别结果。

本申请实施例通过采用文本类型分类网络对各目标图像的文本类型进行分类,对于不同文本类型的目标图像,采用与文本类型匹配的目标识别模型进行字符识别,从而能够更加精准的对不同文本类型的目标图像进行识别,提升了字符识别的准确性,进而提升了发票核验的准确性。

在一个实施例中,在上述图4所示实施例的基础上,本实施例涉及的是计算机设备如何训练目标识别模型的过程。参见图5,目标识别模型的训练过程包括步骤s401和步骤s402:

步骤s401,获取各文本类型对应的多个样本交易流水图像。

计算机设备获取各文本类型对应的多个样本交易流水图像,例如,计算机设备可以获取中文类型对应的多个样本交易流水图像,获取数字类型对应的多个样本交易流水图像,以及获取字母类型对应的多个样本交易流水图像。

步骤s402,对于每个文本类型,基于文本类型对应的多个样本交易流水图像,训练文本类型对应的初始识别模型,得到文本类型对应的目标识别模型。

本申请实施例中,对于不同的文本类型,计算机设备分别训练与各文本类型对应的目标识别模型。以文本类型是数字类型为例,计算机设备获取到数字类型对应的多个样本交易流水图像后,为了提升训练的目标识别模型的识别效果,计算机设备可以对多个样本交易流水图像进行预处理。例如,计算机设备可以对多个样本交易流水图像中的部分样本交易流水图像,加入高斯滤波噪声进行模糊化处理,以此增加图像样本的复杂度。计算机设备采用预处理后的数字类型对应的多个样本交易流水图像,训练cnn+rnn+ctc网络,其中cnn可以是resnet残差网络,rnn可以是bilstm(bi-directionallongshort-termmemory,双向长短记忆网络),等等,训练后得到文本类型为数字类型所对应的目标识别网络。

在另一种可能的实施方式中,参见图6所示的resnet网络架构,x为图像对应的特征,f(x)是经过残差块线性变化并激活(relu)后的输出,weightlayer表征当前残差块的权重。计算机设备获取到数字类型对应的多个样本交易流水图像后,计算机设备可以在resnet训练过程中,对样本交易流水图像对应的特征x加入高斯滤波噪声(gauss_blur),提升特征x的复杂度,从而可以提升识别网络的特征学习能力,有利于提升训练的目标识别模型的识别效果,提升目标识别模型的鲁棒性。

由此,计算机设备通过上述实施方式,训练得到文本类型为数字类型所对应的目标识别网络。在一种可能的实施方式中,文本类型为字母类型所对应的目标识别网络的训练过程,与上述文本类型为数字类型所对应的目标识别网络的训练过程类似,在此不再赘述。在另一种可能的实施方式中,由于字母和数字的特征复杂度接近,计算机设备还可以根据数字类型对应的多个样本交易流水图像以及字母类型对应的多个样本交易流水图像,采用上述实施方式训练同一个目标识别网络,即数字类型的目标图像和字母类型的目标图像可以共用一个目标识别网络,在此不做具体限制。

以文本类型是中文类型为例,计算机设备获取到中文类型对应的多个样本交易流水图像后,同理,计算机设备可以采用上述训练数字类型所对应的目标识别网络的方法,训练文本类型为中文类型所对应的目标识别网络。作为一种实施方式,在交易流水图像的识别场景中,由于涉及到的商户名称等中文字符较多,相较于字母和数字,中文字符的特征复杂度远高于字母和数字,计算机设备在训练中文类型对应的目标识别网络的过程中,可以增加resnet的残差块的数量,同时扩增特征的通道数(例如增加卷积核的数量),从而使目标识别网络可以充分学习复杂的文字特征,从而可以提升训练的中文类型对应的目标识别网络的识别准确性。

本申请实施例中,对于不同的文本类型,计算机设备训练对应的目标识别模型进行字符识别,从而可以提升字符识别的准确性。在目标识别模型的训练过程中,通过在resnet训练过程中加入高斯滤波噪声,提高图像样本的复杂度,使得生成的目标识别模型更具鲁棒性。

在一个实施例中,基于上述图1所示的实施例,参见图6,本实施例步骤s200之后还包括步骤s500:

步骤s500,若存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,则确定发票图像核验未通过。

本申请实施例中,计算机设备获取发票图像和对应的交易流水图像,根据发票图像获取第一识别结果,并根据交易流水图像获取第二识别结果;该第一识别结果包括多个发票字段以及各发票字段关联的发票识别信息,该第二识别结果包括多个流水字段以及各流水字段关联的流水识别信息。计算机设备根据各发票字段和各流水字段之间的映射关系,检测每个发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配。

若计算机设备检测到存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,例如,计算机设备检测到发票字段“金额”关联的发票识别信息和流水字段“交易金额”关联的流水识别信息匹配,且发票字段“开票日期”关联的发票识别信息和流水字段“交易日期”关联的流水识别信息匹配,但是,发票字段“名称”关联的发票识别信息和流水字段“商户名称”关联的流水识别信息不匹配,则表征该交易流水图像不是该发票图像对应的真实交易流水,从而确定发票图像核验未通过。由此可以确保报销业务的真实性和有效性,同时可以提高财务人员的工作效率。

应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图7所示,提供了一种发票核验装置,包括:

第一获取模块10,用于获取发票图像和对应的交易流水图像,根据所述发票图像获取第一识别结果,并根据所述交易流水图像获取第二识别结果;所述第一识别结果包括多个发票字段以及各所述发票字段关联的发票识别信息,所述第二识别结果包括多个流水字段以及各所述流水字段关联的流水识别信息;

核验模块20,用于根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;

第一确定模块30,用于若各所述发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定所述发票图像核验通过。

可选地,所述核验模块20包括:

确定单元,用于根据各所述发票字段和各所述流水字段之间的映射关系,确定目标发票字段对应的目标流水字段;

检测单元,用于检测所述目标发票字段关联的发票识别信息是否与所述目标流水字段关联的流水识别信息一致;

核验单元,用于若一致,则确定所述目标发票字段关联的发票识别信息与所述目标流水字段关联的流水识别信息匹配。

可选地,所述第一获取模块10:

预处理单元,用于对所述交易流水图像进行预处理,得到预处理后的交易流水图像;

定位单元,用于将所述预处理后的交易流水图像输入至文本定位网络中,得到所述预处理后的交易流水图像中各目标区域的位置框坐标;

截取单元,用于从所述预处理后的交易流水图像中截取与各所述位置框坐标分别对应的目标图像;

获取单元,用于根据各所述目标图像,获取所述第二识别结果。

可选地,所述获取单元具体用于将各所述目标图像输入至文本类型分类网络中,得到各所述目标图像分别对应的分类结果;所述分类结果用于表征所述目标图像对应的文本类型,所述文本类型包括中文类型、数字类型或字母类型;对于每个所述目标图像,采用与所述目标图像对应的文本类型匹配的目标识别模型对所述目标图像进行识别,得到所述目标图像的字符识别结果;根据各所述目标图像的字符识别结果确定所述第二识别结果。

可选地,所述字符识别结果包括流水字段或流水识别信息,所述获取单元具体用于根据各所述目标图像对应的位置框坐标之间的距离关系,将各所述目标图像的字符识别结果中的每个流水字段和对应的流水识别信息相关联,关联后得到所述第二识别结果。

可选地,所述装置还包括:

第二获取模块,用于获取各所述文本类型对应的多个样本交易流水图像;

训练模块,用于对于每个所述文本类型,基于所述文本类型对应的多个样本交易流水图像,训练所述文本类型对应的初始识别模型,得到所述文本类型对应的目标识别模型。

可选地,所述装置还包括:

第二确定模块,用于若存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,则确定所述发票图像核验未通过。

关于发票核验装置的具体限定可以参见上文中对于发票核验方法的限定,在此不再赘述。上述发票核验装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储发票核验方法的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种发票核验方法。

本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取发票图像和对应的交易流水图像,根据所述发票图像获取第一识别结果,并根据所述交易流水图像获取第二识别结果;所述第一识别结果包括多个发票字段以及各所述发票字段关联的发票识别信息,所述第二识别结果包括多个流水字段以及各所述流水字段关联的流水识别信息;

根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;

若各所述发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定所述发票图像核验通过。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据各所述发票字段和各所述流水字段之间的映射关系,确定目标发票字段对应的目标流水字段;

检测所述目标发票字段关联的发票识别信息是否与所述目标流水字段关联的流水识别信息一致;

若一致,则确定所述目标发票字段关联的发票识别信息与所述目标流水字段关联的流水识别信息匹配。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

对所述交易流水图像进行预处理,得到预处理后的交易流水图像;

将所述预处理后的交易流水图像输入至文本定位网络中,得到所述预处理后的交易流水图像中各目标区域的位置框坐标;

从所述预处理后的交易流水图像中截取与各所述位置框坐标分别对应的目标图像;

根据各所述目标图像,获取所述第二识别结果。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

将各所述目标图像输入至文本类型分类网络中,得到各所述目标图像分别对应的分类结果;所述分类结果用于表征所述目标图像对应的文本类型,所述文本类型包括中文类型、数字类型或字母类型;

对于每个所述目标图像,采用与所述目标图像对应的文本类型匹配的目标识别模型对所述目标图像进行识别,得到所述目标图像的字符识别结果;

根据各所述目标图像的字符识别结果确定所述第二识别结果。

在一个实施例中,所述字符识别结果包括流水字段或流水识别信息,处理器执行计算机程序时还实现以下步骤:

根据各所述目标图像对应的位置框坐标之间的距离关系,将各所述目标图像的字符识别结果中的每个流水字段和对应的流水识别信息相关联,关联后得到所述第二识别结果。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取各所述文本类型对应的多个样本交易流水图像;

对于每个所述文本类型,基于所述文本类型对应的多个样本交易流水图像,训练所述文本类型对应的初始识别模型,得到所述文本类型对应的目标识别模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

若存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,则确定所述发票图像核验未通过。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取发票图像和对应的交易流水图像,根据所述发票图像获取第一识别结果,并根据所述交易流水图像获取第二识别结果;所述第一识别结果包括多个发票字段以及各所述发票字段关联的发票识别信息,所述第二识别结果包括多个流水字段以及各所述流水字段关联的流水识别信息;

根据各所述发票字段和各所述流水字段之间的映射关系,检测每个所述发票字段关联的发票识别信息是否与对应流水字段关联的流水识别信息匹配;

若各所述发票字段关联的发票识别信息与对应流水字段关联的流水识别信息均匹配,则确定所述发票图像核验通过。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据各所述发票字段和各所述流水字段之间的映射关系,确定目标发票字段对应的目标流水字段;

检测所述目标发票字段关联的发票识别信息是否与所述目标流水字段关联的流水识别信息一致;

若一致,则确定所述目标发票字段关联的发票识别信息与所述目标流水字段关联的流水识别信息匹配。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

对所述交易流水图像进行预处理,得到预处理后的交易流水图像;

将所述预处理后的交易流水图像输入至文本定位网络中,得到所述预处理后的交易流水图像中各目标区域的位置框坐标;

从所述预处理后的交易流水图像中截取与各所述位置框坐标分别对应的目标图像;

根据各所述目标图像,获取所述第二识别结果。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

将各所述目标图像输入至文本类型分类网络中,得到各所述目标图像分别对应的分类结果;所述分类结果用于表征所述目标图像对应的文本类型,所述文本类型包括中文类型、数字类型或字母类型;

对于每个所述目标图像,采用与所述目标图像对应的文本类型匹配的目标识别模型对所述目标图像进行识别,得到所述目标图像的字符识别结果;

根据各所述目标图像的字符识别结果确定所述第二识别结果。

在一个实施例中,所述字符识别结果包括流水字段或流水识别信息,计算机程序被处理器执行时还实现以下步骤:

根据各所述目标图像对应的位置框坐标之间的距离关系,将各所述目标图像的字符识别结果中的每个流水字段和对应的流水识别信息相关联,关联后得到所述第二识别结果。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取各所述文本类型对应的多个样本交易流水图像;

对于每个所述文本类型,基于所述文本类型对应的多个样本交易流水图像,训练所述文本类型对应的初始识别模型,得到所述文本类型对应的目标识别模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

若存在至少一个发票字段关联的发票识别信息与对应流水字段关联的流水识别信息不匹配,则确定所述发票图像核验未通过。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1