本申请涉及大数据处理,尤其涉及一种数据处理方法、装置、电子设备及计算机可读介质。
背景技术:
1、目前,金融服务企业存在大量预算机构,在企业财务经费管理中涉及各类经费凭证数据的报销审批处理和凭证管理,为了建立高效、便利的办理机制,需要将纸质或电子经费凭证的信息提取为电子数据,便于后续的报销流程以及凭证验真。在单次报销申请中存在大量的经费凭证数据,人工提取录入为电子数据十分繁琐,需要录入的信息内容较多,同时连续识别录入位数较多的编号信息,容易出现人工识别录入差错,无法保证准确性,需要多次审核核对是否正确,十分依赖人力成本的大量投入,将各类经费凭证数据人工录入为电子数据效率低、成本高、准确率低。
技术实现思路
1、有鉴于此,本申请实施例提供一种数据处理方法、装置、电子设备及计算机可读介质,能够解决现有的单次报销申请中存在大量的经费凭证数据,将各类经费凭证数据人工录入为电子数据效率低、成本高、准确率低的问题。
2、为实现上述目的,根据本申请实施例的一个方面,提供了一种数据处理方法,包括:响应于报销请求,获取报销申请数据;若报销申请数据的展示形式为影像,识别报销申请数据的分区边缘,基于分区边缘对报销申请数据进行分区,以得到各个分区数据,识别各个分区数据中的关键字段,根据关键字段对报销申请数据进行分类,以得到各个类别;根据各个类别对报销申请数据进行标记,以得到标记数据;基于标记数据,生成结果树;根据结果树和预录业务数据,执行校验进程,响应于校验失败,生成线下标注任务并发送至线下标注节点。
3、可选地,根据关键字段对报销申请数据进行分类,以得到各个类别,包括:将关键字段与预设的类别描述进行相似度匹配,以基于匹配到的类别描述确定报销申请数据对应的各个类别。
4、可选地,根据各个类别对报销申请数据进行标记,以得到标记数据,包括:对于每一笔业务申请,将类别为报销单的报销申请数据标记为主节点,将类别为票据的报销申请数据标记为子节点,以基于主节点和子节点得到标记数据。
5、可选地,生成结果树,包括:将标记数据中的各个子节点与主节点关联,以生成结果树。
6、可选地,执行校验进程,包括:汇总各个结果树的主节点的数量,进而将主节点的数量与预设的业务申请笔数进行对比,若对比不一致则确定校验失败。
7、可选地,执行校验进程,包括:对于每一笔业务申请,汇总得到对应的结果树中的子节点的数量,进而将子节点的数量与对应的预设的票据的数量进行对比,若对比不一致则确定校验失败。
8、另外,本申请还提供了一种数据处理装置,包括:获取单元,被配置成响应于报销请求,获取报销申请数据;分类单元,被配置成若报销申请数据的展示形式为影像,识别报销申请数据的分区边缘,基于分区边缘对报销申请数据进行分区,以得到各个分区数据,识别各个分区数据中的关键字段,根据关键字段对报销申请数据进行分类,以得到各个类别;标记单元,被配置成根据各个类别对报销申请数据进行标记,以得到标记数据;结果树生成单元,被配置成基于标记数据,生成结果树;校验单元,被配置成根据结果树和预录业务数据,执行校验进程,响应于校验失败,生成线下标注任务并发送至线下标注节点。
9、可选地,分类单元进一步被配置成:将关键字段与预设的类别描述进行相似度匹配,以基于匹配到的类别描述确定报销申请数据对应的各个类别。
10、可选地,标记单元进一步被配置成:对于每一笔业务申请,将类别为报销单的报销申请数据标记为主节点,将类别为票据的报销申请数据标记为子节点,以基于主节点和子节点得到标记数据。
11、可选地,结果树生成单元进一步被配置成:将标记数据中的各个子节点与主节点关联,以生成结果树。
12、可选地,校验单元进一步被配置成:汇总各个结果树的主节点的数量,进而将主节点的数量与预设的业务申请笔数进行对比,若对比不一致则确定校验失败。
13、可选地,校验单元进一步被配置成:对于每一笔业务申请,汇总得到对应的结果树中的子节点的数量,进而将子节点的数量与对应的预设的票据的数量进行对比,若对比不一致则确定校验失败。
14、另外,本申请还提供了一种数据处理电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述的数据处理方法。
15、另外,本申请还提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上述的数据处理方法。
16、为实现上述目的,根据本申请实施例的又一个方面,提供了一种计算机程序产品。
17、本申请实施例的一种计算机程序产品,包括计算机程序,程序被处理器执行时实现本申请实施例提供的数据处理方法。
18、上述发明中的一个实施例具有如下优点或有益效果:本申请通过响应于报销请求,获取报销申请数据;若报销申请数据的展示形式为影像,识别报销申请数据的分区边缘,基于分区边缘对报销申请数据进行分区,以得到各个分区数据,识别各个分区数据中的关键字段,根据关键字段对报销申请数据进行分类,以得到各个类别;根据各个类别对报销申请数据进行标记,以得到标记数据;基于标记数据,生成结果树;根据结果树和预录业务数据,执行校验进程,响应于校验失败,生成线下标注任务并发送至线下标注节点。从而提高处理报销申请时的数据处理效率和准确性,降低人力成本。
19、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述关键字段对所述报销申请数据进行分类,以得到各个类别,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述各个类别对所述报销申请数据进行标记,以得到标记数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述生成结果树,包括:
5.根据权利要求4所述的方法,其特征在于,所述执行校验进程,包括:
6.根据权利要求4所述的方法,其特征在于,所述执行校验进程,包括:
7.一种数据处理装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,所述分类单元进一步被配置成:
9.根据权利要求7所述的装置,其特征在于,所述标记单元进一步被配置成:
10.根据权利要求9所述的装置,其特征在于,所述结果树生成单元进一步被配置成:
11.根据权利要求10所述的装置,其特征在于,所述校验单元进一步被配置成:
12.根据权利要求10所述的装置,其特征在于,所述校验单元进一步被配置成:
13.一种数据处理电子设备,其特征在于,包括:
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。