文件比对方法、装置、计算机设备和存储介质与流程

文档序号:37790255发布日期:2024-04-30 17:00阅读:12来源:国知局
文件比对方法、装置、计算机设备和存储介质与流程

本申请涉及计算机,特别是涉及一种文件比对方法、装置、计算机设备和存储介质。


背景技术:

1、随着计算机技术领域不断发展,同一文件在不同平台间进行转移的场景越来越多。但由于不同平台的业务架构调整和功能重构,会导致同一文件的生成方式不同,使得文件所显示出的内容发生变化。

2、传统技术中大多通过人工的方式来比对文件内容是否一致。因此,传统技术中文件比对方式存在比对效率不高的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高文件比对效率的文件比对方法、装置、计算机设备和存储介质。

2、第一方面,本申请提供了一种文件比对方法,包括:

3、基于原文件获取相应的数据定义文件和待比对文件;其中,所述待比对文件与所述原文件的生成方式不同;

4、基于所述数据定义文件获取数据定义信息和主键字段;其中,所述数据定义信息包括所述原文件的字段名称、字段长度、译码类型以及译码后字段长度;

5、基于所述主键字段和所述数据定义信息,对所述原文件和所述待比对文件分别进行解析,得到所述原文件拆分后的原行数据和所述待比对文件拆分后的待比对行数据;

6、遍历原行数据的主键字段数据,在存在至少一个待比对行数据与当前遍历到的原行数据之间的主键字段数据相同的情况下,确定目标待比对行数据,所述目标待比对行数据为与当前遍历到的原行数据间差异最小的待比对行数据,获取所述目标待比对行数据与当前遍历到的原行数据的第一比对结果,所述第一比对结果为数据完全相同或者数据存在不同;

7、在不存在待比对行数据与当前遍历到的原行数据之间的主键字段数据相同的情况下,得到第二比对结果,所述第二比对结果为所述原文件比所述待比对文件多出当前遍历到的原行数据。

8、在其中一个实施例中,所述方法还包括:

9、遍历待比对行数据的主键字段数据,在不存在原行数据与当前遍历到的待比对行数据之间的主键字段数据相同的情况下,得到第三比对结果,所述第三比对结果为所述待比对文件比所述原文件多出当前遍历到的待比对行数据。

10、在其中一个实施例中,所述基于所述数据定义文件获取数据定义信息和主键字段之前,包括:

11、对所述原文件、所述待比对文件和所述数据定义文件进行校验,在校验通过的情况下,执行基于所述数据定义文件获取数据定义信息和主键字段的步骤。

12、在其中一个实施例中,所述对所述原文件、所述待比对文件和所述数据定义文件进行校验,包括:

13、判断所述原文件、所述待比对文件和所述数据定义文件是否为非空、所述原文件和所述待比对文件的格式和字段是否分别一致、以及特定译码类型对应的译码后字段长度是否正确。

14、在其中一个实施例中,所述特定译码类型包括有符号整数;所述方法还包括:

15、在所述特定译码类型为有符号整数的情况下,将字段长度加1作为译码后字段长度。

16、在其中一个实施例中,所述原文件为定长文件或者分隔符文件。

17、第二方面,本申请还提供了一种文件比对装置,包括:

18、文件获取模块,用于基于原文件获取相应的数据定义文件和待比对文件;其中,所述待比对文件与所述原文件的生成方式不同;

19、主键字段获取模块,用于基于所述数据定义文件获取数据定义信息和主键字段;其中,所述数据定义信息包括所述原文件的字段名称、字段长度、译码类型以及译码后字段长度;

20、文件解析模块,用于基于所述主键字段和所述数据定义信息,对所述原文件和所述待比对文件分别进行解析,得到所述原文件拆分后的原行数据和所述待比对文件拆分后的待比对行数据;

21、第一比对模块,用于遍历原行数据的主键字段数据,在存在至少一个待比对行数据与当前遍历到的原行数据之间的主键字段数据相同的情况下,确定目标待比对行数据,所述目标待比对行数据为与当前遍历到的原行数据间差异最小的待比对行数据,获取所述目标待比对行数据与当前遍历到的原行数据的第一比对结果,所述第一比对结果为数据完全相同或者数据存在不同;

22、第二比对模块,用于在不存在待比对行数据与当前遍历到的原行数据之间的主键字段数据相同的情况下,得到第二比对结果,所述第二比对结果为所述原文件比所述待比对文件多出当前遍历到的原行数据。

23、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一方法的步骤。

24、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。

25、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一方法的步骤。

26、上述文件比对方法、装置、计算机设备和存储介质,基于原文件获取相应的数据定义文件和待比对文件,基于数据定义文件获取数据定义信息和主键字段,基于主键字段和数据定义信息对原文件和待比对文件分别进行解析,得到原文件拆分后的原行数据和待比对文件拆分后的待比对行数据,遍历原行数据的主键字段数据,获取原文件和待比对文件的第一比对结果和第二比对结果,第一比对结果为数据完全相同或者数据存在不同,第二比对结果为原文件比待比对文件多出当前遍历到的原行数据。相比于传统技术中存在通过人工方式比对文件导致的比对效率不高的问题而言,本申请基于数据定义文件获取到的数据定义信息和主键字段对原文件和待比对文件分别进行解析,能够快速解析得到原文件拆分后的原行数据和待比对文件拆分后的待比对行数据,并通过遍历原行数据的主键字段数据得到原文件和待比对文件的比对结果,不需人工参与,提高了文件比对效率。



技术特征:

1.一种文件比对方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述数据定义文件获取数据定义信息和主键字段之前,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述原文件、所述待比对文件和所述数据定义文件进行校验,包括:

5.根据权利要求4所述的方法,其特征在于,所述特定译码类型包括有符号整数;所述方法还包括:

6.根据权利要求1至5任意一项所述的方法,其特征在于,所述原文件为定长文件或者分隔符文件。

7.一种文件比对装置,其特征在于,所述装置包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。


技术总结
本申请涉及一种文件比对方法、装置、计算机设备和存储介质,涉及计算机技术领域。可用于金融科技领域或其他相关领域。所述方法包括:基于原文件获取相应的数据定义文件和待比对文件;基于数据定义文件获取数据定义信息和主键字段;基于所述主键字段和所述数据定义信息,对原文件和待比对文件分别进行解析,得到所述原文件拆分后的原行数据和所述待比对文件拆分后的待比对行数据;遍历原行数据的主键字段数据,获取所述原文件与所述待比对文件之间的第一比对结果和第二比对结果;所述第一比对结果为数据完全相同或者数据存在不同,所述第二比对结果为所述原文件比所述待比对文件多出当前遍历到的原行数据。采用本方法能够提高文件比对效率。

技术研发人员:黄荣清,朱李悦,赵磬,毛宇航
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/4/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1