1.本技术涉及数据处理技术领域,具体涉及一种文件检测方法、装置、设备及计算机可读存储介质。
背景技术:2.对系统进行版本更新之前,通常由人工对需要版本更新所需的文件进行检查。
3.但是,人工检查的方式需要对版本更新所需的文件中存在的数据一一进行检测,存在文件检测效率低的问题。
技术实现要素:4.有鉴于此,本技术提供一种文件检测方法、装置、设备及计算机可读存储介质,能够提高文件的检测效率。
5.为解决上述问题,本技术提供的技术方案如下:
6.第一方面,本技术提供一种文件检测方法,所述方法包括:
7.获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;
8.获取多个历史文件包括的所述目标栏位的第二栏位数据;
9.若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据;
10.若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。
11.在一种可能实现的方式中,所述方法还包括:
12.获取所述待检测文件的批次、多个所述历史文件的批次以及多个所述历史文件的特征属性;
13.将与所述待检测文件属于同一批次的所述历史文件作为目标文件;
14.若所述目标文件的特征属性与所述待检测文件的特征属性相同,且所述目标文件的特征属性与属于其他批次的历史文件的特征属性不相同,则确定所述待检测文件通过检测。
15.在一种可能实现的方式中,所述方法还包括:
16.若所述目标文件的特征属性与所述待检测文件的特征属性不同相同,和/或所述目标文件的特征属性与属于其他批次的历史文件的特征属性相同,则获取所述待检测文件的第一功能改造点和所述目标文件的第二功能改造点;
17.若所述第一功能改造点与所述第二功能改造点一致,则确定所述待检测文件通过检测。
18.在一种可能实现的方式中,所述第一栏位数据包括第一数据值,所述第二栏位数据包括第二数据值,所述方法还包括:
19.将满足预设条件的第一数据值作为目标数据值,所述预设条件为所述第一数据值所属的所述第一栏位数据的数量为1个;
20.获取与所述目标数据值相同的所述第二数据值的目标数量;
21.若所述目标数量小于或者等于预设阈值,则确定所述待检测文件通过检测。
22.在一种可能实现的方式中,所述方法还包括:
23.若所述目标数量大于预设阈值,则确定所述待检测文件未通过检测;
24.向用户发送警告信息,所述警告信息包括所述目标数据值所属的第一栏位数据。
25.第二方面,本技术提供一种文件检测装置,所述装置包括:
26.第一获取模块,用于获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;
27.第二获取模块,用于获取多个历史文件包括的所述目标栏位的第二栏位数据;
28.第一确定模块,用于若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据;
29.第二确定模块,用于若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。
30.在一种可能实现的方式中,所述装置还包括:
31.第三获取模块,用于获取所述待检测文件的批次、多个所述历史文件的批次以及多个所述历史文件的特征属性;
32.第三确定模块,用于将与所述待检测文件属于同一批次的所述历史文件作为目标文件;
33.第四确定模块,用于若所述目标文件的特征属性与所述待检测文件的特征属性相同,且所述目标文件的特征属性与属于其他批次的历史文件的特征属性不相同,则确定所述待检测文件通过检测。
34.在一种可能实现的方式中,所述装置还包括:
35.第四获取模块,用于若所述目标文件的特征属性与所述待检测文件的特征属性不同相同,和/或所述目标文件的特征属性与属于其他批次的历史文件的特征属性相同,则获取所述待检测文件的第一功能改造点和所述目标文件的第二功能改造点;
36.第五确定模块,用于若所述第一功能改造点与所述第二功能改造点一致,则确定所述待检测文件通过检测。
37.在一种可能实现的方式中,所述第一栏位数据包括第一数据值,所述第二栏位数据包括第二数据值,所述装置还包括:
38.第六确定模块,用于将满足预设条件的第一数据值作为目标数据值,所述预设条件为所述第一数据值所属的所述第一栏位数据的数量为1个;
39.第五获取模块,用于获取与所述目标数据值相同的所述第二数据值的目标数量;
40.第七确定模块,用于若所述目标数量小于或者等于预设阈值,则确定所述待检测文件通过检测。
41.在一种可能实现的方式中,所述装置还包括:
42.第八确定模块,用于若所述目标数量大于预设阈值,则确定所述待检测文件未通过检测;
43.发送模块,用于向用户发送警告信息,所述警告信息包括所述目标数据值所属的第一栏位数据。
44.第三方面,本技术提供一种文件检测设备,包括:处理器、存储器、系统总线;
45.所述处理器以及所述存储器通过所述系统总线相连;
46.所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述第一方面所述的文件检测方法。
47.第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储指令,当所述指令在设备上运行时,使得所述设备执行上述第一方面所述的文件检测方法。
48.由此可见,本技术具有如下有益效果:
49.本技术提供一种文件检测方法、装置、设备及计算机可读存储介质,首先获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;而后获取多个历史文件包括的所述目标栏位的第二栏位数据;若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据;若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。如此,根据历史文件对待检测文件进行检测,若确定待检测文件中存在与历史文件的第二栏位数据不相同的第一栏位数据,则将与第二栏位数据不相同的第一栏位数据与待检测文件的特征属性比较,确定待检测文件是否通过验证,能够提高待检测文件的检测效率。
附图说明
50.图1为本技术实施例提供的一种文件检测方法的流程示意图;
51.图2为本技术实施例提供的一种文件检测装置的结构示意图。
具体实施方式
52.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
53.在本技术中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
54.目前,在系统进行版本更新之前,通常由人工对系统更新所需的文件进行检查。通过人工检查的方式一一检测文件中存在的数据是否准确。但是,人工检查的方式花费的时间较长,存在文件检测效率低的问题。
55.本技术提供一种文件检测方法、装置、设备及计算机可读存储介质,首先获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;而后获取多个历史文件包括的所述目标栏位的第二栏位数据;若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数
据;若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。如此,根据历史文件对待检测文件进行检测,若确定待检测文件中存在与历史文件的第二栏位数据不相同的第一栏位数据,则将与第二栏位数据不相同的第一栏位数据与待检测文件的特征属性比较,确定待检测文件是否通过验证,能够提高待检测文件的检测效率。
56.为了便于理解本技术实施例提供的技术方案,下面结合附图对本技术实施例提供的一种文件检测方法、装置、设备及计算机可读存储介质进行说明。
57.本技术实施例提供的一种文件检测方法可以应用于系统,也可以应用于服务器,对此并不作限定,以下以系统为例进行说明。参见图1,图1为本技术实施例提供的一种文件检测方法的流程示意图,该方法具体包括s101-s104。
58.s101:获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性。
59.本技术实施例以银行系统作为一种示例进行说明。银行系统需要进行系统版本更新之前,需要对系统版本更新所需使用的文件进行检测,以避免文件中存在的错误引起银行系统的错误。在一种可能实现的方式中,可以由用户录入待检测文件的名称及对应的存储路径,同时用户还可以录入本批次待检测文件的特征属性,该特征属性可以包括待检测文件的更新时间、批次以及待检测文件是否涉及其他国家的版本。系统在接收到用户录入的数据后,通过检查待检测文件的名称以获得待检测文件。系统只有在识别到存在待检测文件的名称,才可以在待检测文件对应的存储路径获取待检测文件,而后开始进行对比。
60.系统执行版本更新所需的文件中包括多个栏位,可以通过历史文件获取目标栏位。历史文件为历史时间段内关于银行系统版本更新的所有文件。对所有历史文件进行比较,可以获得历史文件中不相同的栏位,则将该不相同的栏位确定为目标栏位,每个栏位均可以获得其对应的第一栏位数据和第二栏位数据。
61.在执行对比操作之前,系统获取待检测文件所包括的目标栏位的第一栏位数据和用户输入的该待检测文件的特征属性,本技术实施例并不限定获取的具体方式,可以根据实际情况进行选择。
62.s102:获取多个历史文件包括的所述目标栏位的第二栏位数据。
63.收集历史时间段内关于银行系统版本更新的所有历史文件,每个版本的历史文件均存在目标栏位以及该目标栏位对应的第二栏位数据,可以从历史文件所在数据库中搜索获取第二栏位数据,本技术实施例中并不限定该第二栏位数据的获取方式,可以根据实际情况进行选择。
64.s103:若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据。
65.比较第一栏位数据和第二栏位数据的相似度,若相似度在预设区间内,则表明存在目标栏位数据。其中,预设区间为大于0%且小于100%,即第一栏位数据与第二栏位数据存在相同的部分,也存在不同的部分。若相似度在预设区间内,则将第一栏位数据中与第二栏位数据不相同的第一栏位数据确定为目标栏位数据,可以根据该第一栏位数据与用户输入的特征属性相比较。
66.s104:若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。
67.确定历史文件能够在系统上正常运行,则与第二栏位数据相同的第一栏位数据也可以确定为正常数据。还需要检测与第二栏位数据不相同的第一栏位数据是否为正常数据。将目标栏位数据与待检测文件的特征属性进行匹配,若目标栏位数据与待检测文件的特征属性匹配成功,则表明目标栏位数据为不同于第二栏位数据的正常数据,则可以确定待检测文件通过检测,使用该待检测文件进行系统版本更新,系统更新后可以正常使用。
68.在一种可能实现的方式中,所述方法还包括:获取所述待检测文件的批次、多个所述历史文件的批次以及多个所述历史文件的特征属性;将与所述待检测文件属于同一批次的所述历史文件作为目标文件;若所述目标文件的特征属性与所述待检测文件的特征属性相同,且所述目标文件的特征属性与属于其他批次的历史文件的特征属性不相同,则确定所述待检测文件通过检测。
69.每个更新版本对应的文件均存在批次,能够根据该批次信息确定与待检测文件先攻批次的历史文件。例如,按照批次将相同批次的历史文件划分为一个集合,按照待检测文件的批次确定与待检测文件相同批次的目标集合,根据目标集合里的目标文件对待检测文件进行检测,目标文件为目标集合中的历史文件。判断目标文件的特征属性与待检测文件的特征属性是否相同,且判断目标文件的特征属性与属于其他批次的历史文件的特征属性不相同,则确定待检测文件通过检测。
70.在一种可能实现的方式中,所述方法还包括:若所述目标文件的特征属性与所述待检测文件的特征属性不同相同,和/或所述目标文件的特征属性与属于其他批次的历史文件的特征属性相同,则获取所述待检测文件的第一功能改造点和所述目标文件的第二功能改造点;若所述第一功能改造点与所述第二功能改造点一致,则确定所述待检测文件通过检测。
71.需要说明的是,功能改造点可能使文件的特征属性发生变化。若判断目标文件的特征属性与待检测文件的特征属性不同,和/或,目标文件的特征属性与属于其他批次的历史文件的特征属性相同,则表明可能是功能改造点引起的不同。因此需要对比目标文件和待检测文件的功能改造点。若待检测文件的第一功能改造点与目标文件的第二功能改造点一致,则表明待检测文件通过检验。若第一功能改造点与第二功能改造点不相同,则向用户发起提示信息,指示用户进行审核。可以通过文字的方式或者语音的方式显示提示信息,本技术实施例并不对此进行限定。
72.在一种可能实现的方式中,所述第一栏位数据包括第一数据值,所述第二栏位数据包括第二数据值,所述方法还包括:将满足预设条件的第一数据值作为目标数据值,所述预设条件为所述第一数据值所属的所述第一栏位数据的数量为1个;获取与所述目标数据值相同的所述第二数据值的目标数量;若所述目标数量小于或者等于预设阈值,则确定所述待检测文件通过检测。
73.栏位数据可以包括数据值,获取第一栏位数据包括的第一数据值和第二栏位数据包括的第二数据值。目标栏位的第一栏位数据可以有多个,每个栏位数据对应一个数据值,若数据值所属的第一栏位数据的个数为1个,则确定该数据值为目标数据值。例如,栏位数据a的数据值为1,栏位数据b的数据值为2,栏位数据c的数据值为2,则数据值1所属的栏位数据有且仅有a,数据值2所属的栏位数据有b和c,则确定数据值1为目标数据值。确定了目标数据值之后,确定与目标数据值相同的第二数据值的目标数量,若目标数量小于或者等
于预设阈值,则表明目标数据值所属的第一栏位数据与特征属性匹配,确定待检测文件通过检测。本技术实施例中并不限定预设阈值的具体取值范围,可以根据实际情况进行选择。
74.在一种可能实现的方式中,所述方法还包括:若所述目标数量大于预设阈值,则确定所述待检测文件未通过检测;向用户发送警告信息,所述警告信息包括所述目标数据值所属的第一栏位数据。
75.若目标数量大于预设阈值,则表明目标数据值所属的第一栏位数据与特征属性不匹配,确定待检测文件未通过检测,通过人机交互界面显示告警信息。在向用户告警的同时,将目标数据所属的第一栏位数据发送给用户。在另一种可能实现的方式中,存在多个第一栏位数据与特征属性不匹配,则需要确定每个第一栏位数据的预警等级。具体可以根据栏位数据的重要程度确定预警等级,本技术实施例并不对此进行限定,可以根据实际需求确定栏位数据的预警等级。本技术实施例中在发现异常栏位数据可以按照预警等级及时提醒用户,以便用户快速核查该第一栏位数据,能够提高确定更正文件错误栏位数据的效率,保证系统的安全更新。
76.基于上述s101-s104的相关内容可知,根据历史文件对待检测文件进行检测,若确定待检测文件中存在与历史文件的第二栏位数据不相同的第一栏位数据,则将与第二栏位数据不相同的第一栏位数据与待检测文件的特征属性比较,确定待检测文件是否通过验证。自动时间待检测文件的检测,能够提高待检测文件的检测效率。
77.本技术提供的一种文件检测方法、装置、设备及计算机可读存储介质可用于金融领域或其他领域,例如,可用于金融领域中的对系统更新的版本文件进行检测的应用场景。其他领域为除金融领域之外的任意领域,例如,数据处理技术领域。上述仅为示例,并不对本技术提供的一种文件检测方法、装置、设备及计算机可读存储介质的应用领域进行限定。
78.前述本技术实施例提供基于上述的一种文件检测方法。接下来说明本技术实施例中还提供的一种文件检测装置,该装置执行前述图1所示的方法,接下来对文件检测装置的功能进行说明,所述文件检测装置的结构示意图如图2所示,包括第一获取模块201、第二获取模块202、第一确定模块203以及第二确定模块204。
79.第一获取模块201,用于获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;
80.第二获取模块202,用于获取多个历史文件包括的所述目标栏位的第二栏位数据;
81.第一确定模块203,用于若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据;
82.第二确定模块204,用于若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。
83.在一种可能实现的方式中,所述装置还包括:
84.第三获取模块,用于获取所述待检测文件的批次、多个所述历史文件的批次以及多个所述历史文件的特征属性;
85.第三确定模块,用于将与所述待检测文件属于同一批次的所述历史文件作为目标文件;
86.第四确定模块,用于若所述目标文件的特征属性与所述待检测文件的特征属性相同,且所述目标文件的特征属性与属于其他批次的历史文件的特征属性不相同,则确定所
述待检测文件通过检测。
87.在一种可能实现的方式中,所述装置还包括:
88.第四获取模块,用于若所述目标文件的特征属性与所述待检测文件的特征属性不同相同,和/或所述目标文件的特征属性与属于其他批次的历史文件的特征属性相同,则获取所述待检测文件的第一功能改造点和所述目标文件的第二功能改造点;
89.第五确定模块,用于若所述第一功能改造点与所述第二功能改造点一致,则确定所述待检测文件通过检测。
90.在一种可能实现的方式中,所述第一栏位数据包括第一数据值,所述第二栏位数据包括第二数据值,所述装置还包括:
91.第六确定模块,用于将满足预设条件的第一数据值作为目标数据值,所述预设条件为所述第一数据值所属的所述第一栏位数据的数量为1个;
92.第五获取模块,用于获取与所述目标数据值相同的所述第二数据值的目标数量;
93.第七确定模块,用于若所述目标数量小于或者等于预设阈值,则确定所述待检测文件通过检测。
94.在一种可能实现的方式中,所述装置还包括:
95.第八确定模块,用于若所述目标数量大于预设阈值,则确定所述待检测文件未通过检测;
96.发送模块,用于向用户发送警告信息,所述警告信息包括所述目标数据值所属的第一栏位数据。
97.本技术实施例提供一种文件检测装置,该装置包括第一获取模块、第二获取模块、第一确定模块以及第二确定模块。第一获取模块用于获取待检测文件包括的目标栏位的第一栏位数据以及所述待检测文件的特征属性;第二获取模块用于获取多个历史文件包括的所述目标栏位的第二栏位数据;第一确定模块用于若所述第一栏位数据与所述第二栏位数据的相似度在预设区间内,则将与所述第二栏位数据不相同的第一栏位数据作为目标栏位数据;第二确定模块用于若所述目标栏位数据与所述待检测文件的特征属性匹配,则确定所述待检测文件通过检测。如此,根据历史文件对待检测文件进行检测,若确定待检测文件中存在与历史文件的第二栏位数据不相同的第一栏位数据,则将与第二栏位数据不相同的第一栏位数据与待检测文件的特征属性比较,确定待检测文件是否通过验证,能够提高待检测文件的检测效率。
98.基于上述方法实施例提供的一种文件检测方法,本技术实施例还提供一种文件检测设备,包括:处理器、存储器、系统总线;
99.所述处理器以及所述存储器通过所述系统总线相连;
100.所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述任一项实施例所述的文件检测方法。
101.基于上述方法实施例提供的一种文件检测方法,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储指令,当所述指令在设备上运行时,使得所述设备执行上述任一项实施例所述的文件检测方法。
102.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或
系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
103.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
104.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。