一种数据脱敏方法、数据脱敏装置及可读存储介质与流程

文档序号:19251853发布日期:2019-11-27 20:21阅读:231来源:国知局
一种数据脱敏方法、数据脱敏装置及可读存储介质与流程

本申请涉及数据处理技术领域,尤其是涉及一种数据脱敏方法、数据脱敏装置及可读存储介质。



背景技术:

随着计算机技术的飞速发展,大数据技术也应运而生,在大数据时代,数据共享的背景下,对于个人信息等敏感数据的安全性的保证也是研究的重要方向之一,对于个人信息等敏感数据的安全保证采取的措施是根据法定规则对个人信息等敏感数据进行加密,以此进行数据的脱敏操作。

现有的数据脱敏方式都是以统一的数据加密策略进行加密,并且在脱敏的时候,根据不同类型数据对敏感数据隐藏的要求的不同,企业需要针对不同的数据选取不同的脱敏系统进行脱敏,并且每一个脱敏系统只能针对同一类型的敏感数据进行脱敏,导致脱敏流程十分繁琐,脱敏效果达不到客户预期,不能很好的隐藏用户的信息且脱敏后的数据无法根据预设条件进行识别,脱敏的安全性和实用性得不到保证。



技术实现要素:

有鉴于此,本申请的目的在于提供一种数据脱敏方法、数据脱敏装置及可读存储介质,对接用户的数据库,自动识别目标脱敏数据中每一个目标脱敏字段所属的敏感数据类型,结合用户的选择操作确定每一个目标脱敏字段对应的目标脱敏算法,并利用目标脱敏算法对目标脱敏数据进行脱敏,这样,对于同一目标脱敏数据,可以通过数据识别来推荐脱敏方式,并结合用户对敏感数据的脱敏需求,通过多种脱敏算法同时对目标脱敏数据进行多种类型敏感数据的脱敏操作,有助于提高敏感数据的脱敏效率,提高处理时间的利用率,保证脱敏数据和实际脱敏需求的匹配度。

本申请实施例提供了一种数据脱敏方法,应用于设置有多种脱敏算法的脱敏装置,所述数据脱敏方法包括:

识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;

基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;

基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;

使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

进一步的,所述识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型,包括:

获取每种敏感数据的敏感数据组成格式和敏感数据长度;

遍历所述目标脱敏数据中的每一个字段,确定每一个字段的字段数据组成格式以及字段数据长度;

确定所述每一个字段中字段数据组成格式与所述敏感数据组成格式相同,且字段数据长度与所述敏感数据长度相同的字段为目标脱敏字段,并根据所述敏感数据组成格式与所述敏感数据长度,确定目标脱敏字段的至少一个敏感数据类型。

进一步的,所述基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法,包括:

基于接收到的用户的选择操作,确定所述至少一个目标脱敏字段中被所述用户选择的部分目标脱敏字段,以及被所述用户选择的该部分脱敏字段中每个脱敏字段的相似脱敏算法;

确定该部分脱敏字段中每个脱敏字段的相似脱敏算法为该部分脱敏字段中每个脱敏字段的目标脱敏算法;

确定所述至少一个目标脱敏字段中除所述部分脱敏字段之外的其他目标脱敏字段,并确定所述其他目标脱敏字段中每个目标脱敏字段的优选脱敏算法为所述其他目标脱敏字段中每个目标脱敏字段的目标脱敏算法。

进一步的,在所述使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置之后,所述数据脱敏方法还包括:

检测存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏存储位置是否为同一个存储位置;

若所述数据存储位置与所述脱敏存储位置为同一个存储位置,清除所述目标脱敏数据,并保存与所述目标脱敏数据对应的脱敏数据至所述数据存储位置。

进一步的,在所述使用所述目标脱敏算法对待处理算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置之后,所述数据脱敏方法还包括:

检测所述用户的数据库中的数据中除所述目标脱敏数据之外的其他数据中是否存在不符合数据存储标准的异常数据,以及所述其他数据中是否存在不符合敏感数据规则的敏感数据;

若所述其他数据中存在不符合数据存储标准的异常数据和/或所述其他数据中存在不符合敏感数据规则的敏感数据,生成预警信息,提示用户。

本申请实施例还提供了一种数据脱敏装置,所述数据脱敏装置中设置有多种脱敏算法,所述数据脱敏装置包括:

第一处理模块,用于识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;

第一确定模块,用于基于所述第一处理模块确定的每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;

第二确定模块,用于基于接收到的用户的选择操作,从所述第一确定模块确定的每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;

第二处理模块,用于使用所述第二确定模块确定的目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

进一步的,所述第一处理模块包括:

第一获取单元,用于获取每种敏感数据的敏感数据组成格式和敏感数据长度;

第一确定单元,用于遍历所述第一获取单元获取的目标脱敏数据中的每一个字段,确定每一个字段的字段数据组成格式以及字段数据长度;

第二确定单元,用于确定所述第一确定单元确定的每一字段中字段数据组成格式与所述敏感数据组成格式相同,且字段数据长度与所述敏感数据长度相同的字段为目标脱敏字段,并根据所述敏感数据组成格式与所述敏感数据长度,确定目标脱敏字段的至少一个敏感数据类型。

进一步的,所述第二确定模块包括:

第三确定单元,用于基于接收到的用户的选择操作,确定所述至少一个目标脱敏字段中被所述用户选择的部分目标脱敏字段,以及被所述用户选择的该部分脱敏字段中每个脱敏字段的相似脱敏算法;

第四确定单元,用于确定所述第三确定单元确定的该部分脱敏字段中每个脱敏字段的相似脱敏算法为该部分脱敏字段中每个脱敏字段的目标脱敏算法;

第五确定单元,用于确定所述至少一个目标脱敏字段中除所述部分脱敏字段之外的其他目标脱敏字段,并确定所述其他目标脱敏字段中每个目标脱敏字段的优选脱敏算法为所述其他目标脱敏字段中每个目标脱敏字段的目标脱敏算法。

进一步的,所述数据脱敏装置还包括:

第一检测模块,用于检测存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏存储位置是否为同一个存储位置;

第三处理模块,用于若所述第一检测模块检测到所述数据存储位置与所述脱敏存储位置为同一个存储位置,清除所述目标脱敏数据,并保存与所述目标脱敏数据对应的脱敏数据至所述数据存储位置。

进一步的,所述数据脱敏装置还包括:

第二检测模块,用于检测所述用户的数据库中的数据中除所述目标脱敏数据之外的其他数据中是否存在不符合数据存储标准的异常数据,以及所述其他数据中是否存在不符合敏感数据规则的敏感数据;

第四处理模块,用于若所述第二检测模块检测到所述其他数据中存在不符合数据存储标准的异常数据和/或所述其他数据中存在不符合敏感数据规则的敏感数据,生成预警信息,提示用户。

本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的数据脱敏方法的步骤。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的数据脱敏方法的步骤。

本申请实施例提供的数据脱敏方法、数据脱敏装置及可读存储介质,可以对接用户的数据库,识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

这样,对接用户的数据库,识别获取到的目标脱敏数据中的目标脱敏字段,并根据每一个目标脱敏字段所属的敏感数据类型,确定每一个目标脱敏字段对应的优选脱敏算法以及与每个优选脱敏算法对应的至少一个相似脱敏算法,根据用户的选择操作选取每个目标脱敏数据的目标脱敏算法,利用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置,对于同一目标脱敏数据,可以通过数据识别来推荐脱敏方式,并结合用户对敏感数据的脱敏需求,通过多种脱敏算法同时对目标脱敏数据进行多种类型敏感数据的脱敏操作,有助于提高敏感数据的脱敏效率,提高处理时间的利用率,保证脱敏数据和实际脱敏需求的匹配度。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为一种可能的应用场景下的系统结构图;

图2为本申请实施例所提供的一种数据脱敏方法的流程图;

图3为本申请另一实施例提供的数据脱敏方法的流程图;

图4示出了本申请实施例所提供的一种数据脱敏装置的结构示意图之一;

图5示出了本申请实施例所提供的一种数据脱敏装置的结构示意图之二;

图6为图4中所示的第一处理模块的结构示意图;

图7为图4中所示的第二确定模块的结构示意图;

图8为本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。

首先,对本申请可适用的应用场景进行介绍。本申请可应用于数据处理技术领域。请参阅图1,图1为一种在该应用场景下的系统结构图。如图1中所示,所述系统包括数据库和数据脱敏装置,所述数据库存储大量用户的数据,其中所述数据包括正常数据和目标脱敏数据,所述数据脱敏装置从所述数据库中获取目标脱敏数据,并确定所述目标脱敏数据中每一个目标脱敏字段所属的敏感数据类型,针对每一个目标脱敏字段所属的敏感数据类型以及用户的操作,确定每一个目标脱敏字段对应的目标脱敏算法,利用目标脱敏算法对所述目标脱敏数据进行脱敏,生成脱敏数据,并将所述目标脱敏数据存储到对应的脱敏存储位置。

经研究发现,现有的数据脱敏方式都是以统一的数据加密策略进行加密,并且在脱敏的时候,根据不同类型数据对敏感数据隐藏的要求的不同,企业需要针对不同的数据选取不同的脱敏系统进行脱敏,并且每一个脱敏系统只能针对同一类型的敏感数据进行脱敏,导致脱敏流程十分繁琐,脱敏效果达不到客户预期,不能很好的隐藏用户的信息且脱敏后的数据无法根据预设进行识别,脱敏的安全性和实用性得不到保证。

基于此,本申请的目的在于提供一种数据脱敏方法、数据脱敏装置及可读存储介质,对接用户的数据库,识别获取到的目标脱敏数据中的目标脱敏字段,并根据每一个目标脱敏字段所属的敏感数据类型,确定每一个目标脱敏字段对应的优选脱敏算法以及与每个优选脱敏算法对应的至少一个相似脱敏算法,根据用户的选择操作选取每个目标脱敏数据的目标脱敏算法,利用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置,这样,对于同一目标脱敏数据,可以通过数据识别来推荐脱敏方式,并结合用户对敏感数据的脱敏需求,通过多种脱敏算法同时对目标脱敏数据进行多种类型敏感数据的脱敏操作,有助于提高敏感数据的脱敏效率,提高处理时间的利用率,保证脱敏数据和实际脱敏需求的匹配度。

请参阅图2,图2为本申请实施例所提供的一种数据脱敏方法的流程图。如图2中所示,本申请实施例提供的数据脱敏方法,应用于设置有多种脱敏算法的脱敏装置,所述数据脱敏方法包括:

步骤201、识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型。

该步骤中,从用户的数据库中获取目标脱敏数据,并且识别在所述目标脱敏数据中的至少一个脱敏字段,并且确定每一个目标脱敏字段所属的敏感数据类型。

其中,脱敏装置可以对接多种兼容处理各种企业数据源和数据机构,即所述脱敏装置可以对接多种类型的数据库,数据类型可以包括sqlserver数据库以及oracle数据库等。

这里,在所述脱敏装置中内置ai自动识别模块,可以自动识别数据中的至少一个目标脱敏字段,并对每一个目标脱敏字段分类、统计,确定每一个目标脱敏字段的敏感数据类型。

其中,所述敏感数据类型指示了数据脱敏的方向,比如个人信息中的个人身份信息、网络身份标识信息、个人上网记录等是几个不同类型的敏感数据。

步骤202、基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法。

该步骤中,在步骤201确定每一个目标脱敏字段所述的敏感数据类型之后,根据所述敏感数据类型,从脱敏装置存储的脱敏算法中找到每一中敏感数据类型对应的多种脱敏算法,并根据脱敏装置中自定义的规则确定出脱敏装置侧的优选脱敏算法,除所述优选脱敏算法之外的其他算法也可对对应的敏感数据类型进行脱敏的,也为对应的敏感数据类型的备选脱敏算法。

其中,对于一种敏感类型的敏感数据的对应的脱敏算法不止一种,以所述敏感数据是手机号为例,对于一个手机号来说,根据不同脱敏程度的要求,就会有不同的脱敏算法,对于登录名是手机号的情况,脱敏算法可以选择遮蔽算法,此种算法参数是脱敏地区编号/脱敏用户号码,对于外包或者第三方服务商需要数据时或者测试开发环境需要保持字段间关系时,可采用假名算法,即随机生成符合手机号编码规则的新手机号,保证业务的正常进行。

这里,脱敏装置认为的优选算法是可以由用户或者系统开发人员根据相关法律法规指定的,可以是脱敏程度最高的算法,也可以是算法最简单的脱敏算法。

步骤203、基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法。

该步骤中,根据用户对于脱敏装置中脱敏算法的选择,从每一个敏感数据对应的优选算法以及和该优选算法对应的相似脱敏算法中选择出一个算法作为对应的目标脱敏字段的目标脱敏算法。

这里,脱敏装置根据每一个敏感数据类型选择的算法都会显示给用户,用户可以根据自己对于数据的特殊要求选择更适合自己生产的脱敏算法,可以针对脱敏装置的推荐进行选择,根据用户的选择,确定每一个目标脱敏字段的目标脱敏算法。

步骤204、使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

该步骤中,使用步骤203选定的每一个目标脱敏字段对应的目标脱敏算法对该脱敏字段进行脱敏,应用目标脱敏算法对目标脱敏数据的每一个目标脱敏字段进行脱敏,生成脱敏数据,并将所述目标脱敏数据存储到对应的脱敏存储位置。

这里,所述脱敏存储位置可以是原目标脱敏数据的存储位置,也可以是新开辟的存储空间。

本申请实施例提供的数据脱敏方法,识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

这样,对接用户的数据库,识别获取到的目标脱敏数据中的目标脱敏字段,并根据每一个目标脱敏字段所属的敏感数据类型,确定每一个目标脱敏字段对应的优选脱敏算法以及与每个优选脱敏算法对应的至少一个相似脱敏算法,根据用户的选择操作选取每个目标脱敏数据的目标脱敏算法,利用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置,对于同一目标脱敏数据,可以通过数据识别来推荐脱敏方式,并结合用户对敏感数据的脱敏需求,通过多种脱敏算法同时对目标脱敏数据进行多种类型敏感数据的脱敏操作,有助于提高敏感数据的脱敏效率,提高处理时间的利用率,保证脱敏数据和实际脱敏需求的匹配度。

请参阅图3,图3为本申请另一实施例提供的数据脱敏方法的流程图。如图3中所示,本申请实施例提供的数据脱敏方法,应用于设置有多种脱敏算法的脱敏装置,所述数据脱敏方法包括:

步骤301、识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型。

步骤302、基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法。

步骤303、基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法。

步骤304、使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

步骤305、检测所述用户的数据库中的数据中除所述目标脱敏数据之外的其他数据中是否存在不符合数据存储标准的异常数据,以及所述其他数据中是否存在不符合敏感数据规则的敏感数据。

该步骤中,按照预设的时间间隔检测用户中的数据中除了已经被识别的目标脱敏数据之外的其他数据是否存在不符合数据存储标准的异常数据,以及应该进行脱敏但没有进行脱敏的数据,也即不符合敏感规则的数据。

其中,预设的时间间隔可以是用户设置的,也可以是脱敏装置自动设置的时间间隔,时间间隔可以很小,比如一小时或是半天这种时间间隔,或是数据库数据更新的时间间隔。

这里,以数据是手机号码为例,如果数据库中的手机号只有10位,这就是不符合手机号码数据存储标准的其中一种情况;对于手机号来说,是需要进行脱敏的敏感数据,如果在数据库中手机号完全是十一位的正确排列组合的数字,那么这种数据就是不符合敏感数据规则的敏感数据。

步骤306、若所述其他数据中存在不符合数据存储标准的异常数据和/或所述其他数据中存在不符合敏感数据规则的敏感数据,生成预警信息,提示用户。

该步骤中,如果检测到所述其他数据中存在不符合数据存储标准的异常数据或是所述其他数据中存在不符合敏感数据规则的敏感数据中的一种情况,生成预警信息,以此提示用户。

其中,所述与预警信息可以包括在数据库的哪个位置(哪个字段),数据出现的问题(不符合数据存储标准或是未脱敏数据)。

这里,生成的预警信息可以是显示在脱敏装置中提示用户,也可以通过蜂鸣器或是语音模块提示用户注意。

其中,步骤301至步骤304的描述可以参照步骤201至步骤204的描述,并且能达到相同的技术效果,对此不做赘述。

进一步的,步骤301包括:

获取每种敏感数据的敏感数据的敏感数据组成格式和敏感数据长度;遍历所述脱敏数据中的每一个字段,确定每一个字段的字段数据组成格式以及字段数据长度;确定所述每一个字段数据组成格式与所述敏感数据组成格式相同,且字段数据长度与所述敏感数据长度相同的字段为目标脱敏字段,并根据所述敏感数据组成格式与所述敏感数据长度确定目标脱敏字段的至少一个敏感数据类型。

该步骤中,获取法律法规中规定的每一种敏感数据的敏感数据组成格式以及敏感数据长度,遍历目标脱敏数据中每一个字段,确定每一个字段的字段数据组成格式以及该字段数据长度,将每个字段的字段数据组成格式以及字段数据长度和法律法规中规定的敏感数据组成格式以及敏感数据长度比较,找到数据组成长度和数据组成格式与法律规中的相同的数据,确定该字段存在敏感数据,该字段位目标脱敏字段,并且根据与所述字段数据组成格式以及该字段数据长度相同的敏感数据组成格式以及敏感数据长度所属的敏感数据类型确定对应目标脱敏字段的所属的敏感数据类型。

以《个人信息安全规范》要求为例,在《个人信息安全规范》中,分为很多大类,比如,个人基本资料包括“个人姓名”、“性别”等;个人身份信息包括“身份证”、“工作证”等;网络身份标识信息包括“系统账号”、“ip地址”、“登录密码”等;个人生物识别信息包括“个人基因”、“指纹”等;个人健康信息生理信息包括个人因生病医治等产生的相关记录,如病症、检验报告等;个人教育工作信息包括“个人职业”、“学历”等;个人财产信息包括“银行账号”、“存款信息”、“虚拟货币”等;个人通讯信息包括“通信记录和内容”、“短信”等;联系人信息包括“通讯录”、“电子邮件地址列表”等;个人上网记录指通过日志存储的用户操作记录,包括“网站浏览记录”、“软件使用记录”等;个人常用设备信息指包括硬件序列号、设备mac地址、软件列表、唯一设备识别码等在内的描述个人常用设备基本情况的信息;个人位置信息包括行踪轨迹、精准定位信息、住宿信息、经纬度等;其他信息包括“婚史”、“宗教信仰”等。

在目标脱敏数据中的其中一个字段,该字段的字段数据长度为十一位,并且在组成格式上前三位为号段,接着四位为地区编号,最后四位为用户号码,与法律法规规定的手机号的组成规则和数据长度一致,所以该字段存在敏感数据,属于目标脱敏字段,并且根据组成规则和数据长度,确定该字段属于手机号属于的个人基本资料类型。

进一步的,步骤303包括:基于接收到的用户的选择操作,确定所述至少一个目标脱敏字段中被所述用户选择的部分目标脱敏字段,以及被所述用户选择的该部分脱敏字段中每个脱敏字段的相似脱敏算法;确定该部分脱敏字段中每个脱敏字段的相似脱敏算法为该部分脱敏字段中每个脱敏字段的目标脱敏算法;确定所述至少一个目标脱敏字段中除所述部分脱敏字段之外的其他目标脱敏字段,并确定所述其他目标脱敏字段中每个目标脱敏字段的优选脱敏算法为所述其他目标脱敏字段中每个目标脱敏字段的目标脱敏算法。

该步骤中,在步骤302之后,脱敏装置会根据内置的算法选出每一个目标脱敏字段的对应的优选算法,并将每一个目标脱敏字段对应的优选算法以及每一个目标脱敏字段对应的其他相似脱敏算法呈现给用户,用户会根据自己实际对于数据的脱敏程度的需求,选择合适的脱敏算法,如果用户对于脱敏装置选择的某一目标脱敏字段对应的优选算法是认可的额,那么用户将不对该目标脱敏字段,脱敏装置将该目标脱敏字段的优选算法确定为该目标脱敏字段的目标脱敏算法;如果脱敏装置选择的某一目标脱敏字段对应的优选算法不符合用户对于该脱敏字段的脱敏需求,用户可以针对该目标脱敏字段在除优选算法之外的相似脱敏算法中选择更符合自己脱敏需求的相似脱敏算法,脱敏装置将该目标脱敏字段的用户选择的相似脱敏算法确定该目标脱敏字段的目标脱敏算法。

进一步的,在步骤304使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置之后,所述数据脱敏方法还包括:检测存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏存储位置是否为同一个存储位置;若所述数据存储位置与所述脱敏存储位置为同一个存储位置,清除所述目标脱敏数据,并保存与所述目标脱敏数据对应的脱敏数据至所述数据存储位置。

该步骤中,在针对脱敏数据进行脱敏之后的脱敏数据需要存储到对应的脱敏存储位置处,检测存储目标脱敏数据的数据存储位置和即将要存储脱敏数据的脱敏存储位置处是否为同一个存储位置,如果所述数据存储位置与所述脱敏存储位置为同一个存储位置,将原目标脱敏数据进行清除,在对应的位置存储脱敏数据,执行覆盖存储;如果所述数据存储位置与所述脱敏存储位置不为同一存储位置,需要将现有的存储目标脱敏数据的数据存储位置与脱敏存储位置进行关联,以便后续针对目标脱敏数据查找脱敏之后对应的脱敏数据。

以所述目标脱敏数据为一张包含很多段数据的数据表为例,当所述存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏位置为同一存储位置时,脱敏后的数据覆盖存储在所述数据表中对应的位置,即假如某一目标脱敏数据在没有进行脱敏之前存储在该数据表的第一行第一列,那么该目标脱敏数据脱完敏之后的脱敏数据也应该存储在该数据表之后的第一行第一列;但当所述存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏位置不为同一位置时,脱敏后的数据在新开辟的脱敏位置上进行存储,并在存储之后要和原目标脱敏数据进行数据之间的关联,即假如某一目标脱敏数据在数据表中的位置为该数据表的第一行第一列,在脱敏之后的该目标脱敏数据对应的脱敏数据在新的数据表的第二行第二列,需要在脱敏并存储完数据之后对目标脱敏数据以及脱敏数据的位置进行关联,即将目标脱敏数据的数据表的第一行第一列与脱敏数据的数据表的第二行第二列进行关联,当脱敏之后,需要对数据进行复盘的时候,找到原目标脱敏数据后,根据数据的关联可以快速便捷地找到脱敏之后的数据。

本申请实施例提供的数据脱敏方法,识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置;检测所述用户的数据库中的数据库中的数据中除所述目标脱敏数据之外的其他数据中是否存在不符合数据存储标准的异常数据,以及所述其他数据中是否存在不符合敏感数据规则的敏感数据;若所述其他数据中存在不符合数据存储标准的异常数据和/或所述其他数据中存在不符合敏感数据规则的敏感数据,生成预警信息,提示用户。

这样,对接用户的数据库,识别获取到的目标脱敏数据中的目标脱敏字段,并确定每一个目标脱敏字段所属的敏感数据类型,并根据用户的选择操作和脱敏装置的内置算法选出每一个目标脱敏字段对应的目标脱敏算法,并利用目标脱敏算法对目标脱敏数据进行脱敏,将生成的脱敏数据存储到脱敏存储位置,并在检测到用户数据库中除目标脱敏数据之外的其他数据中存在不符合数据存储标准的异常数据和/或除目标脱敏数据之外的其他数据中存在不符合敏感数据规则的敏感数据时,生成预警信息,提示用户,可以及时提醒用户数据库中数据的异常,从而避免了用户的敏感数据的意外泄露。

请参阅图4至图7,图4为本申请实施例所提供的一种数据脱敏装置的结构示意图之一,图5示出了本申请实施例所提供的一种数据脱敏装置的结构示意图之二;图6为图4中所示的第一处理模块的结构示意图;图7为图4中所示的第二确定模块的结构示意图。如图4中所示,所述数据脱敏装置400包括:

第一处理模块410,用于识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型。

第一确定模块420,用于基于所述第一处理模块410确定的每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及每个优选脱敏算法对应的至少一个相似脱敏算法。

第二确定模块430,用于基于接收到的用户的选择操作,从所述第一确定模块420确定的每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法。

第二处理模块440,用于使用所述第二确定模块430确定的目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

进一步的,如图5所示,所述数据脱敏装置400还包括:

第一检测模块450,用于检测存储目标脱敏数据的数据存储位置与存储脱敏数据的脱敏存储位置是否为同一个存储位置。

第三处理模块460,用于若所述第一检测模块450检测到所述数据存储位置与所述脱敏存储位置为同一个存储位置,清除所述目标脱敏数据,并保存与所述目标脱敏数据对应的脱敏数据至所述数据存储位置。

进一步的,所述数据脱敏装置400还包括:

第二检测模块,用于检测所述用户的数据库中的数据中除所述目标脱敏数据之外的其他数据中是否存在不符合数据存储标准的异常数据,以及所述其他数据中是否存在不符合敏感数据规则的敏感数据;

第四处理模块,用于若所述第二检测模块检测到所述其他数据中存在不符合数据存储标准的异常数据和/或所述其他数据中存在不符合敏感数据规则的敏感数据,生成预警信息,提示用户。

进一步的,如图6所示,所述第一处理模块410包括:

第一获取单元411,用于获取每种敏感数据的敏感数据组成格式和敏感数据长度。

第一确定单元412,用于遍历所述待第一获取单元411获取的脱敏数据中的每一个字段,确定每一个字段的字段数据组成格式以及字段数据长度。

第二确定单元413,用于确定所述所述第一确定单元412确定的每一字段中字段数据组成格式与所述敏感数据组成格式相同,且字段数据长度与所述敏感数据长度相同的字段为目标脱敏字段,并根据所述敏感数据组成格式与所述敏感数据长度确定,目标脱敏字段的至少一个敏感数据类型。

进一步的,如图7所示,所述第二确定模块430包括:

第三确定单元431,用于基于接收到的用户的选择操作,确定所述至少一个目标脱敏字段中被所述用户选择的部分目标脱敏字段,以及被所述用户选择的该部分脱敏字段中每个脱敏字段的相似脱敏算法。

第四确定单元432,用于确定所述第三确定单元431确定的该部分脱敏字段中每个脱敏字段的相似脱敏算法为该部分脱敏字段中每个脱敏字段的目标脱敏算法。

第五确定单元433,用于确定所述至少一个目标脱敏字段中除所述部分脱敏字段之外的其他目标脱敏字段,并确定所述其他目标脱敏字段中每个目标脱敏字段的优选脱敏算法为所述其他目标脱敏字段中每个目标脱敏字段的目标脱敏算法。

本申请实施例提供的数据脱敏装置,识别从用户的数据库中获取到的目标脱敏数据中的至少一个目标脱敏字段,并确定每个目标脱敏字段所属的敏感数据类型;基于每个目标脱敏字段所属的敏感数据类型,从所述多种脱敏算法中确定所述目标脱敏数据对应的至少一个优选脱敏算法,以及与每个优选脱敏算法对应的至少一个相似脱敏算法;基于接收到的用户的选择操作,从每个优选脱敏算法以及与每个脱敏算法对应的至少一个相似脱敏算法中,确定对每个目标脱敏字段进行脱敏处理的目标脱敏算法;使用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置。

这样,对接用户数据库,识别获取到的目标脱敏数据中的目标脱敏字段,并根据每一个目标脱敏字段所属的敏感数据类型,确定每一个目标脱敏字段对应的优选脱敏算法以及与每个优选脱敏算法对应的至少一个相似脱敏算法,根据用户的选择操作选取每个目标脱敏数据的目标脱敏算法,利用所述目标脱敏算法对目标脱敏数据进行脱敏,并将脱敏后的脱敏数据存储至对应的脱敏存储位置,对于同一目标脱敏数据,可以通过数据识别来推荐脱敏方式,并结合用户对敏感数据的脱敏需求,通过多种脱敏算法同时对目标脱敏数据进行多种类型敏感数据的脱敏操作,有助于提高敏感数据的脱敏效率,提高处理时间的利用率,保证脱敏数据和实际脱敏需求的匹配度。

请参阅图8,图8为本申请实施例所提供的一种电子设备的结构示意图。如图8中所示,所述电子设备800包括处理器810、存储器820和总线830。

所述存储器820存储有所述处理器810可执行的机器可读指令,当电子设备800运行时,所述处理器810与所述存储器820之间通过总线830通信,所述机器可读指令被所述处理器810执行时,可以执行如上述图2以及图3所示方法实施例中的数据脱敏方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的数据脱敏方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1