一种数据脱敏方法、系统、可读存储介质及设备与流程

文档序号:32621346发布日期:2022-12-20 22:44阅读:138来源:国知局
一种数据脱敏方法、系统、可读存储介质及设备与流程

1.本发明属于数据处理技术领域,尤其涉及一种数据脱敏方法、系统、可读存储介质及设备。


背景技术:

2.现在很多数据考虑到安全性问题,都需要进行脱敏展示。目前很多系统采用的脱敏方式是,事先先收集好需要脱敏的内容,在统一配置到系统参数中,然后在相应系统中应用该脱敏规则。
3.这样导致脱敏数据没有灵活性,不能根据应用场景动态进行脱敏,也无法根据不同需求,在不同场景中动态设置脱敏规则。


技术实现要素:

4.本发明提供一种数据脱敏方法、系统、可读存储介质及设备,用于解决脱敏数据没有灵活性,不能根据应用场景动态进行脱敏的技术问题。
5.第一方面,本发明提供一种数据脱敏方法,包括:获取目标数据,所述目标数据中包含业务场景;确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应;对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性;若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
6.进一步地,在基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性之后,所述方法还包括:若存在,则直接基于一脱敏引擎对所述目标数据进行脱敏处理。
7.进一步地,所述将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎,包括:查找是否存在与至少一个脱敏词性对应的至少一个脱敏规则;若存在,则将所述至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;若不存在,则响应用户操作对预设的脱敏规则模板进行设置,得到至少一个自定义脱敏规则,并将所述至少一个自定义脱敏规则与至少一个脱敏词性进行对应和自动添加至一脱敏引擎中,使更新一脱敏引擎。
8.进一步地,在基于更新后的一脱敏引擎对所述目标数据进行脱敏处理之后,所述
方法还包括:基于用户对一脱敏引擎中的至少一个脱敏规则进行手动去除,使更新一脱敏引擎。
9.进一步地,所述脱敏词性包括姓名、身份证、地址、银行卡和公司名称中的至少一种。
10.进一步地,所述脱敏规则包括^1*&2、^4*&4和^3*&4中的至少一种,其中,^表示显示开始,^1表示开始一个字符,&表示显示结束,&1表示结束一个字符,*表示使用*替换原有字符。
11.第二方面,本发明提供一种数据脱敏系统,包括:获取模块,配置为获取目标数据,所述目标数据中包含业务场景;查找模块,配置为确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应;检索模块,配置为对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性;更新模块,配置为若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;处理模块,配置为基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
12.第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的数据脱敏方法的步骤。
13.第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行本发明任一实施例的数据脱敏方法的步骤。
14.本技术的数据脱敏方法、系统、可读存储介质及设备,采用动态配置脱敏规则方式,根据系统的需求,动态在系统中直接设置或取消脱敏规则,实现了按需直接选择脱敏数据进行配置脱敏,这样增强了系统的实用性,提高用户的体验效果。
附图说明
15.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1为本发明一实施例提供的一种数据脱敏方法的流程图;图2为本发明一实施例提供的一种数据脱敏系统的结构框图;图3是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
17.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
18.实施例一请参阅图1,其示出了本技术的一种数据脱敏方法的流程图。
19.如图1所述,本发明实现数据脱敏的方法具体包括步骤s101-步骤s104。
20.步骤s101,获取目标数据,所述目标数据中包含业务场景。
21.步骤s102,确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应。
22.在本实施例中,脱敏词性包括姓名、身份证、地址、银行卡和公司名称中的至少一种。脱敏规则包括^1*&2、^4*&4和^3*&4中的至少一种,其中,^表示显示开始,^1表示开始一个字符,&表示显示结束,&1表示结束一个字符,*表示使用*替换原有字符。
23.需要说明的是,将一脱敏词性与一脱敏规则进行对应。例如姓名对应的脱敏规则为^3*&4。
24.步骤s103,对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性。
25.在本实施例中,若存在,则直接基于一脱敏引擎对所述目标数据进行脱敏处理。
26.步骤s104,若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎。
27.在本实施例中,查找是否存在与至少一个脱敏词性对应的至少一个脱敏规则;若存在,则将至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;若不存在,则响应用户操作对预设的脱敏规则模板进行设置,得到至少一个自定义脱敏规则,并将至少一个自定义脱敏规则与至少一个脱敏词性进行对应和自动添加至一脱敏引擎中,使更新一脱敏引擎。
28.需要说明的是,根据实际情况,需要取消一些脱敏规则时,基于用户对一脱敏引擎中的至少一个脱敏规则进行手动去除,使更新一脱敏引擎。
29.步骤s105,基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
30.综上,本发明上述实施例当中的数据脱敏方法,采用动态配置脱敏规则方式,根据系统的需求,动态在系统中直接设置或取消脱敏规则,实现了按需直接选择脱敏数据进行配置脱敏,这样增强了系统的实用性,提高用户的体验效果。
31.实施例二本发明第二实施例也提出一种数据脱敏方法,所述数据脱敏方法通过软件和/或硬件来实现,所述方法具体包括步骤s201-步骤s204。
32.步骤s201,定义一套脱敏引擎服务q。
33.该脱敏引擎服务支持动态设置脱敏规则,包括:脱敏场景a,脱敏规则b,脱敏数据
c,脱敏词性d等。服务引擎首先判断当前业务场景a1是否在脱敏场景a中,若在场景a中,则开始分析脱敏数据c中相关数据的相关词性ds,根据词性一致性原则,在ds中检索与脱敏词性d一致的词性,并获取相关需要脱敏的内容content。根据脱敏规则b,使用正则表达式法将content按照b规则进行整体替换,并形成最终脱敏内容content1,将content1直接使用字符串替换法替换原有未脱敏内容content。
34.步骤s202,将常规通用型的脱敏规则内置到脱敏引擎中,供其他需要的场景中调用。如:姓名脱敏规则:脱敏场景(全部)、脱敏规则(^1*&2)、脱敏词性(姓名)身份证脱敏规则:脱敏场景(全部)、脱敏规则(^4*&4)、脱敏词性(身份证)地址脱敏规则:脱敏场景(全部)、脱敏规则(^3*&4)、脱敏词性(地址)规则释义:^表示显示开始,^1表示开始一个字符,^n表示开始n个字符;^[4-2|5-3]表示总字符为4个,显示开始2个字符,总字符为5个,显示开始3个;^[(1-5)-2]表示总字符为1至5个,显示开始2个字符;&表示显示结束,&1表示结束一个字符,&n表示结束n个字符;&[4-2|5-3]表示总字符为4个,显示结束2个字符,总字符为5个,显示结束3个;&[(1-5)-2]表示总字符为1至5个,显示结束2个字符;*表示使用*替换原有字符;\字符表示使用指定的字符替换原有字符。
[0035]
步骤s203,用户在使用不同系统时,根据实际情况,选择需要脱敏的数据,配置相关脱敏规则后,加入到脱敏引擎中。如:用户在使用病历浏览器时,发现患者的诊断需要进行脱敏,且脱敏引擎中并未内置相关脱敏规则,此时,用户可以在浏览器中选择需要脱敏的数据,然后进行右击,脱敏,此时会弹出对话框,要求用户输入:使用场景(病历浏览器),脱敏规则(a***&),脱敏词性(诊断)等相关信息后,保存数据后,该患者的信息就立即脱敏了。
[0036]
步骤s204,用户根据实际情况,需要取消一些脱敏规则时,则可以选择已经脱敏的数据,然后设置取消脱敏即可,以后该脱敏规则在该场景中时,就不会再应用。
[0037]
实施例三请参阅图2,其示出了本发明的一种数据脱敏系统的结构框图。
[0038]
如图2所示,数据脱敏系统200,包括获取模块210、查找模块220、检索模块230、更新模块240以及处理模块250。
[0039]
其中,获取模块210,配置为获取目标数据,所述目标数据中包含业务场景;查找模块220,配置为确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应;检索模块230,配置为对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性;更新模块240,配置为若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;处理模块250,配置为基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
[0040]
应当理解,图2中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此
不再赘述。
[0041]
实施例四本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行上述任意方法实施例中的数据脱敏方法;作为一种实施方式,本发明的计算机可读存储介质存储有计算机可执行指令,计算机可执行指令设置为:获取目标数据,所述目标数据中包含业务场景;确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应;对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性;若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
[0042]
计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据数据脱敏系统的使用所创建的数据等。此外,计算机可读存储介质可以包括高速随机存取存储器,还可以包括存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至数据脱敏系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0043]
图3是本发明实施例提供的电子设备的结构示意图,如图3所示,该设备包括:一个处理器310以及存储器320。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例数据脱敏方法。输入装置330可接收输入的数字或字符信息,以及产生与数据脱敏系统的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
[0044]
上述电子设备可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
[0045]
作为一种实施方式,上述电子设备应用于数据脱敏系统中,用于客户端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:获取目标数据,所述目标数据中包含业务场景;确定当前目标数据的业务场景所属脱敏场景,并查找与所述脱敏场景相关联的一脱敏引擎,其中,脱敏引擎中包含至少一个脱敏规则,一脱敏规则与一脱敏词性对应;对所述目标数据进行语义理解,得到至少一个待脱敏内容,并基于词性一致性原
则在一脱敏引擎中检索是否存在与所述至少一个待脱敏内容词性一致的至少一个脱敏词性;若不存在,则将所述至少一个脱敏词性对应的至少一个脱敏规则自动添加至一脱敏引擎中,使更新一脱敏引擎;基于更新后的一脱敏引擎对所述目标数据进行脱敏处理。
[0046]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
[0047]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1