一种基于数据染色的隐私保护方法
【技术领域】
[0001] 本发明涉及一种隐私保护方法,具体涉及一种基于数据染色的隐私保护方法。
【背景技术】
[0002] 在云存储服务为用户带来便利的同时,其自身架构的复杂性也给用户数据的隐私 保护和敏感数据的安全性带来极大的挑战与冲击。对于用户来说,当数据被上传到服务器 时,数据的控制权被交给了服务提供商,云服务的外包存储服务模式使得服务商具有非授 权访问用户隐私数据的能力,容易导致数据信息和隐私泄露的内部攻击问题。因此,在保证 用户数据可高效利用的情况下,保证用户数据安全并满足隐私保护需求,成为隐私保护过 程中要解决的重要问题。
[0003] 数据隐私保护的目标是防止云存储服务提供商或非法用户泄露、出卖或传播用户 隐私信息,或者对用户数据进行搜集和分析,挖掘出用户隐私数据。在云存储系统中,用户 的身份信息、用户的数据与应用等均属于私密和敏感信息,需要进行保护与隔离。传统的隐 私保护方法,比较经典的有数据加密方法、数字水印技术、数据混淆及访问控制技术等,但 就这些隐私保护方法而言,还存在一定的局限性,包括传统的数据加密算法和水印算法的 安全性较低,加密后的数据和数字水印容易被破解或者破坏,数据一旦被解密,传统的技术 很难对后续的隐私泄露进行追踪;对大规模的数据加密方法处理效率较低,加密后的密文 管理机制不健全,非法用户仍有机会获取用户隐私数据,从而存在隐私数据的安全威胁并 未得到有效解决。
【发明内容】
[0004] 本发明的目的在于克服上述现有技术的缺点,提供了一种基于数据染色的隐私保 护方法,该方法能够在保证数据可用性的前提下有效的保护用户的隐私数据,操作较为简 单。
[0005] 为达到上述目的,本发明所述的基于数据染色的隐私保护方法包括以下步骤:
[0006] 1)获取数据版权标识信息,采用数据版权标识信息经Hash算法加密得到信息摘 要S,再根据所述信息摘要S得云模型的期望Ex、熵En及超熵He,然后将云模型的期望Ex、 熵En及超熵He作为输入参数输入到前向颜色生成器算法CG中,得N组第一颜色定量值;
[0007] 2)通过步骤1)得到的N组第一颜色定量值对用户的数据集进行染色,然后将染色 的数据上传至云服务器中;
[0008] 3)采用数据染色算法的逆过程从染色的数据集中提取出所述N组第二颜色定量 值U1, X2,…,xN},再将所述N组第二颜色定量值U1, X2,…,xN}输入到逆向颜色生成器算法 中,得提取过程中的期望Ex'、熵En'及超熵He';
[0009] 4)将步骤3)得到的提取过程中的期望Ex'、熵En'及超熵He'、步骤1)得到的 云模型的期望Ex、熵En及超熵He、以及用户预设的相似度阀值σ。作为输入参数输入到前 向颜色生成器算法中,产生N组第三颜色定量值,并将得到的N组第三颜色定量值按大小进 行排序,再筛选出有效范围[Exu-3Enu,Exu+3Enu]和[Ex v-3Env,Exv+3Env]内的第三颜色定量 值,然后在有效范围[Exu-3Enu,Exu+3Enu]和[Ex v-3Env,Exv+3Env]内,计算云模型的期望Ex、 熵En及超熵He与提取过程中的期望E?、熵EY及超熵的相似度,当所述相似度大 于等于用户预设的相似度阀值σ。时,服务器则将染色的数据集授权给用户。
[0010] 信息摘要S的表达式为:
[0011] S = M1M2 …M32 (1)
[0012] 其中,信息摘要的第i位,1彡i彡32。
[0013] 步骤1)中再根据所述信息摘要S得云模型的期望Ex、熵En及超熵He的具体操作 为:将信息摘要S分为子序列Sp &及S 3,再分别计算出子序列Sp &及S 3的浮点型数据, 然后将子序列&及S 3的浮点型数据依次作为云模型的望Ex、熵En和超熵He,其中,
[0014]
[0015] 步骤1)中将云模型的期望Ex、熵En及超熵He作为输入参数输入到前向颜色生成 器算法CG中,得N组第一颜色定量值的具体操作为:
[0016] 将云模型的期望Ex、熵En和超熵He、以及参数N作为输入参数输入到前向 颜色生成器算法中,得以云模型的熵En为期望、超熵He为方差的正态随机数En 1'= NORM (En,He2),并计算以期望Ex为期望、En/为方差的正态随机数X1= NORM (En,En/ 2), 再根据En /得隶属度// = ,然后再根据隶属度# 输出N组第一颜色定量 值。
[0017] 步骤2)的具体操作为:
[0018] 对染色密钥k和数据记录的关键字1进行归一化处理,再以归一化得到的结果作 为Chebyshev混纯序列的初值输入到Chebyshev混纯序列发生器中进行混纯计算,然后根 据混沌计算的结果Cl 1及染色间隔值参数p判断数据集中的数据元组是否能够进行染色,当 该数据元组能够进行染色时,则在数据集中选择属性A,,当所选择的属性A,存在冗余空间 时,则根据数据元组的规模大小和精度确定选择的属性A,能够染色的LSB位数,再通过步 骤1)得到的N组第一颜色定量值替换选择的属性A,的后ε ,位数据,完成数据的染色,然 后再将染色的数据上传至服务器中。
[0019] 判断所选择的属性Α,是否存在冗余空间的具体操作为:
[0020] 预设待判断选择的属性Aj的充许误差c%,则该选择的属性A ^的冗余度e为
[0021]
[0022] 当e彡0,则选择的属性、存在冗余空间。
[0023] 步骤3)中将所述N组第二颜色定量值{Xl,X2,…,x N}输入到逆向颜色生成器算法 中,得提取过程中的期望Ex^、熵EY及超熵的具体操作为:
[0024] 将N组第二颜色定量值{Xl,X2,…,xN}输入到逆向颜色生成器算法中,得均值 1 = 和方差f 刃2,然后计算提取过程中的期望Ex'、熵En'及超 熵He,,其中,[、/ =义,
[0025] 根据混沌计算的结果Cl1及染色间隔值参数p判断数据集中的数据元组是否能够 进行染色的具体操作为:
[0026] a)将混沌计算的结果Cl1与染色间隔值参数p连成一个字符串,所述字符串通过单 向Hash算法转化为32位十六进制序列;
[0027] b)将步骤a)中产生的32位十六进制序列转化为十进制数;
[0028] c)通过步骤b)得到的十进制数除以λ,当步骤b)得到的十进制数除以λ的余 数为零时,则当前数据元组能够进行染色,其中,λ为数据集中数据元组的总数与N的商。
[0029] 本发明具有以下有益效果:
[0030] 本发明所述的基于数据染色的隐私保护方法在操作时,通过云模型的期望ExJS En及超熵He作为输入参数输入到前向颜色生成器算法CG中,得N组第一颜色定量值,然后 通过N组第一颜色定量值对用户的数据进行染色,再将染色的数据上传至服务器中,由于 数据经过染色处理,因此未授权的用户无法确定数据是否可用,并且无法确定获取的信息 价值量的大小,从而在一定程度上保护用户数据的安全性;服务器在对用户进行授权之前, 需要通过逆向颜色生成器计算出提取过程中的Ex'、En'和He',再结合云模型的Ex、En和 He,通过颜色相似度匹配的方法确定数据的可用性程度的高度、以及是否给用户授权,从而 有效的确保用户数据的隐秘性,操作简单,实用性较强。
【附图说明】
[0031] 图1为本发明的原理图;
[0032] 图2为本发明中数据染色的流程图;
[0033] 图3为本发明中隐私数据泄露追踪的流程图;
[0034] 图4为本发明的数据染色检测过程图;
[0035] 图5为验证性试验中本发明与k_匿名方法处