一种保护敏感资源描述框架数据的方法、装置及系统的制作方法

文档序号:6484210阅读:232来源:国知局
专利名称:一种保护敏感资源描述框架数据的方法、装置及系统的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及一种保护敏感资源描述框架(RDF,Resource Description Framework)数据的方法、装置及系统。
背景技术
资源描述框架(RDF, Resource Description Framework)是一种数据表示格 式,通过主语(subject)、谓语(predicate)、宾语(object)三部分来表示一个描述声明 (statement),一般表示为主语,谓语,宾语三部分组成的一个三元组形式。RDF是对主语对 应资源进行描述的一种手段,它是语义网技术的基础。语义推理的一般机制就是通过不同 RDF三元组之间的关系,推理出新的RDF三元组,从而获得新的信息知识。随着语义网技术的兴起,RDF应用日益广泛,对RDF数据的安全保护成为一个重要 问题,对其进行研究具有重要的理论价值与实际应用价值。现有技术对RDF数据库中敏感信息进行保护的方案为对于RDF数据源中表示隐 私敏感信息的RDF三元组,通过将它们标注为敏感信息,然后由访问控制单元对它们实施 访问控制,或者是完全屏蔽,以限制数据访问用户对它们的自由访问。发明人在实现本发明过程中发现,现有技术至少存在如下缺点如果数据访问者获取了足够多的非敏感信息,并通过RDF三元组之间的wwq推理 关系,通过推理手段推理出某些敏感RDF三元组,将造成敏感信息的泄露。

发明内容
本发明实施例提供一种保护敏感资源描述框架RDF数据的方法、装置及系统,阻 断了对敏感RDF三元组的推理生成路径,有效实现了对敏感RDF三元组的全面保护,安全可
靠性高。本发明实施例是通过以下技术方案实现的本发明实施例提供一种保护敏感资源描述框架RDF数据的方法,包括将源RDF数据集中的敏感RDF三元组标记为敏感数据;计算源RDF数据集中非敏感RDF三元组的闭包集合,记录每个生成的结果三元组 的推理生成路径;基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径进行计 算,获得间接敏感RDF三元组集合;所述间接敏感RDF三元组集合包括任意敏感RDF三元组 生成路径中的至少一个RDF三元组;在源RDF数据集中将所述间接敏感RDF三元组集合中的RDF三元组标记为间接敏 感数据;对所述敏感数据及间接敏感数据进行安全保护。本发明实施例提供一种间接敏感RDF三元组集合计算装置,包括闭包计算单元,用于计算源RDF数据集中的非敏感RDF三元组的闭包集合;
存储单元,用于存储闭包计算过程生成的结果三元组的推理生成路径和闭包集 合;间接敏感RDF三元组集合计算单元,用于基于闭包计算过程生成的所有结果三元 组为敏感RDF三元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三元组 集合;所述间接敏感RDF三元组集合包括任意敏感RDF三元组生成路径中的至少一个RDF
三元组。本发明实施例提供一种保护敏感资源描述框架RDF数据的系统,包括数据库、间 接敏感RDF三元组集合计算装置及访问控制装置;所述数据库,用于存储源RDF数据集;所述间接敏感RDF三元组集合计算装置,用于计算所述源RDF数据集中的间接敏 感RDF三元组集合;所述访问控制装置,用于将源RDF数据集中的敏感RDF三元组标记为敏感数据,以 及将属于所述间接敏感RDF三元组集合中的非敏感RDF三元组标记为间接敏感数据,并对 所述敏感数据及间接敏感数据实施访问控制。由上述本发明实施例提供的技术方案可以看出,本发明实施例可以计算出源RDF 数据集中的间接敏感RDF三元组,在对敏感RDF三元组进行安全保护的同时,可以对能够推 理出所述敏感RDF三元组的间接敏感RDF三元组进行安全保护,因此阻断了对敏感RDF三 元组的推理生成路径,有效实现了对敏感RDF三元组的全面保护,提高了通过RDF方式存储 数据信息的隐私安全性。


图1为本发明实施例间接敏感RDF三元组集合计算装置结构示意图;图2为图1所示装置的闭包计算单元结构示意图;图3为本发明实施例保护敏感RDF数据的系统结构示意图;图4为本发明一个实施例保护敏感RDF数据的方法流程图;图5为本发明实施例闭包计算流程图;图6为本发明保护敏感RDF数据的方法具体实例RDF数据图;图7为本发明保护敏感RDF数据的方法具体实例流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。本发明实施例提供一种间接敏感RDF三元组集合计算装置,以图1中所示为例,包 括闭包计算单元100,用于计算源RDF数据集中的非敏感RDF三元组的闭包集合;存储单元101,用于存储闭包计算过程生成的结果三元组的推理生成路径和闭包 集合;
5
间接敏感RDF三元组集合计算单元102,用于基于闭包计算过程生成的所有结果 三元组为敏感RDF三元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三 元组集合;所述间接敏感RDF三元组集合包括任意敏感RDF三元组生成路径中的至少一个 RDF三元组。所述间接敏感RDF三元组集合计算装置还可以包括替代单元103,用于在推理生成路径中包含不是源RDF数据集中的非敏感新RDF三 元组情况下,用该非敏感新RDF三元组对应的非敏感新RDF三元组生成路径替代所述非敏 感新RDF三元组,得到统一由源RDF数据集中的非敏感初始RDF三元组组成的推理生成路 径;扩展单元104,用于在敏感RDF三元组生成路径中的某个非敏感初始RDF三元组具 有可被其他非敏感初始RDF三元组推理得到的推理生成路径情况下,扩展敏感RDF三元组 推理生成路径,即用每一条所述非敏感初始RDF三元组的推理生成路径替代所述敏感RDF 三元组推理生成路径中的所述非敏感初始RDF三元组,获得新的敏感RDF三元组推理生成 路径。所述间接敏感RDF三元组集合计算装置还可以包括接口模块105,用于负责所述装置对外数据交互。本发明实施例所述间接敏感RDF三元组集合计算装置能够实现计算非敏感RDF三 元组的闭包集合,从而进一步获得间接敏感RDF三元组集合,为对敏感RDF三元组的全面保 护提供便利。如图2所示,闭包计算单元200可以进一步包括存储子单元2001,用于存储推理规则以及规则前提;推理子单元2002,用于以非敏感RDF三元组作为规则前提,依据推理规则推理得 到结果三元组,所述作为规则前提的非敏感RDF三元组包括源RDF数据集中的非敏感初始 RDF三元组和属于非敏感新RDF三元组的结果三元组;记录子单元2003,用于将每个结果三元组的符合某条推理规则的完整前提条件的 一组前提三元组作为所述结果三元组的推理生成路径记录到所述存储单元。本发明实施例所述闭包计算单元能够基于源RDF数据集中非敏感RDF三元组推理 生成敏感RDF三元组,并记录推理生成的敏感RDF三元组对应的生成路径,为阻断敏感RDF 三元组的推理生成路径提供便利。本发明实施例提供一种保护敏感资源描述框架RDF数据的系统,以图3中所示为 例,该系统包括数据库300、上面实施例所述的间接敏感RDF三元组集合计算装置301及 访问控制装置302 ;所述数据库300,用于存储源RDF数据集;所述间接敏感RDF三元组集合计算装置301,用于计算所述源RDF数据集中的间接 敏感RDF三元组集合;所述访问控制装置302,用于将源RDF数据集中的敏感RDF三元组标记为敏感数 据,以及将属于所述间接敏感RDF三元组集合中的非敏感RDF三元组标记为间接敏感数据, 并对所述敏感数据及间接敏感数据实施访问控制。所述系统还包括
6
敏感RDF数据集303,与所述访问控制装置302相连,用于存储所有敏感RDF三元组。本发明实施例实现了计算非敏感RDF三元组的闭包集合,从而进一步获得间接敏 感RDF三元组集合,使得对敏感RDF三元组进行安全保护的同时,对能够推理出所述敏感 RDF三元组的间接敏感RDF三元组进行安全保护,因此阻断了对敏感RDF三元组的推理生成 路径,有效实现了对敏感RDF三元组的全面保护,提高了通过RDF方式存储数据信息的隐私 安全性。本发明实施例提供一种保护敏感RDF数据的方法,包括如下步骤步骤10 将源RDF数据集中的敏感RDF三元组标记为敏感数据;步骤11 计算源RDF数据集中非敏感RDF三元组的闭包集合,记录每个生成的结 果三元组的推理生成路径;步骤12 基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径 进行计算,获得间接敏感RDF三元组集合;所述间接敏感RDF三元组集合包括任意敏感RDF 三元组生成路径中的至少一个RDF三元组;步骤13 在源RDF数据集中将所述间接敏感RDF三元组集合中的RDF三元组标记 为间接敏感数据;步骤14 对所述敏感数据及间接敏感数据进行安全保护。本发明实施例不但对敏感RDF三元组进行安全保护,同时对能够推理出所述敏感 RDF三元组的间接敏感RDF三元组进行安全保护,因此阻断了对敏感RDF三元组的推理生成 路径,有效实现了对敏感RDF三元组的全面保护,提高了通过RDF方式存储数据信息的隐私 安全性。本发明又一实施例提供一种保护敏感RDF数据的方法,以图4中所示为例,包括如 下步骤步骤40 将源RDF数据集中的敏感RDF三元组标记为敏感数据;所述标记方法包括访问控制装置将源RDF数据集中的RDF三元组与敏感RDF数 据集中的敏感RDF三元组进行比较,对源RDF数据集中的敏感RDF三元组标记为敏感数据;步骤41 计算源RDF数据集中非敏感RDF三元组的闭包集合,记录每个生成的结 果三元组的推理生成路径;本发明实施例将源RDF数据集中的非敏感RDF三元组称为非敏感初始RDF三元 组,即为源RDF数据集中没有被标记为敏感数据的RDF三元组。访问控制装置读取源RDF数据集中所有非敏感初始RDF三元组发送到间接敏感 RDF三元组集合计算装置,所述间接敏感RDF三元组集合计算装置将所述非敏感初始RDF三 元组存储于闭包集合中,作为闭包计算的初始数据集合,具体闭包计算过程详见附图5以 及对应的说明。对于推导生成的结果三元组,记录每个结果三元组的推理生成路径,依据被推理 出来的结果三元组为敏感RDF三元组、非敏感新RDF三元组或非敏感初始RDF三元组,闭包 计算单元分别将对应的生成路径存储到敏感RDF三元组生成路径表、非敏感新RDF三元组 生成路径表和非敏感初始RDF三元组生成路径表中,同一个结果三元组可能会由多个路径 被推理出来,则所有的生成路径都需要被记录。所述非敏感新RDF三元组即为闭包计算过程中生成的不属于源RDF数据集的非敏感RDF三元组。所述推理生成路径即为结果三元组是由哪些源RDF数据集中的非敏感初始RDF 三元组推理出来的,所述推理生成路径具体表现为若干个非敏感初始RDF三元组组成的集 合;闭包计算后,还可以包括推理生成路径的调整过程,所述调整过程包括替代过程 和/或扩展过程,所述替代过程为若推理生成路径中包含不是源RDF数据集中的非敏感 新RDF三元组;则由该非敏感新RDF三元组对应的非敏感新RDF三元组生成路径替代所述 非敏感新RDF三元组,得到统一由源RDF数据集中的非敏感初始RDF三元组组成的推理生 成路径。所述扩展过程为若敏感RDF三元组生成路径中的某个非敏感初始RDF三元组具 有可被其他非敏感初始RDF三元组推理得到的推理生成路径;则用每一条所述非敏感初始 RDF三元组的推理生成路径替换所述敏感RDF三元组推理生成路径中的该非敏感初始RDF 三元组,获得新的敏感RDF三元组推理生成路径。步骤42 基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径 进行计算,获得间接敏感RDF三元组集合;所述间接敏感RDF三元组集合包括任意敏感RDF 三元组生成路径中的至少一个RDF三元组; 所述基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径进行 计算,获得间接敏感RDF三元组集合包括基于所有结果三元组为敏感RDF三元组对应的敏 感RDF三元组生成路径进行笛卡尔积计算,即在每个所述敏感RDF三元组生成路径中各取 至少一个非敏感RDF三元组构成一个侯选结果,其中重复的非敏感RDF三元组只取一次;选 择一侯选结果作为间接敏感RDF三元组集合。任一候选结果都可以作为间接敏感RDF三元组集合。本发明实施例提供一种在候 选结果集中选择间接敏感RDF三元组的方法,包括将一个侯选结果中包含的非敏感RDF三 元组个数记为N ;对于所有结果三元组为非敏感新RDF三元组对应的非敏感新RDF三元组 生成路径,统计其中不包含所述候选结果中非敏感RDF三元组的非敏感新RDF三元组生成 路径所能生成的非敏感新RDF三元组个数,记为M ;从M-N的值最大时对应的侯选结果中选 择一个候选结果作为间接敏感RDF三元组集合。若原仅包含非敏感初始RDF三元组的闭包 集合中包含的RDF三元组个数记为S,则此时S+N-M的值最大,也就是上述选择方法保证了 屏蔽所选择的间接敏感RDF三元组集合之后,源RDF数据集中所保留的信息量相对较多;若 M-N的值最大时存在多个间接敏感RDF三元组,则可以从中任选一个作为最终选择的间接 敏感RDF三元组集合。可以理解的是,本发明实施例基于所有结果三元组为敏感RDF三元组对应的敏感 RDF三元组生成路径进行计算,获得间接敏感RDF三元组集合的方法中,并不局限于上面所 述的笛卡尔积计算,本领域技术人员根据本发明实施例的描述可以轻易想到的其他计算方 法均在本发明保护范围内,例如选择所述敏感RDF三元组生成路径中出现次数最多的一个 非敏感RDF三元组,删除包括该非敏感RDF三元组的敏感RDF三元组生成路径,在剩余的敏 感RDF三元组生成路径中继续选择出现次数最多的一个非敏感RDF三元组,然后删除包括 该非敏感RDF三元组的敏感RDF三元组生成路径,重复该操作直至所有的敏感RDF三元组 生成路径都被删除,则所有被选择出来的非敏感RDF三元组即构成一个间接敏感RDF三元 组集合。
步骤43 在源RDF数据集中将所述间接敏感RDF三元组集合中的RDF三元组标记 为间接敏感数据;访问控制装置读取上述间接敏感RDF三元组集合,将源RDF数据集中的RDF三元 组与间接敏感RDF三元组集合中的RDF三元组进行比较,对源RDF数据集中对应的非敏感 初始RDF三元组标记为间接敏感数据;步骤44 对所述敏感数据及间接敏感数据进行安全保护。对所述敏感数据及间接敏感数据进行安全保护包括对所述敏感数据及间接敏感 数据进行访问控制、屏蔽或加密保护。本发明实施例由间接敏感RDF三元组集合计算装置计算源RDF数据集中的间接敏 感RDF三元组,不但对敏感RDF三元组进行安全保护,同时对能够推理出所述敏感RDF三元 组的间接敏感RDF三元组进行安全保护,因此阻断了对敏感RDF三元组的推理生成路径,有 效实现了对敏感RDF三元组的全面保护,提高了通过RDF方式存储数据信息的隐私安全性。下面以图5中所示为例,对计算非敏感RDF三元组闭包集合的过程进行详细说明, 包括如下步骤步骤50 选择一个闭包集合中的RDF三元组;将源RDF数据集中的非敏感初始RDF三元组作为闭包集合的初始数据,在进行闭 包计算前,闭包集合中仅包含非敏感初始RDF三元组,在闭包计算过程中会添加生成结果 三元组为非敏感新RDF三元组,所选择的RDF三元组可以为非敏感初始RDF三元组,或非敏 感新RDF三元组。步骤51 选择一条推理规则,将所述选择的RDF三元组与所述选择的推理规则比 较,判断是否符合该条推理规则的部分前提条件;若符合该条推理规则的部分前提条件,则执行步骤52 ;若不符合继续执行步骤 56 ;步骤52 将该RDF三元组添加为该条推理规则的前提三元组;步骤53 判断是否具备与该选择的RDF三元组组成完整前提三元组的一组前提三 元组;若具备了能与该选择的RDF三元组组成完整前提条件的一组前提三元组,则执行 步骤54,否则执行步骤56 ;步骤54 依据该条推理规则的该完整前提条件推理生成结果三元组。此过程中还可以包括,将所述结果三元组为非敏感新RDF三元组的结果三元组添 加到闭包集合中。步骤55 记录由所述一组前提三元组组成的所述结果三元组的推理生成路径;若所述结果三元组为非敏感新RDF三元组,则将所述非敏感新RDF三元组添加到 闭包集合中,所述非敏感新RDF三元组为推理生成的不属于源RDF数据集中的非敏感RDF
三元组。根据结果三元组的性质分别将该结果三元组和推理生成路径加入到不同的表中, 例如若推理得到的结果三元组为敏感RDF三元组,则将对应的生成路径存储到敏感RDF三 元组生成路径表;若推理得到的结果三元组为非敏感新RDF三元组,则将对应的生成路径 存储到非敏感新RDF三元组生成路径表;若推理得到的结果三元组为非敏感初始RDF三元组,则将对应的生成路径存储到非敏感初始RDF三元组生成路径表。步骤56 判断当前推理规则是否为最后一条推理规则,如果是最后一条推理规 则,则执行步骤57 ;若不是最后一条推理规则,则返回步骤51,直到与所有的推理规则比较 后,根据推理规则无法再生成闭包集合外的其他RDF三元组。步骤57 判断闭包集合中是否还有未选择的RDF三元组;若还有未选择的RDF三元组,则返回步骤50,直到闭包集合中的所有RDF三元组都 被选择与所有推理规则比较过。否则结束操作。上述本发明实施例提供的闭包计算过程得到了基于源RDF数据集中非敏感RDF三 元组生成敏感RDF三元组的生成路径,为阻断敏感RDF三元组的推理生成路径提供便利。为进一步理解本发明,下面以具体实例对本发明的上述实施例进行详细介绍。如 图6中RDF数据图所示,实线部分描述的是RDF原始信息,即源RDF数据集。虚线部分描述 的是根据源RDF数据集推理生成的结果RDF数据。图6中三元组1,2,3是进行推理的基本 前提,分别表示student,Property, teacher数据节点都是资源Resource这一基本事实。 并且根据RDF的基本推理规则,还可以推导出其它的每个数据节点也都是资源resource这 一基本事实。由于该信息价值量较小,且并不涉及敏感信息,为了突出本发明重点并简化描 述,因此本实例中表示源RDF数据集的个人信息库中不包括三元组1,2,3,并且推理出的表 示数据节点为资源resource这样的三元组在实施例中也被省略。本实例中表示源RDF数据集的个人信息库如下表一 表一敏感信息存储在敏感RDF数据集中,本实例只考虑与上表一中个人信息库相关的 敏感RDF三元组。为了简化描述,后续都以个人信息库与敏感信息表中的序号来表示对应 的RDF三元组。敏感信息表的具体内容包括Jenny和Dan居某公司要职,不想让别人知道他们是学生,即下面两个三元组为敏感信息(Jenny type student), (Dan type student);教师参与的项目名称不能让用户随意查询,即下面两个三元组为敏感信息(Mike research RDF), (Bob research Web);教师的工资是敏感信息,即下面两个三元组为敏感信息(Bob salarysalaryLevel2), (Bob salary bonusLevell);敏感信息表如下表二所示 表二下表三为本实例中的推理规则表,rulel和rule2表示基本RDF推理规则中与属 性和类有关的两条规则,rule3到rule6则是根据具体资源之间本身的联系存在的逻辑推 理关系。 表三以上述内容为基础执行的保护敏感RDF数据的方法如图7中所示,包括如下步 骤步骤70 访问控制装置将源RDF数据集中的RDF三元组与敏感信息表中的敏感 RDF三元组进行比较,将源RDF数据集中的敏感RDF三元组8、18、20标记为敏感数据。步骤71 访问控制装置读取源RDF数据集中所有非敏感数据,将其发送到间接敏 感RDF三元组集合计算装置;即将源RDF数据集中除8、18、20之外的其它非敏感RDF三元组(4、5、6、7、9、10、
11、12、13、14、15、16、17、19、21、22、23、24、25和26)发送到间接敏感RDF三元组集合计算装置。步骤72 将所述非敏感RDF三元组集合放置到闭包集合中,作为闭包计算的初始 数据集合,闭包计算单元计算所述非敏感RDF三元组的闭包集合;具体闭包计算过程见后续的详细流程;此时初始数据集合为{4、5、6、7、9、10、11、
12、13、14、15、16、17、19、21、22、23、24、25、26};步骤73 依据被推理生成的结果三元组为敏感RDF三元组、非敏感新RDF三元组 或是非敏感初始RDF三元组,闭包计算单元分别将对应的生成路径存储到敏感RDF三元组 生成路径表、非敏感新RDF三元组生成路径表和非敏感初始RDF三元组生成路径表中下表四为敏感RDF三元组生成路径表,表五为非敏感初始RDF三元组生成路径表,表六为非敏感新RDF三元组生成路径表。
表四 表五 表六步骤74 调整推理生成路径;对于敏感RDF生成路径表中的生成路径c — {(R101 project RDF)、17},因为 (R101 project RDF)为非敏感新RDF三元组,因此执行替代过程,用(R101 project RDF) 的生成路径{15、16}来替代(R101 project RDF),得到统一由源RDF数据集中的非敏感初 始RDF三元组组成的推理生成路径,得到生成路径c— {15、16、17}。执行替代过程后的敏 感RDF三元组生成路径表如下表七所示 表七对于非敏感初始RDF生成路径表中的生成路径16 — {(R101 projectRDF),15}, 15— {(R101 project RDF),16},因为(R101 project RDF)为非敏感新 RDF 三元组,因此 执行替代过程,用其生成路径(R101 project RDF) — {15、16}来替代得到统一由源RDF 数据集中的非敏感初始RDF三元组组成的推理生成路径,得到生成路径16— {15、16}、 15— {15、16}。因为生成路径中含有生成的结果三元组本身,因此舍弃。执行替代过程后 的非敏感初始RDF三元组生成路径表如下表八所示 表八对于敏感RDF生成路径表中的生成路径f— {6、26},因为26具有可被其他非敏感 初始RDF三元组推理得到的生成路径26 — {22、23、24、25},因此执行扩展过程,用该生成 路径替换生成路径f— {6,26}中的26,获得新的敏感RDF三元组生成路径f— {6、22、23、 24,25}。执行扩展过程后的敏感RDF三元组生成路径表如下表九所示 表九步骤75 基于敏感RDF三元组生成路径表中的所有生成路径进行笛卡尔积计算, 获得候选的间接敏感RDF三元组集合;即在每个敏感RDF三元组生成路径所包含的RDF三元组中各取一个RDF三元组构 成一个集合,作为候选的间接敏感RDF三元组集合,其重复的三元组只取一次。将计算出的 所有候选的间接敏感RDF集合保存到侯选结果集中。由于本实例中涉及的候选的间接敏感RDF三元组集合总数较多,以下仅列出几个 具有代表性的候选的间接敏感 RDF 集合{4、10、21、6、15},{4、21、6、15},{9、10、21、6、15}, {9、10、21、6、17}, {9、10、21、26、17、22};步骤76 从候选的间接敏感RDF三元组集合中选择一个作为最终间接敏感RDF三 元组;按照上面实施例中所述的方法,将一个候选的间接敏感RDF三元组集合中包含的 RDF三元组个数记为N,例如,对于候选的间接敏感RDF三元组集合{9、10、21、6、17},其包 含的RDF三元组个数为N = 5,假设删除非敏感新RDF三元组生成路径表中包含该候选的 间接敏感RDF三元组集合中任一 RDF三元组的所有生成路径,统计非敏感新RDF三元组生 成路径表剩余的非敏感新RDF三元组生成路径所能生成的非敏感新RDF三元组个数,本实 例中对应上述间接敏感RDF三元组集合{9、10、21、6、17},统计后的M = 3,而初始数据集合 中三元组的个数为S = 20,此时W = S+M-N = 20+3-5 = 18,取得最大值。则{9、10、21、6、 17}是一个最优的间接敏感RDF三元组集合;可以理解的是,间接敏感RDF三元组集合{9、10、7、6、17}也是一个最优的间接敏 感RDF三元组集合,可以从{9、10、21、6、17}和{9、10、7、6、17}中任选一个作为最终的间接
敏感RDF三元组集合。步骤77 对间接敏感RDF三元组集合中的每个RDF三元组,访问控制装置在源RDF 数据集中将其标记为间接敏感数据;假设间接敏感RDF三元组集合为{9、10、21、6、17},则源1^^数据集中中最终标记
情况如下表十所示 表十上述实例中的闭包计算过程具体包括如下步骤1)对于闭包集合中三元组4、5,满足Rule2,更新规则前提表Rule2 :{4、5},无新三 元组生成;2)对于闭包集合中三元组6、7,满足Rulel,更新规则前提表Rulel :{6、7},无新三 元组生成;3)对于闭包集合中三元组9、10,满足Rule2,更新规则前提表Rule2 :{4、5、9、10}。 三元组9和10分别跟三元组4应用规则Rule2生成敏感RDF三元组a、b,因此更新敏感RDF 生成路径表a — {9,4},b — {10,4};4)对于闭包集合中三元组11、12,满足Rule2,更新规则前提表Rule2 :{4、5、 9、10、11、12}。三元组11和12分别跟三元组4应用该规则生成三元组(Lily type student)、(Jack type student),均为非敏感新RDF三元组,因此更新闭包集合{4、5、6、 7、9、10、11、12、13、14、15、16、17、19、21、22、23、24、25、26、 (Lily type student)、 (Jack typestudent)},更新非敏感新 RDF 生成路径表(Lily type student) — {11、4},(Jack type student) 一 {12、4};5)对于闭包集合中三元组13、14,满足如162,更新规则前提表如162:{4、5、9、10、 11、12、13、14},无新三元组生成;6)对于闭包集合中三元组15,满足Rule3、Rule4,更新规则前提表Rule3 {15}, Rule4 {15},无新三元组生成;7)对于闭包集合中三元组16,满足Rule3、Rule5,更新规则前提表Rule3 :{15、 16},Rule5 {16}。三元组16和三元组15应用规则Rule3生成新三元组(R101 project RDF),为非敏感新RDF三元组,因此更新闭包集合{4、5、6、7、9、10、11、12、13、14、15、16、 17、19、21、22、23、24、25、26、(Lily type student)、(Jack type student)、(RIO 1 projectRDF) },更新非敏感新 RDF 生成路径表(R101 project RDF) — {15、16};8)对于闭包集合中三元组17、19,满足Rule3、Rule4,更新规则前提表Rule3 :{15、 16、17、19},Rule4 {15、17、19},无新三元组生成;9)对于闭包集合中三元组21,满足Rulel,更新规则前提表Rulel :{6、7、21}。三 元组21与三元组7应用规则Rulel生成敏感RDF三元组e,因此更新敏感RDF生成路径表 e — {21,7};10)对于闭包集合中三元组22、23、24、25,满足Rule6,更新规则前提表Rule6 {22、23、24、25}。三元组22、23、24、25应用规则Rule6生成非敏感初始RDF三元组26,因此 更新非敏感初始RDF生成路径表26 — {22、23、24、25};11)对于闭包集合中三元组26,满足Rulel,更新规则前提表Rulel {6、7、21、26}。 三元组26与三元组6应用规则Rulel生成敏感RDF三元组f,因此更新敏感RDF生成路径 表f 一 {6,26};12)对于闭包集合中三元组(Lily type student)、(Jack type student),满足 Rule2,更新规则前提表Rule2 {4、5、9、10、11、12、13、14、(Lilytype student)、(Jack type student)},无新三元组生成;13)对于闭包集合中三元组(R101 project RDF),满足Rule4、Rule5,更新规则 前提表 Rule4 :{15、17、19、(R101 project RDF)},Rule5 {16、(R101 project RDF)}。三 元组(R101 project RDF)与三元组15、17应用规则Rule4分别生成非敏感初始RDF三元 组16和敏感RDF三元组c,与非敏感初始RDF三元组16应用规则Rule5生成非敏感初始 RDF三元组15。因此更新非敏感初始RDF生成路径表16 — {(R101 project RDF)、15}, 15 — {(RIOlproject RDF)、16},更新敏感 RDF 生成路径表c — {(R101 project RDF)、 17};14)闭包集合中的三元组全部处理完成,结束闭包计算。步骤78 对敏感数据以及间接敏感数据进行安全保护。综上所述,本发明实施例可以计算出源RDF数据集中的间接敏感RDF三元组,在对 敏感RDF三元组进行安全保护的同时,可以对能够推理出所述敏感RDF三元组的间接敏感 RDF三元组进行安全保护,因此阻断了对敏感RDF三元组的推理生成路径,有效实现了对敏 感RDF三元组的全面保护,提高了通过RDF方式存储数据信息的隐私安全性。本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以 通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中。以上对本发明实施例所提供的一种保护敏感RDF数据的方法、装置及系统进行了 详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的 说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依 据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容 不应理解为对本发明的限制。
权利要求
一种保护敏感资源描述框架RDF数据的方法,其特征在于,包括将源RDF数据集中的敏感RDF三元组标记为敏感数据;计算源RDF数据集中非敏感RDF三元组的闭包集合,记录每个生成的结果三元组的推理生成路径;基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三元组集合;所述间接敏感RDF三元组集合包括任意敏感RDF三元组生成路径中的至少一个RDF三元组;在源RDF数据集中将所述间接敏感RDF三元组集合中的RDF三元组标记为间接敏感数据;对所述敏感数据及间接敏感数据进行安全保护。
2.如权利要求1所述的方法,其特征在于,所述计算源RDF数据集中非敏感RDF三元组 的闭包集合,记录每个生成的结果三元组的推理生成路径包括将源RDF数据集中的非敏感初始RDF三元组作为闭包集合的初始数据,将闭包集合中 每个RDF三元组依次与每一条推理规则比较;若符合一条推理规则的部分前提条件,则将该RDF三元组添加为该条推理规则的前提 三元组;若找到能与该RDF三元组组成符合该条推理规则的完整前提条件的一组前提三元组, 则依据该条推理规则推理生成结果三元组;记录由所述一组前提三元组组成的所述结果三元组的推理生成路径,若所述结果三元 组为非敏感新RDF三元组,则将所述非敏感新RDF三元组添加到闭包集合中,并执行与每一 条推理规则的比较操作;所述非敏感新RDF三元组为推理生成的不属于源RDF数据集中的 非敏感RDF三元组。
3.如权利要求1或2所述的方法,其特征在于,所述结果三元组为敏感RDF三元组、非 敏感初始RDF三元组或非敏感新RDF三元组;所述推理生成路径为敏感RDF三元组生成路 径、非敏感初始RDF三元组生成路径或非敏感新RDF三元组生成路径。
4.如权利要求3所述的方法,其特征在于,还包括若推理生成路径中包含不是源RDF数据集中的非敏感新RDF三元组; 则由该非敏感新RDF三元组对应的非敏感新RDF三元组生成路径替代所述非敏感新 RDF三元组,得到统一由源RDF数据集中的非敏感初始RDF三元组组成的推理生成路径。
5.如权利要求4所述的方法,其特征在于,还包括若敏感RDF三元组生成路径中的某个非敏感初始RDF三元组具有可被其他非敏感初始 RDF三元组推理得到的推理生成路径;用每一条所述非敏感初始RDF三元组的推理生成路径替换所述敏感RDF三元组推理生 成路径中的所述非敏感初始RDF三元组,获得新的敏感RDF三元组推理生成路径。
6.如权利要求1或2所述的方法,其特征在于,所述基于所有结果三元组为敏感RDF三 元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三元组集合包括在每个所述敏感RDF三元组生成路径中各取至少一个非敏感RDF三元组构成一个侯选 结果,其中重复的非敏感RDF三元组只取一次;选择一侯选结果作为间接敏感RDF三元组集合。
7.如权利要求6所述的方法,其特征在于,所述选择一侯选结果作为间接敏感RDF三元 组集合包括将一个侯选结果中包含的非敏感RDF三元组个数记为N ;对于所有结果三元组为非敏感新RDF三元组对应的非敏感新RDF三元组生成路径,统 计其中不包含所述候选结果中非敏感RDF三元组的非敏感新RDF三元组生成路径所能生成 的非敏感新RDF三元组个数,记为M ;从M-N的值最大时对应的侯选结果中选择一个候选结果作为间接敏感RDF三元组集口 O
8.一种间接敏感RDF三元组集合计算装置,其特征在于,包括闭包计算单元,用于计算源RDF数据集中的非敏感RDF三元组的闭包集合; 存储单元,用于存储闭包计算过程生成的结果三元组的推理生成路径和闭包集合; 间接敏感RDF三元组集合计算单元,用于基于闭包计算过程生成的所有结果三元组为 敏感RDF三元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三元组集合; 所述间接敏感RDF三元组集合包括任意敏感RDF三元组生成路径中的至少一个RDF三元 组。
9.如权利要求8所述的装置,其特征在于,所述闭包计算单元进一步包括 存储子单元,用于存储推理规则以及规则前提;推理子单元,用于以非敏感RDF三元组作为规则前提,依据推理规则推理得到结果三 元组,所述作为规则前提的非敏感RDF三元组包括源RDF数据集中的非敏感初始RDF三元 组和属于非敏感新RDF三元组的结果三元组;记录子单元,用于将每个结果三元组的符合某条推理规则的完整前提条件的一组前提 三元组作为所述结果三元组的推理生成路径记录到所述存储单元。
10.如权利要求8或9所述的装置,其特征在于,还包括替代单元,用于在推理生成路径中包含不是源RDF数据集中的非敏感新RDF三元组情 况下,用该非敏感新RDF三元组对应的非敏感新RDF三元组生成路径替代所述非敏感新RDF 三元组,得到统一由源RDF数据集中的非敏感初始RDF三元组组成的推理生成路径;扩展单元,用于在敏感RDF三元组生成路径中的某个非敏感初始RDF三元组具有可 被其他非敏感初始RDF三元组推理得到的推理生成路径情况下,用每一条所述非敏感初始 RDF三元组的推理生成路径替代所述敏感RDF三元组推理生成路径中的所述非敏感初始 RDF三元组,获得新的敏感RDF三元组推理生成路径。
11.一种保护敏感资源描述框架RDF数据的系统,其特征在于,包括数据库、如权利要 求9至12任一项所述的间接敏感RDF三元组集合计算装置及访问控制装置;所述数据库,用于存储源RDF数据集;所述间接敏感RDF三元组集合计算装置,用于计算所述源RDF数据集中的间接敏感RDF三元组集合;所述访问控制装置,用于将源RDF数据集中的敏感RDF三元组标记为敏感数据,以及将 属于所述间接敏感RDF三元组集合中的非敏感RDF三元组标记为间接敏感数据,并对所述 敏感数据及间接敏感数据实施访问控制。
全文摘要
一种保护敏感资源描述框架RDF数据的方法,将源RDF数据集中的敏感RDF三元组标记为敏感数据;计算源RDF数据集中非敏感RDF三元组的闭包集合,记录每个生成的结果三元组的推理生成路径;基于所有结果三元组为敏感RDF三元组对应的敏感RDF三元组生成路径进行计算,获得间接敏感RDF三元组集合;在源RDF数据集中将所述间接敏感RDF三元组集合中的RDF三元组标记为间接敏感数据;对所述敏感数据及间接敏感数据进行安全保护。本发明实施例还提供相应的装置及系统。在对敏感RDF三元组进行安全保护的同时,对能够推理出所述敏感RDF三元组的间接敏感RDF三元组进行安全保护,实现对敏感RDF三元组的全面保护。
文档编号G06F21/24GK101853251SQ20091008121
公开日2010年10月6日 申请日期2009年3月30日 优先权日2009年3月30日
发明者吴跃, 常恒, 李彦, 杨琴, 陈佳 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1