基于局部敏感哈希的链上近似最近邻数据隐私检索方法及系统

文档序号:40647478发布日期:2025-01-10 18:53阅读:4来源:国知局
基于局部敏感哈希的链上近似最近邻数据隐私检索方法及系统

本发明涉及区块链数据管理,特别涉及一种基于局部敏感哈希的链上近似最近邻数据隐私检索方法及系统。


背景技术:

1、数据在远程医疗会诊、金融风险评估、供应链管理等众多领域中扮演着重要角色。当前,大数据产业面临“人人有数据,人人缺数据”的“数据孤岛”式困境,人们迫切需要创新技术来建立合理、高效的数据共享模型,在数据交互过程中进行有效的数据管理。区块链是一种能够提供数据可信服务的分布式账本技术,能够作为一个稳定且安全的数据平台,利用其不可篡改、去信任、可溯源等优良特性,实现低风险、低成本的数据管理方案。然而,随着数据量的不断增长,人们对区块链数据管理方案的性能要求越来越高,如何高效地处理链上数据已经成为一大挑战。数据检索是进行数据分析、利用的基础,也是利用区块链技术实现数据管理的前提,由于区块链平台的数据检索通常运用分布式数据库、数据索引结构和加密算法来保证检索的可验证性和安全性,其数据检索效率通常受限,缺乏有效的数据检索方法将对未来区块链技术的广泛应用带来巨大限制。近似最近邻检索是众多数据检索技术之一,对于编码在高维向量空间的向量数据库,近似最近邻检索能够快速找到与检索向量相似程度高的向量,为链上数据的管理提供一种扩展性强的解决方案,被广泛应用于推荐系统领域。将近似最近邻检索应用于链上数据检索,能够突破性能瓶颈,合理利用区块链特性,为不同领域的应用提供更加可靠的数据服务。但如何实现检索过程中的隐私保护,确保数据的安全,是不可避免的痛点、难点。例如,在医疗领域,患者经常使用基于物联网的可穿戴技术,这些技术的传感器终端设备负责收集、记录和检索患者的健康数据。如果这些数据遭到泄露或篡改,不仅会引发严重的安全问题,还可能对患者的生命安全构成直接威胁。因此,如何实现高效、隐私的链上近似最近邻检索,已经成为利用区块链技术实现数据管理的重要挑战。

2、由于链上数据存储具有资源有限、公开可见、可溯源的特点,链上数据检索面临着三大难题,即如何实现高效的数据检索、如何提高检索过程中的隐私保护与提高检索结果的准确度,为溯源过程提供有力支撑。现有的链上数据检索研究大多数以融入更合适的索引结构,提高检索性能为目标,牺牲检索功能的多样性。还有部分研究旨在提供检索结果的可验证性,例如设计基于加密技术或结合数据库指纹和可信执行环境等技术的可验证数据结构(ads)。然而,对于链上数据的近似最近邻检索研究相对较少,已有的研究无法满足隐私保护需求,这是无法接受的。


技术实现思路

1、为此,本发明提供一种基于局部敏感哈希的链上近似最近邻数据隐私检索方法及系统,将隐私保护的近似最近邻检索应用于区块链环境,在保证隐私保护的前提下,实现高效、安全、准确的链上数据检索,为链上数据管理提供更多的可能性。

2、按照本发明所提供的设计方案,一方面,提供一种基于局部敏感哈希的链上近似最近邻数据隐私检索方法,包含:

3、数据管理节点从链上获取数据并利用局部敏感哈希为链上数据构建哈希表,依据访问控制策略并使用属性基加密将哈希表加密为密文并将密文存储上链;

4、在满足访问控制策略的情形下获取密文,并针对检索向量利用智能合约进行链上数据检索,以获取与检索向量最相似的链上数据。

5、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,还包含:可信授权节点为数据管理节点分发用于对哈希表进行加解密的主密钥和公钥,并根据数据检索节点属性为数据检索节点分发对应加解密私钥。

6、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,数据管理节点从链上获取数据并利用局部敏感哈希为链上数据构建哈希表,包含:

7、数据管理节点从链上获取数据;

8、根据向量间距离设置局部敏感哈希函数族,所述局部敏感哈希函数族由多个哈希函数构成;

9、将链上数据通过哈希函数映射到哈希表中,所述每个哈希函数对应一个哈希表。

10、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,依据访问控制策略并使用属性基加密将哈希表加密为密文并将密文存储上链,包含:

11、依据用户属性设置访问控制策略,所述访问控制策略对指定属性的用户给予哈希表的解密权限;

12、基于访问控制策略并使用属性基加密算法将哈希表加密为密文,使密文中嵌有访问控制策略,并将密文上链存储。

13、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,在满足访问控制策略的情形下获取密文,包含:

14、将数据检索节点的用户属性与访问控制策略进行匹配;

15、若匹配成功,则允许数据检索节点用户从链上获取密文,否则,禁止数据检索节点用户从链上获取密文。

16、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,针对检索向量利用智能合约进行链上数据检索,包含:

17、对密文进行解密,得到哈希表,从每个哈希表中检索得到相应链上数据候选集;

18、使用多探针局部敏感哈希技术将检索向量扩展为指定个数的哈希值;

19、将哈希表进行分区,并构建分布式点函数,利用分布式点函数为每个分区生成共享密钥;

20、利用预设的数据检索智能合约获取哈希表中不同半径下第一个非空哈希桶并将哈希桶中数据作为发生哈希碰撞的检索结果,依据检索结果生成共享份额,以使用分布式点函数对共享份额进行恢复并获取最近邻向量。

21、作为本发明基于局部敏感哈希的链上近似最近邻数据隐私检索方法,进一步地,依据检索结果生成共享份额,包含:

22、将发生哈希碰撞的数据向量组合;

23、使用遗忘屏蔽技术保留组合数据向量首个数据向量的id、将剩余数据向量的id作为指定隐私数据进行保护处理,所述保护处理为利用随机元素对指定隐私数据进行转换。

24、再一方面,本发明还提供一种基于局部敏感哈希的链上近似最近邻数据隐私检索系统,包含:初始设置模块和检索实施模块,其中,

25、初始设置模块,用于数据管理节点从链上获取数据并利用局部敏感哈希为链上数据构建哈希表,依据访问控制策略并使用属性基加密将哈希表加密为密文并将密文存储上链;

26、检索实施模块,用于在满足访问控制策略的情形下获取密文,并针对检索向量利用智能合约进行链上数据检索,以获取与检索向量最相似的链上数据。

27、本发明的有益效果:

28、本发明使用局部敏感哈希技术和分布式点函数,将私有信息检索思想与局部敏感哈希结合来实现链上数据的近似最近邻检索,为链上数据管理的多样性提供可行性;在检索过程中使用属性加密、遗忘屏蔽等多种隐私保护技术,兼顾链上数据近似最近邻检索的效率问题与隐私问题。并在hyperledger fabric联盟链中进行实验,将本案方案与两种近似最近邻检索方法进行对比,通过实验结果表明,本案方案检索时间分别降低57%与59.2%,召回率分别提升4.5%与2%,初始化时间分别减少34倍和122倍,并与使用同态加密的近似最近邻隐私检索方法进行性能对比,结果表明,本案方案能够将检索时间降低几个数量级,能够兼顾检索效率和隐私保护,可以实现高效、准确、安全的链上数据近似最近邻隐私检索,在区块链平台的数据检索领域具有较好的应用前景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1