技术特征:
技术总结
本发明公开了一种基于Spark与Huffman编码的CPIR‑V最近邻隐私保护查询方法,将最近邻矩阵的数据使用Huffman编码进行压缩减少每个网格中的数据Bit位数;然后将压缩的数据,字符的码长以及元素最大值存储到空数据库HBase中;接着服务器端读取读取HBase数据库中的数据并缓存到Spark并行框架的RDD中,并根据并行策略对RDD中的CPIR最近邻矩阵进行分组,分组后Spark服务端根据查询信息进行CPIR并行计算,将每个分组的计算结果聚合然后将查询结果和字符码长发送给客户端;客户端将查询结果解析获得查询位的值,将查询位的值解压,得到查询信息。本发明基于Spark并行化和Huffman编码的隐私保护查询算法,保证在大数据应用场景下,保护用户的查询隐私并在原有的查询效果下提高查询效率。
技术研发人员:王波涛;王国仁;陈月梅;李昂;岳春成
受保护的技术使用者:东北大学
技术研发日:2017.07.04
技术公布日:2017.10.24