本申请涉及大数据技术,尤其涉及一种基于隐私保护和tee的多方医疗隐私数据安全共享方法。
背景技术:
1、snp(single nucleotide polymorphism,单核苷酸多态性)存在于所有人的基因组中,不同snp位点上的基因,会导致不同性状的产生。因此,需要对snp位点上基因的分布进行划分和分析,实现对基因的高效研究。
2、在医学领域,需要获取snp位点信息进行医学研究。然而,在研究时将大量的snp位点信息上传至服务器,基因研究的效率较低。
技术实现思路
1、本申请提供一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,用以实现对snp位点上的不同基因之间的关联关系进行分析,实现对基因的高效研究。
2、第一方面,本申请提供一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,该方法应用于服务端,包括:
3、获取至少两个参与方的本地计算结果;其中,所述本地计算结果包括snp上的等位基因的分布频率,所述等位基因的分布频率包括snp上第一位点出现第一基因的第一频率、snp上第二位点出现第二基因的第二频率、以及snp上出现第一基因组的第三频率、snp上出现第二基因组的第四频率,所述第三频率包括第一位点上第一基因出现时,第二位点上第二基因的出现频率,所述第四频率包括第一位点上第一基因出现时,第二位点上第四基因的出现频率;
4、根据各参与方的本地计算结果进行组合,得到各参与方的待分析坐标位点;其中,所述待分析坐标位点包括由所述第一频率和所述第二频率组合成的第一坐标位点、由所述第三频率和所述第四频率组合成的第二坐标位点;
5、根据各参与方的待分析坐标位点进行聚类,得到所述第一坐标位点的第一中心点和所述第二坐标位点的第二中心点,以确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率;
6、依据所述真实频率进行关联度计算,以确定snp上第一位点和第二位点上的基因之间的基因关联关系。
7、第二方面,本申请提供一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,该方法应用于参与方的终端,包括:
8、对用户的基因数据进行分析,得到本地计算结果;其中,所述本地计算结果包括snp上的等位基因的分布频率,所述等位基因的分布频率包括snp上第一位点出现第一基因的第一频率、snp上第二位点出现第二基因的第二频率、以及snp上出现第一基因组的第三频率、snp上出现第二基因组的第四频率,所述第三频率包括第一位点上第一基因出现时,第二位点上第二基因的出现频率,所述第四频率包括第一位点上第一基因出现时,第二位点上第四基因的出现频率;
9、将所述本地计算结果传输给服务端,以在服务端根据各参与方的本地计算结果进行组合,得到各参与方的待分析坐标位点;其中,所述待分析坐标位点包括由所述第一频率和所述第二频率组合成的第一坐标位点、由所述第三频率和所述第四频率组合成的第二坐标位点;根据各参与方的待分析坐标位点进行聚类,得到所述第一坐标位点的第一中心点和所述第二坐标位点的第二中心点,以确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率;依据所述真实频率进行关联度计算,以确定snp上第一位点和第二位点上的基因之间的基因关联关系。
10、第三方面,本申请提供一种基于隐私保护和tee的多方医疗隐私数据安全共享装置,该装置应用于服务端,包括:
11、信息获取模块,用于获取至少两个参与方的本地计算结果;其中,所述本地计算结果包括snp上的等位基因的分布频率,所述等位基因的分布频率包括snp上第一位点出现第一基因的第一频率、snp上第二位点出现第二基因的第二频率、以及snp上出现第一基因组的第三频率、snp上出现第二基因组的第四频率,所述第三频率包括第一位点上第一基因出现时,第二位点上第二基因的出现频率,所述第四频率包括第一位点上第一基因出现时,第二位点上第四基因的出现频率;
12、数据组合模块,用于根据各参与方的本地计算结果进行组合,得到各参与方的待分析坐标位点;其中,所述待分析坐标位点包括由所述第一频率和所述第二频率组合成的第一坐标位点、由所述第三频率和所述第四频率组合成的第二坐标位点;
13、频率确定模块,用于根据各参与方的待分析坐标位点进行聚类,得到所述第一坐标位点的第一中心点和所述第二坐标位点的第二中心点,以确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率;
14、关联关系确定模块,用于依据所述真实频率进行关联度计算,以确定snp上第一位点和第二位点上的基因之间的基因关联关系。
15、第四方面,本申请提供一种基于隐私保护和tee的多方医疗隐私数据安全共享装置,该装置应用于参与方的终端,包括:
16、数据分析模块,用于对用户的基因数据进行分析,得到本地计算结果;其中,所述本地计算结果包括snp上的等位基因的分布频率,所述等位基因的分布频率包括snp上第一位点出现第一基因的第一频率、snp上第二位点出现第二基因的第二频率、以及snp上出现第一基因组的第三频率、snp上出现第二基因组的第四频率,所述第三频率包括第一位点上第一基因出现时,第二位点上第二基因的出现频率,所述第四频率包括第一位点上第一基因出现时,第二位点上第四基因的出现频率;
17、数据传输模块,用于将所述本地计算结果传输给服务端,以在服务端根据各参与方的本地计算结果进行组合,得到各参与方的待分析坐标位点;其中,所述待分析坐标位点包括由所述第一频率和所述第二频率组合成的第一坐标位点、由所述第三频率和所述第四频率组合成的第二坐标位点;根据各参与方的待分析坐标位点进行聚类,得到所述第一坐标位点的第一中心点和所述第二坐标位点的第二中心点,以确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率;依据所述真实频率进行关联度计算,以确定snp上第一位点和第二位点上的基因之间的基因关联关系。
18、本申请提供的一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,通过统计人群的本地计算结果,确定每组人群中,在单个snp位点上的等位基因的分布频率。根据统计出的本地计算结果,进行聚类计算,确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率。根据真实频率,确定两个snp位点之间的基因关联关系。便于根据基因关联关系,从两个snp位点中确定一个snp位点,只将确定出的snp位点的snp位点信息上传至服务端,保护了各方的原始数据。解决了现有技术中,无法得知snp位点之间的关联关系,从而影响基因研究的问题,避免信息上传时出现混乱,有效提高基因研究的效率。
1.一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,其特征在于,所述方法应用于服务端,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据各参与方的待分析坐标位点进行聚类,得到所述第一坐标位点的第一中心点和所述第二坐标位点的第二中心点,以确定出现第一基因、出现第二基因和同时出现第一基因和第二基因的真实频率,包括:
3.根据权利要求2所述的方法,其特征在于,依据所述真实频率进行关联度计算,以确定snp上第一位点和第二位点上的基因之间的基因关联关系,包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种基于隐私保护和tee的多方医疗隐私数据安全共享方法,其特征在于,所述方法应用于参与方的终端,所述方法包括:
9.一种基于隐私保护和tee的多方医疗隐私数据安全共享装置,其特征在于,所述装置应用于服务端,所述装置包括:
10.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;