本技术涉及计算机,特别是涉及一种个人信息合规性检测方法、装置、设备、存储介质及程序产品。
背景技术:
1、随着信息技术的快速发展和移动应用的广泛部署,个人信息保护成为社会关注的焦点。移动应用在提供便利服务的同时,也收集了大量的用户个人信息,为确保收集到的用户个人信息的合规性,需对个人信息合规性进行检测。
2、目前,个人信息合规性检测主要依赖人工审核移动应用的隐私权声明,该方法效率低下且易出错。为了提高个人信息合规性检测的效率和准确性,研究人员提出了多种自动化检测方法,如基于规则引擎的检测方法、基于文本挖掘的检测方法以及基于机器学习的检测方法等。然而,上述方法均存在一定的局限性,例如,基于规则引擎的方法需要不断更新规则以适应法律法规的变化,维护成本较高;基于文本挖掘的方法对文本的语义理解能力有限,难以准确把握法律法规的复杂要求,从而导致检测的准确性较低;基于机器学习的方法需要大量的标注数据进行训练,从而导致检测效率较低。
3、因此,如何提高个人信息合规性检测效率和准确性成为了一个亟待解决的问题。
技术实现思路
1、本技术实施例提供了一种个人信息合规性检测方法、装置、设备、存储介质及程序产品,可提高个人信息合规性检测效率和准确性。
2、第一方面,本技术实施例提供了一种个人信息合规性检测方法,该方法包括:
3、从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;
4、基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;
5、从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;
6、基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;
7、基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;
8、其中,多个第一实体和多个第二实体均包括信息收集主体/信息处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。
9、在其中一个实施例中,基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果,包括:将通过目标应用程序收集和处理的个人信息与第一合规性知识图谱进行匹配,得到第一合规性检测结果;将个人信息与第二合规性知识图谱进行匹配,得到第二合规性检测结果;基于第一合规性检测结果和第二合规性检测结果,得到针对个人信息的合规性检测结果。
10、在其中一个实施例中,从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系,以及,从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系,包括:将目标规则文本输入至预先确定的信息抽取模型中,得到用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;以及,将目标隐私权声明文本输入至信息抽取模型中,得到用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系。
11、在其中一个实施例中,基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱,包括:基于目标规则文本,确定用于构建第一合规性知识图谱的第一大语言模型,以及,确定用于构建第一知识图谱的第一实体类型和第一关系类型;基于第一实体类型和第一关系类型,构建第一知识图谱;利用第一大语言模型,将抽取的多个第一实体和各个第一实体之间的关系映射至第一知识图谱中,得到第一合规性知识图谱。
12、在其中一个实施例中,基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱,包括:基于目标隐私权声明文本,确定用于构建第二合规性知识图谱的第二大语言模型,以及,确定用于构建第二知识图谱的第二实体类型和第二关系类型;基于第二实体类型和第二关系类型,构建第二知识图谱;利用第二大语言模型,将抽取的多个第二实体和各个第二实体之间的关系映射至第二知识图谱中,得到第二合规性知识图谱。
13、在其中一个实施例中,该方法还包括:基于合规性检测结果,生成针对个人信息的合规性检测报告;合规性检测报告中包括针对个人信息的多项合规性检测的检测结果。
14、在其中一个实施方式中,该方法还包括:在确定合规性检测结果中存在任意一项检测结果为不合规的情况下,禁止目标应用程序使用个人信息。
15、第二方面,本技术提供了一种个人信息合规性检测装置,该装置包括:
16、抽取单元,用于从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;
17、构建单元,用于基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;
18、抽取单元,还用于从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;
19、构建单元,还用于基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;
20、检测单元,用于基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;
21、其中,多个第一实体和多个第二实体均包括信息收集或处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。
22、第三方面,本技术提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
23、从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;
24、基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;
25、从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;
26、基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;
27、基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;
28、其中,多个第一实体和多个第二实体均包括信息收集或处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。
29、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
30、从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;
31、基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;
32、从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;
33、基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;
34、基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;
35、其中,多个第一实体和多个第二实体均包括信息收集或处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。
36、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
37、从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;
38、基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;
39、从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;
40、基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;
41、基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;
42、其中,多个第一实体和多个第二实体均包括信息收集或处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。
43、上述个人信息合规性检测方法、装置、设备、存储介质及程序产品,计算机设备可从目标规则文本中抽取用于构建第一合规性知识图谱的多个第一实体以及各个第一实体之间的关系;目标规则文本包括进行数据预处理后的与个人信息相关的多个法律法规文本中的一个或多个;基于抽取的多个第一实体以及各个第一实体之间的关系,构建第一合规性知识图谱;从目标隐私权声明文本中,抽取用于构建与目标应用程序相关的第二合规性知识图谱的多个第二实体和各个第二实体之间的关系;目标隐私权声明文本是通过对目标应用程序的隐私权声明文本进行数据预处理得到的;基于抽取的多个第二实体以及各个第二实体之间的关系,构建第二合规性知识图谱;基于第一合规性知识图谱和第二合规性知识图谱,对通过目标应用程序收集和处理的个人信息进行合规性检测,得到针对个人信息的合规性检测结果;其中,多个第一实体和多个第二实体均包括信息收集或处理主体、数据所属主体和个人信息类型;各个第一实体之间的关系和各个第二实体之间的关系包括信息用途和信息收集方式。采用该方法,计算机设备通过从目标规则文本中抽取多个第一实体以及各个第一实体之间的关系,以及,从目标隐私权声明文本中,抽取多个第二实体和各个第二实体之间的关系,这样,可提高后续构建第一合规性知识图谱和第二合规性知识图谱的效率,从而,可提高构建与法律法规相关的第一合规性知识图谱和与目标应用程序相关的第二合规性知识图谱的效率,进而,基于第一合规性知识图谱和第二合规性知识图谱对通过目标应用程序收集和处理的个人信息进行合规性检测,不但可以提高个人信息合规性检测的效率,而且能够更准确地理解和匹配个人信息与移动应用的隐私权声明和法律法规的要求,即提高个人信息合规性检测准确性。