合规判别方法、装置、存储介质及电子设备与流程

文档序号:31784820发布日期:2022-10-12 12:37阅读:42来源:国知局
合规判别方法、装置、存储介质及电子设备与流程

1.本公开涉及计算机技术领域,具体而言,涉及一种合规判别方法、合规判别装置、计算机可读存储介质及电子设备。


背景技术:

2.随着软硬件的快速发展,各种各样的应用程序也不断被开发出来。在应用程序中,通常需要抓取用户的个人信息。例如,电话号码、位置、短信等。随着人们对于隐私的重视程度不断提高,隐私保护已经成为了重要的社会问题。在应用程序商家应用市场之前,需要对应用程序进行隐私合规评估,即全面了解应用程序是否存在对个人信息过度收集、滥用等行为。
3.在相关方案中,可以由评估人员获取将抓取的个人信息与应用程序附带的隐私文本进行比较,以此确定应用程序是否合规。然而,相关技术中的方案,需要评估人员逐一进行对比,需要耗费较多的人力物力,对应用程序的隐私合规评估的效率较差,从而降低了应用程序的上线效率。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.本公开的目的在于提供一种合规判别方法、合规判别装置、计算机可读存储介质及电子设备,可以解决相关技术中对应用程序的隐私合规评估效率较差的问题。
6.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
7.根据本公开的第一方面,提供了一种合规判别方法,包括:获取应用程序运行时所抓取的个人信息;获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
8.在本公开的一种示例性实施例中,基于前述方案,获取应用程序对应的隐私协议文本,包括:获取应用程序的界面组件;根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本。
9.在本公开的一种示例性实施例中,基于前述方案,将隐私协议文本处理为多个隐私协议语句,包括:获取隐私协议文本中的多个字符,获取字符对应的字符类型;根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。
10.在本公开的一种示例性实施例中,基于前述方案,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句,包括:将隐私协议文本中的第一目标字符替换为换行符,得到多个隐私协议语句;其中,第一目标字符为多个字符中的至少一个,第一目标字符的字符类型为结束字符类型。
11.在本公开的一种示例性实施例中,基于前述方案,在将隐私协议文本中的第一目
标字符替换为换行符,得到多个隐私协议语句之前,方法还包括:删除隐私协议文本中的第二目标字符;其中,第一目标字符为多个字符中的至少一个,第二目标字符的字符类型为非结束字符类型。
12.在本公开的一种示例性实施例中,基于前述方案,隐私协议语句中包括多个词,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息,包括:获取隐私协议语句中各词的词相关信息;根据词相关信息与预配置词性表确定隐私协议语句的标注信息;其中,预配置词性表中包括多个词性列表,词性列表中包括多个词,各词性列表对应的词性不同,标注信息用于指示隐私协议语句对应的隐私获取方案的正负相关性;根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
13.在本公开的一种示例性实施例中,基于前述方案,词相关信息包括索引值、词内容、起始结束位置以及词性,根据词相关信息与预配置词性表确定隐私协议语句的标注信息,包括:根据隐私协议语句中的词的词性确定目标词;其中,目标词的词性为动词,目标词为预配置词性表中的词;根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词;在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关;其中,否定词为预配置词性表中的词;在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关;其中,非否定词为预配置词性表中的词。
14.根据本公开的第二方面,提供了一种合规判别装置,包括:个人信息获取模块,用于获取应用程序运行时所抓取的个人信息;隐私文本处理模块,用于获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;合规判别模块,用于将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
15.根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现如上述实施例中第一方面的合规判别方法。
16.根据本公开的第四方面,提供了一种电子设备,包括:
17.一个或多个处理器;以及
18.存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如上述实施例中第一方面的合规判别方法。
19.本公开实施例提供的技术方案可以包括以下有益效果:
20.本公开的一种实施例提供的合规判别方法中,可以获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。通过本公开的实施例,可以自动判别应用程序是否合规,无需评估人员逐一对比,减少了人力物力消耗,提升了隐私合规评估的效率,从而提升了应用程序的上线效率。
21.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
22.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。在附图中:
23.图1示意性示出了本公开示例性实施例中合规判别方法的示例性系统架构的示意图;
24.图2示意性示出本公开示例性实施例中合规判别方法的流程图;
25.图3示意性示出本公开示例性实施例中根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本的流程图;
26.图4示意性示出本公开示例性实施例中一种获取隐私协议文本的流程图;
27.图5示意性示出本公开示例性实施例中根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句的流程图;
28.图6示意性示出本公开示例性实施例中根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息的流程图;
29.图7示意性示出本公开示例性实施例中根据在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关的流程图;
30.图8示意性示出本公开示例性实施例中另一种合规判别方法的流程图;
31.图9示意性示出本公开示例性实施例中再一种合规判别方法的流程图;
32.图10示意性示出本公开示例性实施例中实现合规判别方法的模块示意图;
33.图11示意性示出本公开示例性实施例中合规判别装置的组成示意图;
34.图12示意性示出了适于用来实现本公开示例性实施例的电子设备的计算机系统的结构示意图。
具体实施方式
35.现在将参照附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。
36.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
37.图1示出了可以应用本公开实施例的合规判别方法的示例性系统架构的示意图。
38.如图1所示,系统架构1000可以包括终端设备1001、1002、1003中的一种或多种,网络1004和服务器1005。网络1004用以在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
39.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器1005可以是多个服务器组成的服务器集群等。
40.用户可以使用终端设备1001、1002、1003通过网络1004与服务器1005交互,以接收或发送消息等。终端设备1001、1002、1003可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。另外,服务器1005可以是提供各种服务的服务器。
41.在一种实施例中,本公开的字符处理方法的执行主体可以是服务器1005,服务器1005可以获取由终端设备1001、1002、1003发送的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
42.此外,还可以通过终端设备1001、1002、1003等执行本公开的字符处理方法,以实现获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
43.此外,本公开字符处理方法实现过程还可以由终端设备1001、1002、1003和服务器1005共同实现。例如,终端设备1001、1002、1003可以获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,并将获取到的隐私协议语句发送给服务器1005,以使服务器1005可以将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
44.随着软硬件的快速发展,各种各样的应用程序也不断被开发出来。在应用程序中,通常需要抓取用户的个人信息。例如,电话号码、位置、短信等。随着人们对于隐私的重视程度不断提高,隐私保护已经成为了重要的社会问题。在应用程序商家应用市场之前,需要对应用程序进行隐私合规评估,即全面了解应用程序是否存在对个人信息过度收集、滥用等行为。
45.在相关方案中,可以由评估人员获取将抓取的个人信息与应用程序附带的隐私文本进行比较,以此确定应用程序是否合规。然而,相关技术中的方案,需要评估人员逐一进行对比,需要耗费较多的人力物力,对应用程序的隐私合规评估的效率较差,从而降低了应用程序的上线效率。
46.根据本示例性实施例中所提供的合规判别方法中,可以获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。如图2所示,该合规判别方法可以包括以下步骤:
47.步骤s210,获取应用程序运行时所抓取的个人信息;
48.步骤s220,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;
49.步骤s230,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
50.本公开的一种实施例提供的合规判别方法中,可以获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,
将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。通过本公开的实施例,可以自动判别应用程序是否合规,无需评估人员逐一对比,减少了人力物力消耗,提升了隐私合规评估的效率,从而提升了应用程序的上线效率。下面,将结合附图及实施例对本示例性实施例中的合规判别方法的步骤s210~s230进行更详细的说明。
51.步骤s210,获取应用程序运行时所抓取的个人信息;
52.在本公开的一种示例实施例中,可以获取应用程序运行时所抓取的个人信息。其中,应用程序是基于智能终端使用的应用程序,用户可以使用的各种程序设计语言,以及用各种程序设计语言编制应用软件。宿主应用程序可以包括安装在智能手机上的软件,基于相应的系统而运行,例如ios系统、android系统、windows mobile系统、symbian系统、blackberry os系统等。应用程序可以包括办公室应用程序、互联网应用程序、多媒体应用程序、数据分析应用程序、工作协作应用程序、商务应用程序。需要说明的是,本公开对应用程序的类型并不做特殊限定。
53.在本公开的一种示例实施例中,可以获取应用程序运行时所抓取的个人信息。具体的,在应用程序运行时,可以抓取个人信息。例如,个人信息可以为手机号、联系人、短信、手机型号、imei(international mobile equipment identity,国际移动设备识别码)等。
54.需要说明的是,本公开对于个人信息的具体类型并不做特殊限定。
55.在本公开的一种示例实施例中,可以通过网络爬虫获取应用程序运行时抓取的个人信息。
56.需要说明的是,本公开对于获取应用程序运行时所抓取的个人信息的具体方式并不做特殊限定。
57.步骤s220,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;
58.在本公开的一种示例实施例中,可以获取应用程序对应的隐私协议文本。具体的,隐私协议文本是告知用户网站或者移动端软件如何收集和使用用户信息和数据的文本。具体而言,可以由开发者提供应用程序对应的隐私协议文本,将应用程序对应的隐私协议文本存储在服务器中,在需要针对应用程序进行隐私合规评估时,可以在服务器中调用该应用程序对应的隐私协议文本;或者,应用程序的包体中包含该应用程序对应的隐私协议文本,可以在应用程序的包体中查找该应用程序对应的隐私协议文本。
59.需要说明的是,本公开对于获取应用程序对应的隐私协议文本的具体方式并不做特殊限定。
60.在本公开的一种示例实施例中,在通过上述步骤得到应用程序对应的隐私协议文本之后,可以将隐私协议文本处理为多个隐私协议语句。具体的,可以对隐私协议文本进行语句切分处理得到多个隐私协议语句。
61.举例而言,可以构建隐私协议文本切分模型,隐私协议文本切分模型可以用于对隐私协议文本进行语句切分,弹幕识别模型是指为了完成隐私协议文本切分任务所建立的模型,可以通过对基础模型进行训练得到隐私协议文本切分模型,以完成隐私协议文本切分任务。需要说明的是,本公开对于隐私协议文本切分模型的具体结构并不做特殊限定。
62.需要说明的是,本公开对于将隐私协议文本处理为多个隐私协议语句的具体方式并不做特殊限定。
63.在本公开的一种示例实施例中,可以获取应用程序的界面组件,根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本。参照图3所示,根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本,可以包括以下步骤s310~s320:
64.步骤s310,获取应用程序的界面组件;
65.在本公开的一种示例实施例中,可以获取应用程序的界面组件。具体的,界面组件用于显示屏幕,用户在使用终端设备时,可以与界面组件中的内容进行互动用以完成某项任务。
66.举例而言,界面组件可以包括android中的activity组件,一个activity组件可以提供一个屏幕,可以通过activity组件与用户进行交互,不同的activity组件通过intent进行通信。activity代表一个用户所能看到的屏幕,主要用于处理应用程序的整体性工作,例如监听系统事件,为用户显示指定的view,启动其他activity等。所有应用的activity都继承于android.app.activity类,该类是android提供的基层类,其他的activity继承该父类后,通过父类的方法来实现各种功能。
67.在本公开的一种示例实施例中,可以通过appt指令(例如aapt dump bagging xx.apk)获取应用程序的界面组件。
68.需要说明的是,本公开对于获取应用程序的界面组件的具体方式并不做特殊限定。
69.步骤s320,根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本。
70.在本公开的一种示例实施例中,在通过上述步骤得到应用程序的界面组件之后,可以根据界面组件获取隐私协议文本对应的隐私协议链接。具体的,隐私协议文本对应的隐私协议链接可以用于指示隐私协议文本在应用程序的包体中的位置,可以通过隐私协议链接获取隐私协议文本。具体而言,界面组件中可以包括多个控件,该些控件可以响应不同的操作。例如,单击操作、滑动操作、双击操作等。可以通过控制界面组件中的多个控件以使得该些控件实现相应的功能,在控件实现相应的功能时,监控隐私协议文本对应的隐私协议链接。
71.在本公开的一种示例实施例中,可以获取应用程序的包体,并根据应用程序的包体获取应用程序的相关信息(例如包名、界面组件、版本等),并将这些应用程序的相关信息作为调试程序的输入参数,并通过调试程序获取隐私协议文本对应的隐私协议链接。
72.举例而言,可以通过appt指令(如aapt dump bagging xx.apk)获取应用程序的相关信息,并将应用程序的相关信息设置为adb调试桥(android调试桥,android debug bridge)的参数(例如为appium参数,命令行参数),并通过uiautomator(应用程序测试工具)获取界面组件中的多个控件,编写自动化脚本,例如可以使用python(计算机编程语言)编写selenium(web自动化工具)自动化脚本,实现针对多个控件的单击操作、滑动操作、双击操作等,以此获取隐私协议文本对应的隐私协议链接。
73.在本公开的一种示例实施例中,在通过上述步骤得到隐私协议文本对应的隐私协议链接之后,可以通过隐私协议链接获取隐私协议文本。举例而言,可以通过python编写网络爬虫,例如可以通过python的requests模块(网络请求模块)、re模块(查找/验证模块)进
行编写,可以通过网络爬虫获取隐私协议链接的内容,即隐私协议文本。
74.需要说明的是,本公开对于根据界面组件获取隐私协议文本对应的隐私协议链接的具体方式以及通过隐私协议链接获取隐私协议文本的具体方式并不做特殊限定。
75.在本公开的一种示例实施例中,如图4所示,可以通过appt指令获取应用程序的相关信息,将应用程序的相关信息设置为adb调试桥的appium参数,通过uiautomator获取界面组件中的多个控件,通过selenium自动化脚本,实现针对多个控件的操作,获取隐私协议文本对应的隐私协议链接,通过网络爬虫获取隐私协议链接的内容,通过正则表达式删除隐私协议文本中的第二目标字符,得到隐私协议文本。
76.通过上述步骤s310~s320,可以获取应用程序的界面组件,根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本。
77.在本公开的一种示例实施例中,可以获取隐私协议文本中的多个字符,获取字符对应的字符类型,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。参照图5所示,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句,可以包括以下步骤s510~s520,:
78.步骤s510,获取隐私协议文本中的多个字符,获取字符对应的字符类型;
79.在本公开的一种示例实施例中,在通过上述步骤得到隐私协议文本之后,可以获取隐私协议文本中的多个字符,并获取字符对应的字符类型。具体的,字符可以包括字形单位或符号,包括字母、数字、运算符号、标点符号、功能性符号和其他符号。
80.在本公开的一种示例实施例中,可以获取隐私协议文本中的多个字符的字符类型。具体的,字符的字符类型可以用于指示字符的主要作用。举例而言,字符可以包括字形单位类型以及符号类型,其中,字符的字符类型为字形单位类型,是指该字符为某一字形,例如为字母、数字等,字符的字符类型为符号类型,是指该字符为某一符号,例如为标点符号、运算符号等。
81.需要说明的是,本公开对于获取隐私协议文本中的多个字符的具体方式以及获取字符对应的字符类型的具体方式并不做特殊限定。
82.步骤s520,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。
83.在本公开的一种示例实施例中,在通过上述步骤得到多个字符的字符类型之后,可以根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。具体的,可以获取字符类型为符号类型的字符,并通过这些字符将隐私协议文本划分为多个隐私协议语句。
84.举例而言,可以将每两个字符类型为符号类型的字符之间的字符确定为一个隐私协议语句。
85.需要说明的是,本公开对于根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句的具体方式并不做特殊限定。
86.在本公开的一种示例实施例中,可以将隐私协议文本中的第一目标字符替换为换行符,得到多个隐私协议语句。其中,第一目标字符为多个字符中的至少一个,第一目标字符的字符类型为结束字符类型。具体而言,第一目标字符的字符类型为结束字符类型,符号类型包括结束字符类型,第一目标字符的字符类型为结束字符类型是指,该第一目标字符前面的字符与第一目标字符后面的字符无相关性或者相关性不强,此时,可以将该些第一
目标字符替换为换行符,以将隐私协议文本划分为多个隐私协议语句。
87.举例而言,结束字符类型可以包括“。”“!”“?”等。需要说明的是,本公开对于结束字符类型并不做特殊限定。
88.进一步的,在将隐私协议文本中的第一目标字符替换为换行符,得到多个隐私协议语句之前,可以删除隐私协议文本中的第二目标字符。其中,第一目标字符为多个字符中的至少一个,第二目标字符的字符类型为非结束字符类型,符号类型包括非结束字符类型。具体的,第二目标字符的字符类型为非结束字符类型是指,该第一目标字符前面的字符与第一目标字符后面的字符具有相关性。例如,可以通过正则表达式删除隐私协议文本中的第二目标字符。
89.举例而言,结束字符类型可以包括“*”“&”“#”等。需要说明的是,本公开对于结束字符类型并不做特殊限定。
90.通过本公开的实施例,能够避免非结束字符类型对于将隐私协议文本划分为隐私协议语句的影响,从而提升隐私协议语句划分的准确性,进而提升判别准确性。
91.通过上述步骤s510~s520,可以获取隐私协议文本中的多个字符,获取字符对应的字符类型,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。
92.步骤s230,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
93.在本公开的一种示例实施例中,在通过上述步骤获取多个隐私协议语句之后,可以将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。具体的,应用程序的合规信息可以包括应用程序的隐私协议文本的完整性、正确性、不一致性等。需要说明的是,本公开对于应用程序的合规信息的具体类型并不做特殊限定。具体而言,隐私协议语句可以用于指示该隐私协议语句对应的隐私获取方案,可以将隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息进行比较,以此确定应用程序的合规信息。具体而言,可以将隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息进行比较,在隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息一致时,可以确定应用程序合规,在隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息不一致时,可以确定应用程序不合规。
94.举例而言,应用程序运行时所抓取的个人信息为电话号码,隐私协议语句对应的隐私获取方案为获取电话号码,此时隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息一致,可以确定应用程序合规;又如,应用程序运行时所抓取的个人信息为联系人,隐私协议语句对应的隐私获取方案为不获取联系人,此时隐私协议语句对应的隐私获取方案与应用程序运行时所抓取的个人信息不一致,可以确定应用程序不合规。
95.需要说明的是,本公开对于将个人信息与隐私协议语句进行比较,确定应用程序的合规信息的具体方式并不做特殊限定。
96.在本公开的一种示例实施例中,可以获取隐私协议语句中各词的词相关信息,根据词相关信息与预配置词性表确定隐私协议语句的标注信息,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。参照图6所示,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息,可以包括以下步骤s610~s630:
97.步骤s610,获取隐私协议语句中各词的词相关信息;
98.在本公开的一种示例实施例中,可以获取隐私协议语句中各词的词相关信息。具
体的,词相关信息可以用于指示隐私协议语句中的词的特征信息,举例而言,词相关信息可以包括索引值、词内容、起始结束位置以及词性等信息。
99.需要说明的是,本公开对于词相关信息的具体类型以及获取隐私协议语句中各词的词相关信息的具体方式并不做特殊限定。
100.步骤s620,根据词相关信息与预配置词性表确定隐私协议语句的标注信息;
101.在本公开的一种示例实施例中,在通过上述步骤获取隐私协议语句中各词的词相关信息之后,可以根据词相关信息与预配置词性表确定隐私协议语句的标注信息。其中,预配置词性表中包括多个词性列表,词性列表中包括多个词,各词性列表对应的词性不同。举例而言,预配置词性表中可以包括名词列表、动词列表,例如,名词列表中可以包括位置信息、邮件、快递、电话号码等,动词列表中可以包括披露、分享、输入、收集、获得、记录、追踪等。
102.需要说明的是,本公开对于预配置词性表的具体内容并不做特殊限定。
103.在本公开的一种示例实施例中,标注信息用于指示隐私协议语句对应的隐私获取方案的正负相关性。具体的,隐私协议语句对应的隐私获取方案为正向方案时,则可以确定隐私获取方案对应的隐私协议语句的标注信息为正相关。
104.例如,隐私协议语句为“在您注册或激活登录账户时,将收集您的个人注册信息,包括手机号、用户名、密码、用户头像、昵称”,此时,该隐私协议语句对应的隐私获取方案为正向方案,可以将隐私获取方案对应的隐私协议语句的标注信息为正相关;再如,隐私协议语句为“在未征得您事先许可的情况下,我们不会获取您的个人注册信息”,此时,该隐私协议语句对应的隐私获取方案为负向方案,可以将隐私获取方案对应的隐私协议语句的标注信息为负相关。
105.需要说明的是,本公开对于根据词相关信息与预配置词性表确定隐私协议语句的标注信息的具体方式并不做特殊限定。
106.步骤s630,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
107.在本公开的一种示例实施例中,在通过上述步骤得到隐私协议语句的标注信息之后,可以根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。具体的,可以根据个人信息与隐私协议语句的标注信息的一致性确定应用程序的合规信息。
108.举例而言,隐私协议语句的标注信息为负相关,此时,通过上述步骤运行应用程序时所抓取的个人信息中存在与隐私协议语句对应的隐私获取方案中相同的个人信息,例如,隐私协议语句为“在任何情况下,我们都不会获取您的联系人”,该隐私协议语句的标注信息为负相关(负向方案),然而,运行应用程序时所抓取的个人信息中包括联系人,即应用程序在运行时,获取了联系人(正向方案),此时,个人信息与隐私协议语句的标注信息不一致,可以确定应用程序不合规。
109.需要说明的是,本公开对于根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息的具体方式并不做特殊限定。
110.通过上述步骤s610~s630,可以获取隐私协议语句中各词的词相关信息,根据词相关信息与预配置词性表确定隐私协议语句的标注信息,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
111.在本公开的一种示例实施例中,可以根据隐私协议语句中的词的词性确定目标
词,根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词,在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关,在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关。参照图7所示,在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关,可以包括以下步骤s710~s740:
112.步骤s710,根据隐私协议语句中的词的词性确定目标词;
113.在本公开的一种示例实施例中,在通过上述步骤得到隐私协议语句之后,可以根据隐私协议语句中的词的词性确定目标词。具体的,通过上述步骤得到的隐私协议语句中的词的词相关信息,词相关信息中可以包括词性,当隐私协议语句中包括词性为动词的词,且该词为预配置词性表中的词时,可以将该词确定为目标词。
114.需要说明的是,本公开对于根据隐私协议语句中的词的词性确定目标词的具体方式并不做特殊限定。
115.步骤s720,根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词;
116.在本公开的一种示例实施例中,在通过上述步骤得到目标词之后,可以根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词。具体的,词的索引值以及词的起始结束位置可以用于指示词在隐私协议语句中的位置,以及隐私协议语句中词与词之间的位置关系,可以通过词的索引值以及词的起始结束位置查找目标词的修饰词,以及目标词对应的名词。其中,目标词的修饰词为修饰目标词的词。例如,目标词为“披露”,该目标词的修饰词为“不”;目标词对应的名词为该目标词所针对的对象。例如,目标词为“披露”,该目标词对应的名词为“手机号码”。
117.举例而言,可以根据目标词的索引值进行上下遍历,查找目标词的修饰词以及目标词对应的名词。
118.需要说明的是,本公开对于根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词的具体方式并不做特殊限定。
119.步骤s730,在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关;其中,否定词为预配置词性表中的词;
120.步骤s740,在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关;其中,非否定词为预配置词性表中的词。
121.在本公开的一种示例实施例中,在通过上述步骤得到目标词的修饰词以及目标词对应的名词之后,可以判定目标词的修饰词的否定性。在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关,在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关。
122.举例而言,隐私协议语句为“我们不会披露您的手机号码”,目标词为“披露”,修饰词为“不会”,名词为“手机号码”,其中,修饰词为否定词,此时,可以将隐私协议语句的标注信息确定为负相关;再如,隐私协议语句为“我们会获取您的地理位置”,目标词为“获取”,修饰词为“将会”,名词为“地理位置”,其中,修饰词为非否定词,此时,可以将隐私协议语句的标注信息确定为正相关。
123.进一步的,若目标词对应的名词不是预配置词性表中的词,可以将隐私协议语句
的标注信息确定为无关操作。
124.通过上述步骤s710~s740,可以根据隐私协议语句中的词的词性确定目标词,根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词,在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关,在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关。
125.在本公开的一种示例实施例中,如图8所示,可以获取应用程序的apk(android application package,android应用程序包)文件,获取应用程序的权限和api(application program interface,应用程序接口),模拟运行触发系统事件,获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本,删除隐私协议文本中的第二目标字符,根据词相关信息与预配置词性表确定隐私协议语句的标注信息,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
126.在本公开的一种示例实施例中,如图9所示,可以获取隐私协议文本,将隐私协议文本处理为多个隐私协议语句,对隐私协议语句进行分类(例如收集个人数据、数据存储期限、收集个人数据的目的、开发者联系方式、访问个人信息的权利、修改或删除个人数据的权利、限制或拒绝处理数据的权利、数据携带权、申诉权利或渠道、儿童个人信息处理等,可以通过tf-idf将隐私协议语句向量化,再通过bert模型对隐私协议语句进行分类),可以获取应用程序的apk文件,获取应用程序运行时所抓取的个人信息,根据具有类别的隐私协议语句与个人信息进行一致性分析,确定应用程序的合规信息。
127.在本公开的一种示例实施例中,如图10所示,可以获取隐私协议文本,在预处理模块中将隐私协议文本处理为多个隐私协议语句,通过自然语言处理模块获取隐私协议语句中各词的词相关信息,在检测模型中根据词相关信息与预配置词性表确定隐私协议语句的标注信息,根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
128.本公开的一种实施例提供的合规判别方法中,可以获取应用程序运行时所抓取的个人信息,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。通过本公开的实施例,可以自动判别应用程序是否合规,无需评估人员逐一对比,减少了人力物力消耗,提升了隐私合规评估的效率,从而提升了应用程序的上线效率。
129.需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
130.此外,在本公开的示例性实施方式中,还提供了一种合规判别装置。参照图11所示,一种合规判别装置1100包括:个人信息获取模块1110、隐私文本处理模块1120和合规判别模块1130。
131.其中,个人信息获取模块,用于获取应用程序运行时所抓取的个人信息;隐私文本处理模块,用于获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;合规判别模块,用于将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
132.在本公开的一种示例性实施例中,基于前述方案,获取应用程序对应的隐私协议文本,装置还包括:界面组件获取单元,用于获取应用程序的界面组件;隐私协议链接获取
单元,用于根据界面组件获取隐私协议文本对应的隐私协议链接,通过隐私协议链接获取隐私协议文本。
133.在本公开的一种示例性实施例中,基于前述方案,将隐私协议文本处理为多个隐私协议语句,装置还包括:字符类型获取单元,用于获取隐私协议文本中的多个字符,获取字符对应的字符类型;协议语句划分单元,用于根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句。
134.在本公开的一种示例性实施例中,基于前述方案,根据字符对应的字符类型将隐私协议文本划分为多个隐私协议语句,装置还包括:字符替换单元,用于将隐私协议文本中的第一目标字符替换为换行符,得到多个隐私协议语句;其中,第一目标字符为多个字符中的至少一个,第一目标字符的字符类型为结束字符类型。
135.在本公开的一种示例性实施例中,基于前述方案,在将隐私协议文本中的第一目标字符替换为换行符,得到多个隐私协议语句之前,装置还包括:字符删除单元,用于删除隐私协议文本中的第二目标字符;其中,第一目标字符为多个字符中的至少一个,第二目标字符的字符类型为非结束字符类型。
136.在本公开的一种示例性实施例中,基于前述方案,隐私协议语句中包括多个词,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息,装置还包括:词相关信息获取单元,用于获取隐私协议语句中各词的词相关信息;标注信息确定单元,用于根据词相关信息与预配置词性表确定隐私协议语句的标注信息;其中,预配置词性表中包括多个词性列表,词性列表中包括多个词,各词性列表对应的词性不同,标注信息用于指示隐私协议语句对应的隐私获取方案的正负相关性;合规信息判别单元,用于根据个人信息与隐私协议语句的标注信息确定应用程序的合规信息。
137.在本公开的一种示例性实施例中,基于前述方案,词相关信息包括索引值、词内容、起始结束位置以及词性,根据词相关信息与预配置词性表确定隐私协议语句的标注信息,装置还包括:目标词确定单元,用于根据隐私协议语句中的词的词性确定目标词;其中,目标词的词性为动词,目标词为预配置词性表中的词;词性获取单元,用于根据词的索引值以及词的起始结束位置查找目标词的修饰词以及目标词对应的名词;负相关确定单元,用于在修饰词为否定词时,将隐私协议语句的标注信息确定为负相关;其中,否定词为预配置词性表中的词;正相关确定单元,用于在修饰词为非否定词且名词为预配置词性表中的词时,将隐私协议语句的标注信息确定为正相关;其中,非否定词为预配置词性表中的词。
138.由于本公开的示例实施例的合规判别装置的各个功能模块与上述合规判别方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的合规判别方法的实施例。
139.应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
140.此外,在本公开的示例性实施例中,还提供了一种能够实现上述合规判别方法的电子设备。
141.所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或
程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
142.下面参照图12来描述根据本公开的这种实施例的电子设备1200。图12显示的电子设备1200仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
143.如图12所示,电子设备1200以通用计算设备的形式表现。电子设备1200的组件可以包括但不限于:上述至少一个处理单元1210、上述至少一个存储单元1220、连接不同系统组件(包括存储单元1220和处理单元1210)的总线1230、显示单元1240。
144.其中,存储单元存储有程序代码,程序代码可以被处理单元1210执行,使得处理单元1210执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,处理单元1210可以执行如图2中所示的步骤s210,获取应用程序运行时所抓取的个人信息;步骤s220,获取应用程序对应的隐私协议文本,将隐私协议文本处理为多个隐私协议语句;步骤s230,将个人信息与隐私协议语句进行比较,确定应用程序的合规信息。
145.存储单元1220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)1221和/或高速缓存存储单元1222,还可以进一步包括只读存储单元(rom)1223。
146.存储单元1220还可以包括具有一组(至少一个)程序模块1225的程序/实用工具1224,这样的程序模块1225包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
147.总线1230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速开放端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
148.电子设备1200也可以与一个或多个外部设备1270(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1200交互的设备通信,和/或与使得该电子设备1200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口1250进行。并且,电子设备1200还可以通过网络适配器1260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图12所示,网络适配器1260通过总线1230与电子设备1200的其它模块通信。应当明白,尽管图12中未示出,可以结合电子设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
149.通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
150.在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实
施例的步骤。
151.计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
152.可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
153.可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
154.此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
155.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1