一种信息监控方法及装置、终端及存储介质与流程

文档序号:24046321发布日期:2021-02-23 18:54阅读:96来源:国知局
一种信息监控方法及装置、终端及存储介质与流程

[0001]
本发明实施例涉及信息处理领域,特别涉及一种信息监控方法及装置、终端及存储介质。


背景技术:

[0002]
当前智能手机拥有的第三方应用越来越丰富,用户在使用第三方应用服务的同时却很难避免被获取到一些个人隐私消息,一旦一些恶意的或者安全意识不强的应用把这些隐私信息通过未加密的通信协议上传到网络环境中,就有可能造成用户的隐私信息泄露,因此,及时对这类不安全的应用操作进行识别拦截从而保护用户的隐私信息安全变的越来越重要。


技术实现要素:

[0003]
本发明实施方式的目的在于提供一种信息监控方法及装置、终端及存储介质,至少解决用户的隐私信息因第三方应用恶意或者安全意识不够而暴露在不安全的网络环境中的问题,同时尽可能减少监控应用发出的信息对网络性能的影响。
[0004]
为解决至少上述技术问题,本发明的实施方式提供了一种信息监控方法及装置、终端及存储介质,包括:在系统层截获目标应用发出的上行消息,将上行消息转发至应用层,在应用层对上行消息进行检测;当上行消息包含用户隐私信息时,拦截上行消息并通知用户。
[0005]
本发明的实施方式还提供了一种应用信息监控装置,包括:截获单元,用于在系统层截获各应用发出的上行消息,并将上行消息转发至应用层;检测单元,用于在应用层对上行消息进行检测;处理单元,在上行消息包含用户隐私信息时,拦截上行消息并通知用户。
[0006]
本发明的实施方式还提供了一种终端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述信息监控方法。
[0007]
本发明的实施方式还提供了一种计算机可读存储介质,用于存储有计算机程序,计算机程序用于供计算执行上述信息监控方法。
[0008]
本发明实施方式相对于现有技术而言,通过设计一种信息监控方法来替代vpn服务来对用户隐私信息进行监控,如果判断包含用户隐私信息,则将该消息拦截并通知用户,以此防止用户隐私信息不被泄露。同时监控仅针对应用的上行消息,因此对信息的监测更有针对性,使得监控对网络性能的影响降到最低,从而减少了网络延迟的可能,提升了用户的体验。
[0009]
另外,将上行消息转发至应用层前,还包括:根据预先设置的白名单,判断上行消息的来源应用是否存在于白名单中,当上行消息的来源应用存在于白名单中,则发送上行消息;当上行消息的来源应用不存在于白名单中,则将上行消息转发至应用层。存在于白名单的应用发出的上行消息不需要被监控,因而设置白名单除了增加系统可定制性灵活性之
外,更能减少系统不必要的计算开销,以增加整体性能。
[0010]
另外,白名单通过下述一种或多种方法预先设置:系统自动设置白名单与用户自定义白名单;其中,系统自动设置白名单中包含下述一种或多种应用:无联网权限应用、系统应用和厂商设置应用;用户自定义白名单由用户手动添加。系统自动设置白名单不需要用户手动执行,因而既能给用户简洁的使用体验,又能避免用户没有设置而加重系统计算负担。用户自定义白名单可让用户自主添加信任应用,提升了用户体验。
[0011]
另外,在应用层对上行消息进行检测前,还包括:判断上行消息是否加密,如果上行消息加密,则发送上行消息,如果上行消息未加密,则在应用层对上行消息进行检测。如果上行消息已加密,说明该上行消息不存在泄露用户隐私信息的风险,因此该上行消息无需进行检测,由此可以减轻系统计算负担。
[0012]
另外,在应用层对上行消息进行检测,包括:采用预先训练的词嵌入降维贝叶斯分类算法作为主算法对上行消息进行检测;若主算法检测到的上行消息含有用户隐私信息的概率小于第一预设阈值时,判定上行消息不含有用户隐私信息;若主算法检测到的上行消息含有用户隐私信息的概率大于第二预设阈值时,判定上行消息含有用户隐私信息;若主算法检测到的上行消息含有用户隐私信息的概率大于第一预设阈值,且小于第二预设阈值时,采用辅助检测算法对上行消息进行二次检测;其中,第一预设阈值小于第二预设阈值。采用词嵌入降维贝叶斯分类算法能大大的降低检测算法所处理的数据复杂度,显著提升检测算法的效率,同时为了在保证效率的同时确保检测结果的的可靠性,增加辅助检测算法进行二次判断,可以显著提升算法整体的准确率。由于大部分情况只需要执行高速算法,所以整体上检测流程的耗时仍然可以维持足够低。因此借助这个两步流程,使得检测流程能够同时保证高速和高准确率。
[0013]
另外,辅助检测算法为一维卷积神经网络。一维卷积神经网络算法为深度学习,可靠性很高,可以显著提升算法整体的准确率。
[0014]
另外,在应用层对上行消息进行检测,还包括:虚拟专用网络vpn服务开启,当上行消息不含用户隐私信息时,通过虚拟专用网络vpn服务发送上行消息。当vpn服务开启,应用层转发来的上行消息经检测完成后再转发至vpn应用,由vpn来进行发送,因此vpn和本发明的服务均可独立开关,互不干扰。
附图说明
[0015]
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
[0016]
图1是根据本发明第一实施方式中的一种信息监控方法流程图;
[0017]
图2是根据本发明第一实施方式中的信息监控方法的示意图;
[0018]
图3是根据本发明第一实施方式中的隐私保护两种检测算法的检测流程图;
[0019]
图4是根据本发明第一实施方式中的主算法流程图;
[0020]
图5是根据本发明第一实施方式中的辅助检测算法流程图;
[0021]
图6是根据本发明第二实施方式中的一种信息监控方法流程图;
[0022]
图7是根据本发明第三实施方式中的一种信息监控方法流程图;
[0023]
图8是根据本发明第四实施方式中的一种信息监控方法流程图;
[0024]
图9是根据本发明第四实施方式中的信息监控方法的示意图;
[0025]
图10是根据本发明第六实施方式中的一种信息监控装置示意图;
[0026]
图11是根据本发明第七实施方式中的电子设备结构示意图。
具体实施方式
[0027]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
[0028]
本发明的第一实施方式涉及一种信息监控方法,具体可应用在各种终端设备上,如用户手机,平板电脑等,在此不一一赘述。在本实施方式中,在系统层截获各应用发出的上行消息,将上行消息转发至应用层,在应用层对上行消息进行检测,判断上行消息是否含有用户隐私信息;如果上行消息包含用户隐私信息,则拦截上行消息并通知用户,否则,发送上行消息。
[0029]
下面对本实施方式的信息监控方法的实现细节进行具体地说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
[0030]
本实施方式中的信息监控方法的流程图如图1所示,包括:
[0031]
步骤101,在系统层截获目标应用发出的上行消息。
[0032]
具体地说,当前智能手机拥有丰富的第三方应用,当第三方应用发出网络请求,该网络请求可能携带上传各种用户信息,其中就可能含有用户隐私信息。如图2所示,为了对目标应用11发出的上行消息进行监控,具体可以在系统层20设置一个虚拟模块21,例如一个虚拟网卡,用于截获目标应用11发出的上行消息。
[0033]
可以注意的是,此处截获的消息特指上行消息,下行消息按照正常逻辑直接发送给应用,就无需对下行消息进行监控,可以理解的是,用户接收的信息不可能存在隐私信息被泄露的风险,通过这种方式使得尽量少的数据进行监控,由此可以将监控对网络性能的影响降到最低,从而减少了网络延迟的风险,提升了用户的体验。
[0034]
步骤102,将上行消息转发至应用层。
[0035]
具体地说,目标应用11的上行消息经虚拟模块21截获后,由该虚拟模块21发送至应用层10。具体可以是虚拟模块21将所拦截的上行消息发送给工作在应用层10的检测模块12。
[0036]
步骤103,在应用层对上行消息进行检测。
[0037]
具体地说,截获后的目标应用上行消息在应用层10的检测模块12处进行检测,具体可以是某个检测应用,该检测应用采用特定的检测算法,对目标应用的上行消息是否包含用户隐私信息进行检测,并输出检测结果。具体的检测算法将在本实施例的具体实施步骤说明后进行详细的介绍。
[0038]
步骤104,当上行消息包含用户隐私信息时,执行步骤105,否则,执行步骤106。
[0039]
具体地说,根据步骤103所得的检测结果,判定得到上行消息是否含有隐私消息;
根据不同的判定结果,来执行后续的处理。
[0040]
步骤105,拦截上行消息并通知用户。
[0041]
具体地说,将判断为包含用户隐私的上行消息暂时拦截,并向用户发出警告,向用户发出的警告信息,包含本次检测的详细内容,然后可以由用户决定下一步执行什么操作,用户可以选择忽略警告继续发送或者立刻拦截并删除这个上行消息。
[0042]
步骤106,发送上行消息。
[0043]
检测应用对目标应用上行消息的检测通过后,放行该上行消息,直接由系统层20发送至外部网络30。
[0044]
对目标应用的上行消息是否含有用户隐私信息的判断,需要实时识别检测模块上的上传信息,因而对检测算法的性能有着极高的要求。为此本实施方式提出了一种基于词嵌入的聚类降维技术,该算法技术能够把消息中范围极大的词语空间压缩到有限的几个核心语义类别中,将内容机器复杂的消息体提炼为由一些语义标签组成的特征,再以处理后的特征为主体进行隐私信息检测,这种方案能大大的降低检测算法所处理的数据复杂度,显著提升检测算法的效率,从而保证这项技术具有实际的商用基础。
[0045]
为了在保证效率的同时确保检测结果的的可靠性,在采用降维优化策略的同时,本实施方式设计了一套检测流程,如图3所示,采用主算法和辅助检测算法组合为一个检测流程,其中主算法为预训练词嵌入降维贝叶斯分类算法,辅助检测算法为分段式一维卷积神经网络分类算法,当主检测算法的后验概率置信度达到一定的阈值要求时,由辅助检测算法进行二次判断,由此将虚警率和漏检率都控制在最低,该检测流程具体包括:
[0046]
步骤1101,通过主算法计算得到包含隐私信息的后验概率置信度。
[0047]
主算法采用的预训练词嵌入降维贝叶斯分类算法基于贝叶斯公式,具体包括词嵌入、聚类和lda主题模型。基于以上三个概念,主算法专为本实施方式的应用场景定制,判断是否包含敏感信息不需要关注词的细微语义和顺序结构,于是通过嵌入编码和分类降维操作去除这些多余信息只保留核心特征。在显著降低算法计算复杂度提升速度的同时仍能保持高准确率。主算法流程图如图4所示,具体包括如下步骤1201至步骤1205:
[0048]
步骤1201,首先待检测的文本经过分词,由文本分解为词语集合。
[0049]
具体地说,在分词算法中,可以使用频率作为概率来进行计算,在给定待检测文本中,我们以词为单位进行统计,统计出每个词出现的频率,将所有可能的分词结果统计出来,从而形成词语集合。
[0050]
步骤1202,然后这些词通过预训练的词嵌入模型被转换为向量编码。词嵌入模型是预训练的,这个转化过程效率很高。
[0051]
具体地说,词嵌入是近些年自然语言处理领域发展出的一种词编码技术,通过一定的规则把自然词语映射到一个高维向量空间中,用相同维度的向量表示各个词语,并且尽量保证相近语义的词其向量距离也更近。词嵌入通常用于自然语言识别深度学习的预处理,本实施方式提出的算法则把这项技术用于词特征提取以便进行分类降维。实际中词嵌入的结果应为一高维向量,语义相近的词语编码后的向量距离也更相近。
[0052]
步骤1203,转化后的向量编码实际上已经包含了语义特征,可以直接用于降维。降维过程是通过k近邻分类算法将编码后的词语分到预先设定的k个语义类中。其中这k个语义类的中心是通过k-means聚类算法预先训练得到,分类过程也非常高效。
[0053]
具体地说,聚类是应用k-means聚类算法将消息体中的大量词语聚类为有限个中心语义分类,并给出各个中心语义对应的向量特征以及与敏感信息之间的关系。这一步操作为预处理,聚类结果和关系参数在计算完成后写入算法直接使用。这项机制能显著降低正式检测时算法所需处理数据的复杂度,大大提高检测速度并且不会降低检测的准确性。
[0054]
步骤1204,分类降维后消息被转换成由若干个语义类组成的特征向量,特征维度比起降维前大大降低,这会降低后续计算的运算量。
[0055]
具体地说,聚类在词嵌入编码的基础上进行,大量的词库被聚类成若干个语义类,语义类的数量远小于词语的数量。在使用时用语义类代替词语也就完成了降维。
[0056]
步骤1205,消息的特征向量会被带入贝叶斯公式求解其包含敏感信息的后验概率,通过计算结果完成检测。
[0057]
具体地说,lda主题模型是一种贝叶斯模型,其基本假设是不同主题(包含或不包含隐私信息)的消息存在不同的词频分布概率,因此可以通过一则消息中不同词语的分布来推断这则消息的主题。只不过这个推断过程建立的在严格的贝叶斯公式基础上,因此比起普通方法,lda模型具有更高的可靠性。
[0058]
为了用lda模型对拦截到的消息进行分类,需要指定一些模型参数。这些参数可通过训练获取,假设有训练集ω={ω1,ω2,...ω
m
},其中,ω为文档中的词语,使用最大似然方法估计模型参数:
[0059][0060]
其中,其中α为每篇文档主题分布的dirichlet prior(狄利克雷先验)的参数,也就是文档主题的先验权值。η为每个主题单词分布的dirichlet prior(狄利克雷先验)的参数,也即一个主题中单词的先验权值。通常情况下认为所有主题的α和所有单词的η都是相等且稀疏的,均可用α和η表示,可通过上式用最大似然估计出参数α和η。
[0061]
以上参数训练为预训练,由厂商预先训练好之后写入应用不会影响用户使用时的速度。
[0062]
模型参数确定之后,也就相当于确定了包含用户隐私信息和不包含用户隐私信息两种类型消息中的不同词语的概率分布。这时拿到消息中的词频分布就能通过贝叶斯公式计算出这则消息针对不同主题的后验概率:
[0063][0064]
其中,假设θ
m
表示第m篇文档的主题分布,有θ
mk
=p(z
k

m
)。β
k
表示主题k的单词分布,有β
ki
=p(ω
i
|z
k
)。z
mn
为第m篇文档中第n个单词所属的主题。在现有观测到的词频ω
mn
下,就可通过上式的贝叶斯公式估计出θ
m

k
,z
mn
参数值。
[0065]
这时只要比较当前消息针对包含隐私信息和不包含隐私信息两种主题的后验概率大小就能完成的检测判断。这种算法速度快,准确率也不错,能够高效的筛选消息,把这项功能对用户体验的影响降至最小。这个算法的核心就是以效率为第一导向,所有耗时的步骤均通过预处理的方式预先计算,实际检测中执行的步骤既精简又高效,目的是将检测过程对用户体验的影响降到最低。
[0066]
以上步骤通过主算法得到后验概率置信度,根据该计算结果执行以下两种检测算
法组合的检测流程的下一步骤1102,对后验概率置信度的结果进行判断:
[0067]
步骤1102,判断所得后验概率置信度是否小于第一阈值,本实施例中采用0.25,但并不局限于此数值,当分类置信度小于第一阈值时,执行步骤1104,即判定检测结果不包含隐私信息;否则,执行步骤1103。
[0068]
具体地说,通过主算法得到的后验概率置信度,判断当该数值小于第一阈值时,判定上行消息不含有隐私信息,当该数值不小于第一阈值时,继续执行下一步骤1103进行判断,其中,第一阈值不限于本实施例中的0.25。
[0069]
步骤1103,判断所得后验概率置信度是否大于第二阈值,本实施例采用0.75,但并不局限于此数值。当分类置信度大于第二阈值时,执行步骤1105,即判定检测结果包含隐私信息,否则,执行步骤1106。
[0070]
具体地说,通过第一步中得到的后验概率置信度,判断当该数值大于第二阈值时,判定上行消息含有隐私信息,当该数值不大于第二阈值时,继续执行下一步骤1106进行判断,其中,第二阈值不限于本实施例中的0.75。
[0071]
步骤1106,利用辅助检测算法进行二次判断。
[0072]
虽然用主算法已经能够得到不错的效果,隐私信息检测这项功能要求更高的准确率,因为在这项技术的应用场景下,无论是漏报还是误报都会严重影响用户体验。大量漏报会让这项拦截机制失去意义,大量误报则会严重降低用户的使用体验,因此本实施方式在lda计算出的后验概率置信度不太高时引入一个准确性更高的算法进行二次判断,从而保证这项机制在整体速度和准确性方面都能达到要求的水平。
[0073]
辅助检测算法为一维卷积神经网络,这个方法拥有很高的准确度以及不错的速度,符合对二次判断算法的需求。通常在深度学习中,卷积神经网络用于图像的处理,而自然语言的分析中多使用循环神经网络,这种情况是由图像和自然语言的特点决定的,图像更在意某一特征和周围特征的关系以及要求特征具有平移不变性,而自然语言则更在意特征出现的顺序以及与前后语句的关系。
[0074]
而本实施方式中的隐私信息检测虽然属于语义识别却与自然语言处理的关注点存在很大区别,隐私识别面对的文本并非一个完整的语句,不存在连贯的语义,因此不必过多关注整个语句的顺序问题,尝试识别网络数据包的语义反而会造成问题。同时,隐私信息可能出现在数据包的任何位置,要求特征识别具有平移不变性,且隐私信息的特征通常存在于一个片段中,这些特征都表明,一维卷积神经网络更加符合需求,另外卷积神经网络的并行处理比循环神经网络的性能更高。
[0075]
在此基础上,为了进一步提高神经网络的运行速度,在不降低神经网络结果准确率的基础上,提出了分段式一维卷积神经网络模型。该模型复用主算法中词嵌入以及分类的中间计算结果,直接使用主算法中缓存的中间变量作为以为卷积神经网络的输入值。传统的神经网络主要包括嵌入层,卷积层,池化层,全连接层,最后输出为sigmod激活函数用于二分类。这样,就可以从传统的一维卷积神经网络中去除嵌入层、一层卷积和池化层,减少神经网络的深度和变量数,以显著提升运行速度。
[0076]
基于上述的原因,本实施方式提出的辅助检测算法流程图5所示,其中步骤1301、步骤1302和步骤1303为分段式的前半部分,实际与主算法的部分操作一致,可以直接利用主算法中词嵌入以及分类的中间计算结果,因此在实际中进行二次判断只需执行分段式的
后半部分以加快算法速度,具体流程包括:
[0077]
步骤1304,将主算法中间计算结果输入至一维卷积神经网络计算。
[0078]
步骤1305,利用全连接层输出分类结果。
[0079]
步骤1306,通过sigmod激活函数输出二分类结果。
[0080]
其中,绝大部分消息通过主算法就能检测成功,不需要执行二次判断。所以实际中这个流程会执行很快,保证总体上的高效率。少数情况下,主算法判断失败,由二次检测算法补充,二次检测算法为深度学习,可靠性很高,可以显著提升算法整体的准确率。发明中提出的这项检测流程能在速度和准确率中找到一个合适的平衡点,使检测过程整体既保持高速又保持高准确率,从而使得这项发明能够达到商用标准。
[0081]
以上步骤1301至步骤1306完成辅助检测算法,以下步骤1107为两种检测算法组合的检测流程的最后一步,即根据辅助检测算法的二次判断结果进行用户隐私消息判断:
[0082]
步骤1107,如果二次判断结果含有隐私消息,则执行步骤1105,即判定检测结果含有隐私信息;否则,执行步骤1104,即判定检测结果不含有隐私信息。
[0083]
具体地说,这一步通过设计的算法流程检查上行消息中是否包含用户隐私信息,如果上行消息中没有用户的隐私信息,说明这个上行消息不存在泄露用户隐私信息的风险,判定检测结果不含有隐私信息。如果在数据包中检测到了用户隐私信息,则说明这个上行消息包含用户隐私信息,存在很大隐私泄露风险,判定检测结果含有隐私信息。
[0084]
本实施方式通过对上传到网络中的应用信息进行监控,以防止用户隐私信息不被泄露,同时监控对象仅限于应用的上行消息,使得监控对网络性能的影响降到最低,从而减少了网络延迟的风险,提升了用户的体验。另外,比起现有基于vpn服务的检测技术,因本实施方式的功能模块完全内置于系统中,不会有多余的状态栏标识,也不会任务栏中驻留一个后台应用,因此本实施方式的方案能有效防止用户在清理后台进程的同时将检测应用的进程清除而引起功能异常,更重要的是能给用户一个简洁的使用体验。
[0085]
本发明的第二实施方式涉及一种信息监控方法。第二实施方式与第一实施方式大致相同,主要区别之处在于:在本发明第二实施方式中,预先设置白名单,根据设置的白名单,对目标应用的上行消息进行处理,如图6所示,包括:
[0086]
步骤201,在系统层截获各应用发出的上行消息。本步骤与第一实施方式的步骤101类似,在此不再赘述。
[0087]
步骤202,判断上行消息的来源应用是否存在于白名单中。
[0088]
具体地说,在该步骤中,白名单为可信任应用名单,即存在于白名单中的应用是不需检测的可信任应用,因此该应用发出的上行消息无需拦截检测。
[0089]
另外,白名单通过下述一种或多种方法预先设置:系统自动设置白名单与用户自定义白名单;其中,系统自动设置白名单中包含下述一种或多种应用:无联网权限应用、系统应用和厂商设置应用;用户自定义白名单由用户手动添加。其中,系统自动设置白名单中的三种应用仅为具体举例,但并不局限于此三种。用户设置白名单由用户手动添加,用户可以按照自己的使用需求设置白名单。
[0090]
存在于白名单的可信任应用发出的上行消息不需要拦截检测,因而设置白名单除了增加系统可定制性灵活性之外,更能减少系统不必要的计算开销,可以提高整体性能。另外通过将白名单分成系统自动设置白名单和用户自定义白名单,自动设置白名单不需要用
户手动执行,因而既能给用户简洁的使用体验,又能避免用户没有设置而加重系统计算负担。而用户设置白名单可让用户自主添加信任应用,避免了用户认定为可信任的应用被检测拦截的可能,从而提升了用户体验。
[0091]
步骤203,将上行消息转发至应用层。
[0092]
步骤204,在应用层对上行消息进行检测。
[0093]
步骤205,当上行消息包含用户隐私信息时,执行步骤206,否则,执行步骤207。
[0094]
步骤206,拦截上行消息并通知用户。
[0095]
步骤207,发送上行消息。
[0096]
本实施方式的步骤201、步骤203、步骤204,步骤205、步骤206以及步骤207分别与第一实施方式的步骤101、步骤102、步骤103、步骤104、步骤105以及步骤106类似,在此不再赘述。
[0097]
本发明第三实施方式涉及一种信息监控方法,如图7所示,第三实施方式与第二实施方式大致相同,主要区别之处在于:在本发明第三实施方式中,在应用层对上行消息进行检测前,还包括:判断上行消息是否加密,如果上行消息加密,则发送上行消息,如果上行消息未加密,则在应用层对上行消息进行检测。如图7所示,包括:
[0098]
步骤301,在系统层截获各应用发出的上行消息。本步骤与第二实施方式的步骤201类似,在此不再赘述。
[0099]
步骤302,判断上行消息的来源应用是否存在于白名单中。本步骤与第二实施方式的步骤202类似,在此不再赘述。在一个具体的实施例中,此步骤是可选的,并非实施本方案的必须。
[0100]
步骤303,将上行消息转发至应用层。
[0101]
步骤304,判断上行消息是否加密。
[0102]
具体地说,对获取的上行消息可以先进行初步检查,查看这个数据信息是否加密,比如说这个数据信息是否是加密的https协议,此处仅为举例,但并不局限于https加密协议。如果数据信息为加密的https协议,这证明上行消息就不会在传输过程中被监听,可以认为是安全的。则可以直接通过检测,发送该上行信息。如果上行消息是未加密的https协议,则认为存在安全风险,需转下一步继续检测。
[0103]
步骤305,在应用层对上行消息进行检测。
[0104]
步骤306,当上行消息包含用户隐私信息时,执行步骤307,否则,执行步骤308。
[0105]
步骤307,拦截上行消息并通知用户。
[0106]
步骤308,发送上行消息。
[0107]
本实施方式的步骤301、步骤302、步骤303、步骤305、步骤306、步骤307以及步骤308分别与第一实施方式的步骤201、步骤202、步骤203、步骤204、步骤205、步骤206以及步骤207类似,在此不再赘述。
[0108]
本实施例通过判断上行消息如果已经加密,认为该上行消息不存在泄露用户隐私信息的风险,因此该上行消息无需进行检测,由此可以减轻系统的计算负担。
[0109]
第一实施方式和第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
[0110]
本发明第四实施方式涉及一种信息监控方法,第四实施方式与第三实施方式大致相同,主要区别之处在于:如果用户开启了vpn服务,进入正常发送流程的请求会按照预定流程完成检测后被转发至vpn服务的应用,后续通信由vpn服务处理。隐私信息检测拦截功能的开启不会影响用户使用vpn服务。
[0111]
具体地说,如图8所示,包括:
[0112]
步骤401,在系统层截获各应用发出的上行消息。
[0113]
步骤402,判断应用是否存在于白名单中。
[0114]
步骤403,将上行消息转发至应用层。
[0115]
步骤404,判断上行消息是否加密。
[0116]
步骤405,在应用层对上行消息进行检测。
[0117]
步骤406,当上行消息包含用户隐私信息时,执行步骤408,否则,执行步骤409。
[0118]
本实施方式的步骤401、步骤402、步骤403,步骤404、步骤405、步骤406与第三实施方式的步骤301、步骤302、步骤303、步骤304、步骤305、步骤306类似,在此不再赘述。
[0119]
步骤407,vpn服务是否开启。
[0120]
检测模块与系统的vpn服务兼容,当用户开启vpn服务后,整个模块的架构如图9所示,vpn应用13与检测模块12处于串行处理的模式,上行消息先被第一虚拟模块21截获传送到检测模块12中进行检测,当检测流程结束,上行消息被再次发出时,才会按照正常的vpn服务通过第二虚拟模块22被转发至vpn应用13,最后通过vpn网关40发送上行消息,即完成步骤410。对于vpn服务来说接收到的信息数据是否经过检测不会产生影响,因此发明中的检测流程对于vpn服务来说是透明的,两者可以同时开启。
[0121]
步骤408,拦截上行消息并通知用户。
[0122]
步骤409,发送上行消息。
[0123]
本实施方式的步骤408和步骤409分别与第三实施方式的步骤307和308类似,在此不再赘述。
[0124]
步骤410,通过vpn服务发送上行消息。
[0125]
该步骤如步骤407中阐释,在此不再赘述。
[0126]
在本实施例这种模式下,不论是被检测的应用还是用户开启的vpn服务,都不会感知到检测模块的存在。也就是说,本实施方式中的检测模块不会影响任何手机本身的使用功能,因而vpn和本实施方式的服务均可独立开关,两者互不干扰。
[0127]
本发明第五实施方式涉及一种信息监控方法,第五实施方式与第四实施方式大致相同,主要区别之处在于:在本发明第五实施方式中,系统层的隐私检测功能可以关闭。
[0128]
按照设定的规则,系统层检测隐私信息检测功能的开启状态,如果检测功能未开启,则这个请求进入正常通信流程准备发送。如果检测功能开启,这个网络请求的数据包就会被传送至下一步骤执行检测。本实施用户可以选择关闭隐私检测,因此可以提升用户体验。
[0129]
第四实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第四实施方式中。
[0130]
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围
内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
[0131]
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
[0132]
本发明第六实施方式涉及一种信息监控装置600,如图10所示,该装置可以包括,但不限于下述单元。
[0133]
截获单元601,用于在系统层截获各应用发出的上行消息,并将上行消息转发至应用层;
[0134]
检测单元602,用于在应用层对上行消息进行检测;
[0135]
处理单元603,在上行消息包含用户隐私信息时,拦截上行消息并通知用户。
[0136]
在一个具体的实施例中,截获单元601还可以根据预先设置的白名单,判断上行消息的来源应用是否存在于白名单中,如果存在于白名单中,则直接发送上行消息,如果不存在于白名单中,则再将上行消息转发至应用层。
[0137]
在一个具体的实施例中,白名单通过下述一种或多种方法预先设置:系统自动设置白名单与用户自定义白名单;其中,系统自动设置白名单中包含下述一种或多种应用:无联网权限应用、系统应用和厂商设置应用;用户自定义白名单由用户手动添加。
[0138]
在一个具体的实施例中,检测单元602具体用于在应用层对上行消息进行检测前,判断上行消息是否加密,如果上行消息加密,则发送上行消息,如果上行消息未加密,则在应用层对上行消息进行检测。
[0139]
在一个具体的实施例中,检测单元602具体用于采用预先训练的词嵌入降维贝叶斯分类算法作为主算法对上行消息进行检测;若主算法检测到的上行消息含有用户隐私信息的概率小于第一预设阈值时,判定上行消息不含有用户隐私信息;若主算法检测到的上行消息含有用户隐私信息的概率大于第二预设阈值时,判定上行消息含有用户隐私信息;若主算法检测到的上行消息含有用户隐私信息的概率大于第一预设阈值,且小于第二预设阈值时,采用辅助检测算法对上行消息进行二次检测;其中,第一预设阈值小于第二预设阈值。
[0140]
在一个具体的实施例中,辅助检测算法为一维卷积神经网络。
[0141]
在一个具体的实施例中,处理单元603具体用于当vpn服务开启时,通过vpn服务发送上行消息。
[0142]
由于第一实施方式与本实施方式相互对应,因此本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,在第一实施方式中所能达到的技术效果在本实施方式中也同样可以实现,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
[0143]
本发明第七实施方式涉及一种终端,如图11所示,包括至少一个处理器701;以及,与至少一个处理器701通信连接的存储器702;其中,存储器702存储有可被至少一个处理器701执行的指令,指令被至少一个处理器701执行,以使至少一个处理器701能够执行上述信
息监控方法。
[0144]
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
[0145]
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
[0146]
本发明第六实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
[0147]
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0148]
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1