本发明涉及网络数据管理,具体为基于大数据的服务器隐私保护系统。
背景技术:
1、随着科技网络的不断发展,网络终端系统通过视频自动定位用户的所处位置、声音等信息获取用户的偏好内容,并在各种客户端进行推送,即使是用户的年龄、居住城市、性别、职业范围,甚至更精微的开车类型、宠物种类、健身器材等等……这些信息是可以通过日常行为记录和分析的。同时,由于客户端之间的数据大多都是互通的,用户在各种软件上的行为都被开源然后汇集,在各个软件的手机号注册、以及不注册但记录在ip地址、imei设备串号上的各类信息,都会在客户端服务器内进行存储。
2、但系统在对用户的偏好进行分析、提取和推送的过程中,无法了解用户对于信息推送的兴趣度,由于部分推送信息的信息拾取度不够,导致这些推送对用户起不到帮助的作用,尤其在推送信息时间过于频繁的情况下,还可能侵犯到用户的隐私,大大影响用户使用设备的体验。因此,设计检测信息覆盖能力强和人性化程度高的基于大数据的服务器隐私保护系统是很有必要的。
技术实现思路
1、本发明的目的在于提供基于大数据的服务器隐私保护系统,以解决上述背景技术中提出的问题。
2、为了解决上述技术问题,本发明提供如下技术方案:基于大数据的服务器隐私保护系统,包括数据采集模块、数据分析模块和输出模块,所述数据采集模块用于获取客户端中分析的用户偏好数据结果;所述数据分析模块用于对偏好数据是否对用户的隐私产生显著侵害进行分析判断;所述输出模块用于对推送给用户的数据信息进行测试反馈,并进行推送模式的参数改进,所述数据采集模块、所述数据分析模块和所述输出模块相互通讯连接。
3、根据上述技术方案,所述数据采集模块包括偏好数据提取模块和用户信息采集模块,所述偏好数据提取模块用于提取客户端采集的用户偏好信息;所述用户信息采集模块用于获取用户的个人信息。
4、根据上述技术方案,所述数据分析模块包括时间系数分析模块和信息公开分析模块,所述时间系数分析模块用于获取客户端采集的用户信息的时效性参数;所述信息公开分析模块用于分析对用户推送公开目标信息的合理性。
5、根据上述技术方案,所述信息公开分析模块进一步包括信息关联性检测子模块和可接受系数检测子模块,所述信息关联性检测子模块用于获取用户在各类平台内检索信息的关联度参数;所述可接受系数检测子模块用于判断当前类型的偏好信息是否合适继续推送。
6、根据上述技术方案,所述输出模块包括信息屏蔽模块和推送模块,所述信息屏蔽模块用于输出屏蔽推送该类信息的指令;所述推送模块用于输出可推送该类信息的指令。
7、根据上述技术方案,所述服务器隐私保护系统的运行方法主要包括以下步骤:
8、步骤s1:在客户端内接入服务器隐私保护系统,提取客户端获取的用户偏好信息和用户个人信息数据;
9、步骤s2:系统通过对用户偏好数据的时间系数、浏览数据的信息关联性进行分析,并预测用户对个人信息被公开的可接受程度;
10、步骤s3:接入测试模块将试推送的目标信息向用户进行推送,通过反馈结果子模块判断用户的反馈情况,判断当前类型的偏好信息是否合适继续推送;
11、步骤s4:系统将偏好信息通过信息屏蔽模块和推送模块分别实现屏蔽和推送指令。
12、根据上述技术方案,所述步骤s2进一步包括:
13、步骤s21:时间系数分析模块将客户端获取的偏好信息的时间节点数据进行记录,获取检测的每一个时间节点距离当前时间的经过时间值从低到高排列分别为t1、t2……tn+1,则用户偏好数据的浏览时间间隔其中n为记录时间节点的间隔数量,则该数据的用户最近一次浏览的时间差其中a的单位为小时;
14、步骤s22:时间系数分析模块将所述步骤s21获取的时间节点中随机选取两个末始时间节点的时间节点,将两个选取时间节点的间隔时间设置为监测时间段,对监测时间段内的出现的时间节点次数进行记录,偏好信息在监测时间段内出现一次偏好信息的平均出现时间为其中t0为监测时间段的时间间隔值,t0的单位为小时,k为监测时间段内出现的偏好信息次数;步骤s23:时间系数分析模块将所述步骤s22获取的监测时间段内偏好信息在客户端内出现的k次浏览信息,将k次浏览信息的浏览时长数据进行记录,同时获取浏览信息时长的最小值t1和浏览信息时长的最大值t2,计算浏览时长差值t差=t2-t1,将记录为取样浏览时长数据的平均值,其中浏览信息时间t的单位为秒,φ为构件时间系数模型的参数倍率匹配值;
15、步骤s24:建立以用户浏览时间差记录为时间系数模型的x轴,以监测时间段内浏览记录出现间隔时间记录为时间系数模型的y轴,以取样浏览时长数据记录为时间系数模型的z轴的空间直角坐标系,其中坐标原点的坐标为(0,0),x轴正半轴的长度为用户最近浏览时间差a,y轴正半轴的长度为平均出现时间δt,z轴正半轴的长度为取样浏览时长数据的差值h。
16、根据上述技术方案,所述步骤s3进一步包括:
17、步骤s31:信息关联性检测子模块在偏好信息中随机选取一个非链接形式的偏好参照信息,并获取不同客户端内被录入偏好的信息与目标参照信息的关联阈值;
18、步骤s32:关联性阈值x在时间系数模型中,当前时间系数模型的总体积v=ahδt,当时间系数模型的体积高于额定值v0时,时间系数分析模块将偏好信息数据记录进入信息关联性检测子模块;
19、步骤s33:在所述步骤s23中随机选定一个目标偏好信息,获取目标偏好信息对应的用户最近浏览时间差目标偏好信息对应的平均出现时间目标偏好信息对应的取样浏览时长数据为hg,则目标偏好信息在空间直角坐标系的坐标为(ag,δtg,hg);
20、步骤s34:可接受系数检测子模块对预推送的偏好信息是否会对用户产生隐私侵犯的可能进行分析。
21、根据上述技术方案,所述步骤s31中,获取不同客户端内被录入偏好的信息与目标参照信息的关联阈值的具体方法包括:
22、将同一客户端内用户浏览信息中进入历史界面后,通过历史界面的链接进入目标偏好信息界面的对应时间节点,并获取用户第二次通过历史订单界面进入偏好信息界面所跨越的l个时间节点,若检测到所述l个时间节点完全包含所述步骤s23中的k个时间节点,将关联阈值设置为η1%;若检测到l个时间节点完全未包含步骤s23中的k个时间节点,将关联阈值设置为η2%;若检测到l个时间节点部分包含步骤s23中的k个时间节点,将关联阈值设置为η3%,其中η1、η2、η3分别为k个时间节点内在不同包含情况下进入历史界面跨越节点的比率值。
23、根据上述技术方案,所述步骤s33中,预推送的偏好信息是否会对用户产生隐私侵犯的可能的分析方法具体包括:
24、步骤s331:在所述步骤s2构建的空间直角坐标系内,系统检测的目标偏好信息对用户隐私的侵犯可能率其中λ为关联阈值比率值;
25、步骤s332:当检测目标偏好信息对用户隐私侵犯可能率高于安全限定值后,判断当前类型的偏好信息不合适继续推送,否则判断当前类型的偏好信息合适继续推送,并将对应的判断结果输入输出模块。
26、与现有技术相比,本发明所达到的有益效果是:本发明,通过时间系数分析模块将用户浏览记录的时间节点相关信息进行提取和处理,依次将用户最近浏览时间差a、平均出现时间δt和取样浏览时长数据的差值h作为时间系数模型的空间直角坐标系内的x、y和z轴,将用户对于偏好信息的浏览参数进行立体可视化,提高了用户隐私保护的检测维度,增加了检测的精准性和人性化程度;通过信息公开分析模块,将用户浏览记录构建的时间系数模型通过检测模型面积的方式进行逼近,并通过提取在监测时间段内的随机时间节点,不仅具有足够的随机性,也能保证抽取的时间节点在构建的时间系数模型内,保证抽检的准确性。