一种基于双重信任检验的提高Skyline数据质量的采集方法

文档序号:32658904发布日期:2022-12-23 22:48阅读:来源:国知局

技术特征:
1.一种基于双重信任检验的提高skyline数据质量的采集方法,其特征包括以下步骤:(1)系统平台初始知道部分用户和工人是可信的。可信工人的数据和可信用户的评价是真实的,其信任度是稳定的;恶意用户和恶意工人会提供虚假的数据来破坏skyline数据的采集;当用户发布需要采集数据的任务时,有m个工人收到用户的请求,并向平台申请数据采集,通过下面的方法提高skyline数据质量的采集;(2)系统平台收到m个工人的申请后,按下面的方法选取工人:先采用四种交叉验证的方法(双重信任检验)来获得工人可靠的信任评价;在此基础上,基于概率天际线计算进行工人选择,为报告数据选择高信任度和高任务相似度的工人,提高skyline数据质量的采集;(3)双重信任检验的方法如下所示:系统定义k个信任等级,检验阈值为同一类型数据去掉最大值和最小值后的平均值;检验过程是将新数据与相应的检验阈值进行比较。不同的数据差值d对应不同的信任等级l,如以下公式所示:(a)首先,通过可信工人提交的数据来验证其他信任度未知工人的可信度。令工人i为可信的工人,可信工人提交的数据为data
i
。用data
i
来检验其他工人提交的数据,并根据其他工人提交的数据与data
i
之间的差异程度,将其他工人划分为不同的信任等级。如果新工人是可信的,则将其添加到可信的工人队列并更新可信数据的阈值;(b)其次,通过可信用户对数据的评价来验证其它信任度未知用户的信任度。设用户j为可信的用户;设可信用户j提交对数据的评价γ
i
;将其它用户提交的评价与γ
i
进行比对,依据其它用户提交的评价与γ
i
的差异程度,将其他用户归入不同的信任等级;(c)然后,通过用户对可信工人提交的可信数据的评价来验证其信任度;由于对可信数据的评价是好的评价,因而其评价结果是已知的;则可以通过这些用户的评价与正确评价结果的差异程度而将这些用户归入不同的信任等级;(d)最后,通过可信用户的评价给出信任度未知工人的信任度评价;由于可信用户的评价是真实的评价,因而直接反映了工人提交的数据的好坏。依据可信用户对数据评价的好坏而将这些工人归入不同的信任等级;(4)基于概率天际线计算进行工人选择的方法如下所示:(a)首先,求出每个工人概率天际线值:ps-score;ps-score表示一个对象在天际线中被选中的概率,可用于计算mcs任务中工人的数据质量;工人a的概率天际线值计算为:其中,
上式中,ps-score是工人的概率天际线值,a和b是两个不同的对象,a包含u元组(a=a1,a2,a3,

,a
u
),b包含v元组(b=b1,b2,b3,

,b
v
),|a|和|b|分别是对象中元组的数量,且对象中每个元组都有相同的出现概率,p
r
(a
i
)是a中a
i
一个元组的天际线概率,p
r
(a<b)是在a
i
∈a和b
j
∈b中a主导b(a<b)的主导性概率,u和v分别是对象a和对象b的元组数量。(b)其次,系统只选择满足阈值范围内匹配的工人,优先考虑ps-score较高的工人;工人都有五种数据,即信任等级l,传感位置r,工人要价p,任务相似度s和ps-score;根据任务实际需求合理设置阈值t序列,t
1-t4对应着信任等级,传感位置,工人要价和任务相似度阈值;第一,选择l≤t1,r≤t2,p≥t3,s≥t4的工人作为匹配工人集;第二,将第一位匹配工人添加到天际线队列skyline中,他的ps-score记为ps
min
,并从匹配工人集中删除;第三,其他已匹配工人将不断与skyline中的工人进行比较,如果他没有被所有的skyline工人所主导(ps
i
>ps
min
),那么将他添加到skyline中,并从匹配工人集中删除;否则,将直接从匹配工人集中删除他。对其余工人重复上述步骤,直到skyline中有用户指定数量的工人或者遍历完成。

技术总结
本发明公开了一种基于双重信任检验的提高Skyline数据质量的采集方法,采用四种交叉验证的方法来获得工人可靠的信任评价,信任度未知工人与可信工人/可信用户的检验,信任度未知用户与可信用户/可信工人的检验。在此基础上,基于概率天际线计算进行工人选择,为报告数据选择高信任度和高任务相似度的工人,进而排除了与任务无关的低信任度工人,有效提高了Skyline采集数据的质量,保障了系统的安全性和隐私性。性和隐私性。


技术研发人员:梁润富 刘安丰
受保护的技术使用者:中南大学
技术研发日:2022.09.26
技术公布日:2022/12/22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1