一种移动群智感知网络中的动态任务定价方法及装置

文档序号：27099331发布日期：2021-10-27 17:29阅读：100来源：国知局

1.本发明涉及移动群智感知技术领域，特别是指一种移动群智感知网络中的动态任务定价方法及装置。

背景技术：

2.便携式设备资源的充分利用促进了移动群智感知的感知范式的产生和发展。移动群智感知mcs利用通用移动设备的感知能力来协作执行各种感知任务，以实现更好的性能。典型的监控系统包括三个主体，即基于云的平台、一组请求者和一组参与工作者。请求者首先通过平台发布他们的感知任务，然后平台将任务传播给参与工作者，最后参与工作者利用他们的感知能力来执行这些任务。目前mcs已经逐渐在很多领域得到应用，它有着很好的发展前景。由于某些感知任务具有时效性，人们逐渐对信息的时效性提出了更高的要求，这对监控系统的前景提出了更大的挑战。
3.对于于不同的请求者来说，发布任务的过程是动态的，不同的任务有不同的需求。而对于参与工作者来说，由于自私的本性，他们只关注通过参与监控系统而获得的利润，而不是任务本身。因此，最大化参与工作者的意愿将导致某些请求者任务排队，导致由网络拥塞引起的更高的信息年龄aoi，这不利于时间敏感的任务，反过来又阻碍了现有和新请求者的参与。此外，过多的参与工作者参与同一任务会造成冗余采样，增加请求者的成本。任务的动态到达可能导致不同的任务队列等待时间，进而影响任务的新鲜度和任务相关数据对请求者的好处。因此，如何根据任务请求者的不同情况制定在不同排队机制下的最优任务定价策略，来鼓励参与工作者的参与，并保证mcs系统中信息年龄aoi最小化，进而完成动态最优任务定价是当前需要解决的问题。

技术实现要素：

4.本发明实施例提供了一种移动群智感知网络中的动态任务定价方法及装置。所述技术方案如下：
5.一方面，提供了一种移动群智感知网络中的动态任务定价方法，该方法应用于电子设备，该方法包括：
6.s1、任务请求者i为m个，参与工作者f为y个,任务请求者i发布n个任务；
7.s2、根据s1获得的用户角色及其对应的任务，获得所述任务请求者i
i
的收益u
i
以及所述参与工作者f
j
的收益v
j
使其分别最大化时，二者与任务定价p
i
的关系；
8.s3、根据s2获得的所述任务定价p
i
，确定所述参与工作者接受所述任务的概率，并确定所述任务请求者i
i
在一个状态更新生成时的等待成本w
i
；所述一个状态更新生成的含义是从所述任务请求者发布所述任务，所述平台接收所述任务并发送给所述参与工作者，所述参与工作者完成所述任务并将任务数据发送给所述平台，所述平台将所述任务数据发送给所述任务请求者，所述任务请求者接收所述任务数据；
9.s4、根据s2获得的所述任务请求者i
i
的收益u
i
以及所述参与工作者c
j
的收益v
j
与
所述任务定价p
i
的关系，以及s3获得的所述等待成本w
i
，确定所述任务请求者净收益z(p
i
)；
10.s5、根据s4获得的所述任务请求者净收益z(p
i
)，以及所述参与工作者的收益v
j
确定系统的总收益w
i
；
11.s6、根据s5获得的所述系统的总收益w
i
，在z(p
i
)≥0所述系统总收益w
i
最大时，确定所述任务请求者在不同排队机制下的最优任务定价策略，完成动态最优任务定价。
12.可选地，所述s2中，所述任务定价p
i
为：
13.所述任务定价p
i
是所述任务请求者i支付给所述参与工作者c的报酬，根据博弈理论将所述任务请求者i分成req0和reqa两类，所述任务请求者req0任务定价为p0；所述任务请求者reqa任务定价为p
a
；则所述任务请求者的任务定价为在双寡头垄断竞争下的任务定价；
14.所述任务定价为
15.其中，c
i
是所述任务请求者向所述平台支付的单位任务成本，是所述任务请求者能够提供的最高价格。
16.可选地，所述参与工作者接受所述任务的概率为：
17.所述参与工作者根据所述任务的质量m
i
和所述任务定价p
i
决定是否接受和完成所述任务，如果价格质量比所述参与工作者将拒绝完成所述任务；如果价格质量比所述参与工作者仍会以r
i
的概率拒绝完成所述任务。
18.可选地，所述等待成本w
i
为：
19.ω
i
＝[(δ
i
)
τ
+ζ
i
]s
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0020]
其中，(δ
i
)
τ
为平均时间信息年龄；ζ
i
为所述参与工作者完成所述任务的时间；s
i
为所述任务请求者从发布任务到接收所述任务数据的单位等待时间成本；
[0021]
所述平均时间信息年龄为：
[0022]
由一个所述任务请求者和一个所述参与工作者组成的移动智群感知任务定价系统，t
k
为所述任务请求者发出任务的时间；t
′
k
是所述参与工作者完成前一任务的时间；在任何时刻t，最近接收到的任务为：
[0023]
k＝max{j|t
′
j
≤t}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0024]
在t时刻所述参与工作者的任务最大生成时间为：
[0025]
u(t)＝t
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0026]
则由所述任务请求者i发出的所述任务的aoi(age of information，信息年龄)被定义为随机过程：
[0027]
δ
i
(t)＝t
‑
u(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0028]
对所述任务请求者i，在t＝0时，所述系统排队是空的时开始，所述信息年龄为(δ0(t))
i
＝(δ0)
i
，当时间间隔为(0，τ)，τ＝t
′
n
时，所述状态更新过程的时间平均年龄为：
[0029][0030]
可选地，所述任务请求者的净收入z(p
i
)为：
[0031][0032]
其中，对于事件件件为事件的指示函数，满足
[0033][0034]
为所述任务请求者i
i
的收益u
i
；c
i
λ
i
为向所述平台支付费用；为参与工作者f
i
的收益v
i
；ω
i
为等待成本；μ为平均服务速率；λ
i
为所述任务请求者发布任务的速率且遵循泊松分布。
[0035]
可选地，所述系统的总收益w
i
为：
[0036]
从所述req0获得的所述系统的总收益为：
[0037][0038]
其中，n为所述任务排队长度的最大值；q
k
为当所述任务请求者发送所述任务时，所述平台有k个所述任务在排队的概率；所述平台有k个所述任务在排队的概率；表示所述req0选择加入排队的概率；(1
‑
q
n
)表示所述req0成功加入排队的概率；表示当等待成本为ω0时，所述req0收益和所述参与工作者收益的和；
[0039]
从所述reqa获得的所述系统的总收益为：
[0040][0041]
可选地，所述任务请求者在不同排队机制下的最优任务定价策略，所述排队机制包括先到先得fcfs排队机制及后到先得lcfs排队机制。
[0042]
可选地，所述排队机制为先到先得fcfs时，所述最优任务定价策略为：
[0043]
对于有m个所述任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
，ρ
‑
i
＝ρ
‑
ρ
i
＝∑
j≠i
ρ
i
的m/m/1fcfs排队机制有平均时间信息年龄为：
[0044][0045]
所述任务请求者收入为服从正态分布的随机变量
[0046][0047][0048][0049]
设定系统最大任务排队长度为n，当所述任务发布者发布所述任务时所述排队中有n个任务，则暂停所述任务发布，此时系统处于稳定状态，满足以下微分方程：
[0050][0051][0052][0053]
其中，构造得到
[0054][0055]
则所述任务请求者发布任务的速率为：
[0056][0057]
则所述排队机制为先到先得fcfs时，所述最优任务定价为：
[0058][0059]
其中，
[0060][0061]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0062]
可选地，所述排队机制为后到先得lcfs时，所述最优任务定价策略为：
[0063]
对于有m个所述任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
的m/m/1lcfs排队机制有平均时间信息年龄为：
[0064][0065]
其中，
[0066][0067]
所述排队机制为后到先得lcfs时，所述最优任务定价为：
[0068][0069]
其中，
[0070]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0071]
一方面，提供了一种移动群智感知网络中的动态任务定价装置，该装置应用于电子设备，该装置包括：
[0072]
身份获取模块，用于获取任务请求者i为m个，参与工作者f为y个,任务请求者i发布n个任务；
[0073]
任务定价模块，用于根据获得的用户角色及其对应的任务，获得任务请求者i
i
的收益u
i
以及参与工作者f
j
的收益v
j
使其分别最大化时，二者与任务定价p
i
的关系；
[0074]
等待成本处理模块，用于根据获得的任务定价p
i
，确定参与工作者接受任务的概率，并确定任务请求者i
i
在一个状态更新生成时的等待成本w
i
；一个状态更新生成的含义是从任务请求者发布任务，平台接收任务并发送给参与工作者，参与工作者完成任务并将任务数据发送给平台，平台将任务数据发送给任务请求者，任务请求者接收任务数据；
[0075]
净收益处理模块，用于根据获得的任务请求者i
i
的收益u
i
以及参与工作者c
j
的收益v
j
与任务定价p
i
的关系，以及s3获得的等待成本w
i
，确定任务请求者净收益z(p
i
)；
[0076]
总收益处理模块，用于根据获得的任务请求者净收益z(p
i
)，以及参与工作者的收益v
j
确定系统的总收益w
i
；
[0077]
动态最优任务定价模块，用于根据获得的系统的总收益w
i
，在z(p
i
)≥0系统总收益w
i
最大时，确定任务请求者在不同排队机制下的最优任务定价策略，完成动态最优任务定价。
[0078]
可选地，所述任务定价模块，进一步用于：
[0079]
所述任务定价p
i
为：
[0080]
所述任务定价p
i
是所述任务请求者i支付给所述参与工作者c的报酬，根据博弈理论将所述任务请求者i分成req0和reqa两类，所述任务请求者req0任务定价为p0；所述任务请求者reqa任务定价为p
a
；则所述任务请求者的任务定价为在双寡头垄断竞争下的任务定价；
[0081]
所述任务定价为
[0082]
其中，c
i
是所述任务请求者向所述平台支付的单位任务成本，是所述任务请求者能够提供的最高价格。
[0083]
可选地，所述等待成本处理模块，进一步用于：
[0084]
所述参与工作者接受所述任务的概率为：
[0085]
所述参与工作者根据所述任务的质量m
i
和所述任务定价p
i
决定是否接受和完成所述任务，如果价格质量比所述参与工作者将拒绝完成所述任务；如果价格质量比所述参与工作者仍会以r
i
的概率拒绝完成所述任务。
[0086]
可选地，所述等待成本处理模块，进一步用于：
[0087]
所述等待成本w
i
为：
[0088]
ω
i
＝[(δ
i
)
τ
+ζ
i
]s
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0089]
其中，(δ
i
)
τ
为平均时间信息年龄；ζ
i
为所述参与工作者完成所述任务的时间；s
i
为所述任务请求者从发布任务到接收所述任务数据的单位等待时间成本；
[0090]
所述平均时间信息年龄为：
[0091]
由一个所述任务请求者和一个所述参与工作者组成的移动智群感知任务定价系统，t
k
为所述任务请求者发出任务的时间；t
′
k
是所述参与工作者完成前一任务的时间；在任何时刻t，最近接收到的任务为：
[0092]
k＝max{j|t
′
j
≤t}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0093]
在t时刻所述参与工作者的任务最大生成时间为：
[0094]
u(t)＝t
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0095]
则由所述任务请求者i发出的所述任务的信息年龄被定义为随机过程：
[0096]
δ
i
(t)＝t
‑
u(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0097]
对所述任务请求者i，在t＝0时，所述系统排队是空的时开始，所述信息年龄为(δ0(t))
i
＝(δ0)
i
，当时间间隔为(0，τ)，τ＝t
′
n
时，所述状态更新过程的时间平均年龄为：
[0098][0099]
可选地，所述净收益处理模块，进一步用于：
[0100]
所述任务请求者的净收入z(p
i
)为：
[0101][0102]
其中，对于事件件件为事件的指示函数，满足
[0103][0104]
为所述任务请求者i
i
的收益u
i
；c
i
λ
i
为向所述平台支付费用；为参与工作者f
i
的收益v
i
；ω
i
为等待成本；μ为平均服务速率；λ
i
为所述任务请求者发布任务的速率且遵循泊松分布。
[0105]
可选地，所述总收益处理模块，进一步用于：
[0106]
所述系统的总收益w
i
为：
[0107]
从所述req0获得的所述系统的总收益为：
[0108][0109]
其中，n为所述任务排队长度的最大值；q
k
为当所述任务请求者发送所述任务时，所述平台有k个所述任务在排队的概率；所述平台有k个所述任务在排队的概率；表示所述req0选择加入排队的概率；(1
‑
q
n
)表示所述req0成功加入排队的概率；表示当等待成本为ω0时，所述req0收益和所述参与工作者收益的和；
[0110]
从所述reqa获得的所述系统的总收益为：
[0111][0112]
可选地，所述动态最优任务定价模块，进一步用于：
[0113]
所述任务请求者在不同排队机制下的最优任务定价策略，所述排队机制包括先到先得fcfs排队机制及后到先得lcfs排队机制。
[0114]
可选地，所述动态最优任务定价模块，进一步用于：
[0115]
所述排队机制为先到先得fcfs时，所述最优任务定价策略为：
[0116]
对于有m个所述任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
，ρ
‑
i
＝ρ
‑
ρ
i
＝∑
j≠i
ρ
i
的m/m/1fcfs排队机制有平均时间信息年龄为：
[0117][0118]
所述任务请求者收入为服从正态分布的随机变量
[0119][0120][0121]
设定系统最大任务排队长度为n，当所述任务发布者发布所述任务时所述排队中有n个任务，则暂停所述任务发布，此时系统处于稳定状态，满足以下微分方程：
[0122][0123][0124][0125]
其中，构造得到
[0126][0127]
则所述任务请求者发布任务的速率为：
[0128][0129]
则所述排队机制为先到先得fcfs时，所述最优任务定价为：
[0130][0131]
其中，
[0132][0133]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0134]
可选地，所述动态最优任务定价模块，进一步用于：
[0135]
所述排队机制为后到先得lcfs时，所述最优任务定价策略为：
[0136]
对于有m个所述任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
的m/m/1lcfs排队机制有平均时间信息年龄为：
[0137][0138]
其中，
[0139][0140]
所述排队机制为后到先得lcfs时，所述最优任务定价为：
[0141][0142]
其中，
[0143]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0144]
一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现上述移动群智感知网络中的动态任务定价的方法。
[0145]
一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现上述移动群智感知网络中的动态任务定价的方法。
[0146]
本发明实施例提供的技术方案带来的有益效果至少包括：
[0147]
上述方案中，引入了信息年龄(aoi)概念作为模型系统的关键性能指标，以量化任务信息年龄的新鲜度，或量化状态更新生成的年龄，或简化年龄。aoi是一个用来描述系统中信息传递的新鲜度的概念。在这里，它可以用来表示网络队列中任务信息的新鲜度，从而为计算的等待时间成本提供了一个清晰生动的数学表达式。并且上述方案针对不同情况制定不同的定价策略，当请求者发布一个任务时，设置了一个最优的任务定价来鼓励参与工作者的参与，并保证mcs系统中信息的aoi最小化。
附图说明
[0148]
为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他
的附图。
[0149]
图1是本发明实施例提供的一种移动群智感知网络中的动态任务定价方法流程图；
[0150]
图2是本发明实施例提供的一种移动群智感知网络中的动态任务定价装置框图；
[0151]
图3是本发明实施例提供的一种电子设备的结构示意图。
[0152]
图4是本发明实施例提供的排队机制为先到先得fcfs时最优任务定价策略算法；
[0153]
图5是本发明实施例提供的排队机制为后到先得lcfs时最优任务定价策略算法。
具体实施方式
[0154]
为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。
[0155]
本发明实施例提供了一种移动群智感知网络中的动态任务定价方法，该方法可以由电子设备实现，该电子设备可以是终端或服务器。如图1所示的一种移动群智感知网络中的动态任务定价方法流程图，该方法的处理流程可以包括如下的步骤：
[0156]
s1、任务请求者i为m个，参与工作者f为y个,任务请求者i发布n个任务；
[0157]
s2、根据s1获得的用户角色及其对应的任务，获得任务请求者i
i
的收益u
i
以及参与工作者f
j
的收益v
j
使其分别最大化时，二者与任务定价p
i
的关系；
[0158]
s3、根据s2获得的任务定价p
i
，确定参与工作者接受任务的概率，并确定请求者i
i
在一个状态更新生成时的等待成本w
i
；一个状态更新生成的含义是从任务请求者发布任务，平台接收任务并发送给参与工作者，参与工作者完成任务并将任务数据发送给平台，平台将任务数据发送给任务请求者，任务请求者接收任务数据；
[0159]
s4、根据s2获得的任务请求者i
i
的收益u
i
以及参与工作者c
j
的收益v
j
与任务定价p
i
的关系，以及s3获得的等待成本w
i
，确定任务请求者净收益z(p
i
)；
[0160]
s5、根据s4获得的任务请求者净收益z(p
i
)，以及参与工作者的收益v
j
确定系统的总收益w
i
；
[0161]
s6、根据s5获得的系统的总收益w
i
，在z(p
i
)≥0系统总收益w
i
最大时，确定任务请求者在不同排队机制下的最优任务定价策略，完成动态最优任务定价。
[0162]
一种可行的实施方式中，构造一个由一个平台、多个任务请求者和多个参与工作者组成的mcs(mobile crowdsensing，移动群智感知)系统，任务请求者和参与工作者之间的连接是通过平台上的任务进行的。任务请求者持有通过平台发出的一系列任务，任务请求者基于实际情况，发布任务需求,这些任务需要由参与工作者完成，这些任务可以由所有与平台相连的参与工作者完成。不同位置相关的相同类型的任务来自不同的请求者。
[0163]
可选地，所述s2中，任务定价p
i
为：
[0164]
任务定价p
i
是任务请求者i支付给参与工作者c的报酬，根据博弈理论将任务请求者i分成req0和reqa两类，任务请求者req0任务定价为p0；任务请求者reqa任务定价为p
a
；则任务请求者的任务定价为在双寡头垄断竞争下的任务定价；
[0165]
任务定价为
[0166]
其中，c
i
是任务请求者向平台支付的单位任务成本，是任务请求者能够提供
的最高价格。
[0167]
一种可行的实施方式中，在所有的任务请求者中，假设存在一个任务请求者1，它希望制定其任务的最优定价策略，可以称这个任务请求者为主导请求者，这个占优势的任务请求者的定价策略用p0表示；此外，可以假设任务请求者2是代表平均市场力的虚拟请求者，是另一个占优势的请求者，它也具有绝对定价权，任务请求者2的定价策略用p
a
表示；那么在这个任务定价问题中，可以考虑两个主要的参与者，即占优势的任务请求者1(代表req0)和任务请求者2(代表reqa)。可以假设每个任务请求者的定价策略由其中c
i
≥0是任务请求者i为通过平台发布感知任务而向平台支付的单位任务成本，因为如果没有有效的激励，平台可能不愿意花费相当大的努力来提供交付服务。此外，由于任务请求者的预算有限，存在任务请求者能够提供的最高价格以保持预算平衡且不出现赤字，因此，这两个主要参与者的定价策略分别限于和
[0168]
考虑由两个占优势的任务请求者控制的定价策略，可以将mcs系统中所有任务请求者的最优定价策略视为双头垄断竞争下的定价问题。双寡头竞争问题的一个参与者是占优势的req0，其定价策略用p0表示，另一个双寡头竞争博弈参与者是reqa，其定价策略用p
a
表示。在mcs系统中，每个请求者i发布一个动态随机的群体感知任务。假设人群感知任务的发布遵循泊松分布，假设请求者发布的任务具有相似的类型，任务请求者i发布的任务的速率用λ
i
表示，它表示任务请求者i发布的任务数，整个系统遵循参数为λ的泊松分布，那么可以有λ1+λ1+
…
+λ
m
＝λ。所以对于两个占优势的任务请求者玩家系统，可以有λ0+λ
a
＝λ。此外，可以假设服务率是针对参与工作者的更新。因此，在该系统中，任务请求者i的更新任务服务强度为因此，监控系统中感知任务的动态定价过程可视为一个m/m/1排队博弈模型。
[0169]
在mcs系统中，每个任务请求者发布其任务，更新的总服务强度为任务请求者i的任务与聚合的其他任务请求者发布任务竞争网络队列资源ρ
‑
i
＝ρ
‑
ρ
i
＝∑
j≠i
ρ
i
。
[0170]
可选地，参与工作者接受任务的概率为：
[0171]
参与工作者根据任务的质量m
i
和任务定价p
i
决定是否接受和完成任务如果价格质量比参与工作者将拒绝完成任务；如果价格质量比参与工作者仍会以r
i
的概率拒绝完成任务。
[0172]
一种可行的实施方式中，当任务显示在参与工作者的终端界面上时，根据任务质量和任务定价p
i
，参与工作者决定是否接受和完成任务。如果价格质量比，参与工作者决定是否接受和完成任务。如果价格质量比参与工作者将拒绝完成任务。否则，如果价格质量比该值越低，参与工作者仍可能以r
i
的概率拒绝完成任务，因为任务繁琐且超出预期；价值越高，参与工作者越愿意参与任务。如果
参与工作者选择接受任务，第一时间阶段结束；或者如果参与工作者选择拒绝该任务，它仍然停留在第一阶段，等待被激励措施的调整所接受。
[0173]
可选地，等待成本w
i
为：
[0174]
ω
i
＝[(δ
i
)
τ
+ζ
i
]s
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0175]
其中，(δ
i
)
τ
为平均时间信息年龄；ζ
i
为参与工作者完成任务的时间；s
i
为任务请求者从发布任务到接收任务数据的单位等待时间成本；
[0176]
一种可行的实施方式中，在排队博弈模型中，可以假设任务请求者是风险中性的，一旦任务请求者做出了进入系统的决定，任务请求者就不能中途退出；如果任务请求者决定停止，则任务请求者不能再次返回。当任务请求者选择进入排队系统接受服务时，任务请求者i在从任务发布到任务完成的整个过程中所花费的时间t
i
由两部分组成，第一阶段的平均时间信息年龄(δ
i
)
τ
和第二阶段的参与工作者完成任务的时间ζ
i
。每个任务请求者i的平均时间信息年龄(δ
i
)
τ
，表示排队中已发布任务更新的间隔时间，直到它被工作进程接受，而时间ζ
i
表示工作进程完成任务的时间。因此，对于双寡头竞争博弈玩家req0，任务执行时间可以表示为ζ0，而对于另一个双寡头竞争博弈玩家reqa，平均任务执行时间可以表示为ζ
a
，从两个任务请求者发出任务到参与工作者完成任务的整个等待时间分别为(δ0)
τ
+ζ0和(δ
a
)
τ
+ζ
a
。
[0177]
平均时间信息年龄为：
[0178]
一种可行的实施方式中，考虑由一个任务请求者和一个参与工作者组成的移动智群感知任务定价系统，t
k
为任务请求者发出任务的时间；t
′
k
是参与工作者完成前一任务的时间；在任何时刻t，最近接收到的任务为：
[0179]
k＝max{j|t
′
j
≤t}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0180]
在t时刻参与工作者的任务最大生成时间为：
[0181]
u(t)＝t
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0182]
则由任务请求者i发出的任务的信息年龄被定义为随机过程：
[0183]
δ
i
(t)＝t
‑
u(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0184]
不失一般性，对任务请求者i，假设在t＝0时，系统排队是空的时开始观察系统，信息年龄为(δ0(t))
i
＝(δ0)
i
，请求者的任务i的状态更新j在t
j
时生成，完成服务，并在t
′
j
时被工作者接收。在t
′
j
‑1和t
′
j
之间没有任何更新，aoi随着时间线性增加。当参与工作者接收到更新时，aoi被重置为一个更小的值，等于通过传输系统所经历的任务。此外,请求者i的第j项任务的间隔时间被定义为产生更新j和j
‑
1之间经过的时间，其可以表示为y
j
＝t
j
‑
t
j
‑1，同时，接收到的任务状态更新j的系统时间是t
j
＝t
′
j
‑
t
j
，对应于状态队列等待时间和服务时间。为简便起见，假设观测间隔为t＝0到t＝t
′
n
。引入了时间平均信息年龄，这是一个非递减函数，作为年龄惩罚函数来表示对参与工作者所做任务的不满程度，如下定义所示：
[0185]
对于一段观察间隔时间(0，τ)，τ＝t
′
n
，状态更新过程的时间平均年龄为：
[0186][0187]
可选地，任务请求者的净收入z(p
i
)为：
[0188]
一种可行的实施方式中，对于移动群智感知系统中的m/m/1动态任务定价排队博
弈模型，任务请求者i为获取感知任务完成服务的平台提供任务定价。在任务由参与工作者完成后，任务请求者i可以获得利益，这被假定为具有连续分布函数ψ的随机变量。任务请求者的利益越高，任务的紧迫性就越高。这里假设收益服从正态分布，ε和σ2是期望和方差，任务等待时间越短，数据越新鲜，任务请求者的收益越大。任务请求者的净收入z(p
i
)为：
[0189][0190]
其中，对于事件其中，对于事件其中，对于事件为事件的指示函数，满足
[0191][0192]
为任务请求者i
i
的收益u
i
；c
i
λ
i
为向平台支付费用；为参与工作者f
i
的收益v
i
；ω
i
为等待成本；μ为平均服务速率；λ
i
为任务请求者发布任务的速率且遵循泊松分布。
[0193]
一种可行的实施方式中，在任务定价排队博弈模型中，可以假设只有任务请求者知道预期收益，平台对此一无所知。而且，平台通知任务请求者其可能的入队成本后，通过计算预期净收入来决定是否入队。并且只有净收入满足一定条件，任务请求者才会加入。
[0194]
可选地，系统的总收益w
i
为：
[0195]
一种可行的实施方式中，在mcs系统中，为了维持排队系统的长期运行，可以从系统的角度考虑排队系统，因为当可以只考虑参与工作者收入最大化时，任务请求者可能得不到期望的收入而选择不参与mcs排队系统，反之亦然，不利于系统的长期运行。从系统的角度来看，目标是系统效益最大化。系统收益是指系统中任务请求者和参与工作者的总收入。
[0196]
在任务请求者决定加入服务排队后，任务信息在网络中排队。假设n是任务排队长度的最大值，超过该值，参与工作者可能会因为不耐烦而无法接受任务。可以用q
k
表示当任务请求者释放任务时，观察排队中k个任务的概率。参与工作者完成任务后，任务请求者和参与工作者都得到好处。然后得出mcs系统的整体效益。可以用任务请求者的净收入和参与工作者的收入来表示系统的总收入。
[0197]
因此，从req0获得的系统的总收益为：
[0198][0199]
其中，n为任务排队长度的最大值；q
k
为当任务请求者发送任务时，平台有k个任务在排队的概率；表示req0选择加入排队的概率；(1
‑
q
n
)表示req0成功加入排队的概率；)表示req0成功加入排队的概率；表示当等待成本为ω0时，req0收益和参与工作者收益的和；
[0200]
从reqa获得的系统的总收益为：
[0201][0202]
可选地，任务请求者在不同排队机制下的最优任务定价策略，排队机制包括fcfs
(first come first served,先到先得)排队机制及lcfs(last come first served，后到先得)排队机制。
[0203]
一种可行的实施方式中，如果在mcs排队博弈系统中，所有任务中最先到达的任务最先得到服务，则称一个排队规则遵循先到先得规则；如果最后一个任务在所有任务中优先服务，那么排队规则就被称为后到先得。
[0204]
可选地，排队机制为先到先得fcfs时，最优任务定价策略为：
[0205]
一种可行的实施方式中，对于先来先服务的状态更新规则，新的任务信息状态更新消息可以在先前到达的任务信息之后排队，任务消息将在通过网络状态路由服务之后到达客户端，并且第一个到达的任务可以由参与工作者首先完成。随着移动群智感知网络中任务请求者数量的增加，发布的感知任务数量也随之增加。
[0206]
对于任务请求者给出的动态变化的任务定价，不同的任务定价意味着不同的任务时间敏感性和不同的参与工作者完成时间。随着系统中任务请求者数量的增加，动态定价必然会影响mcs系统的性能和服务公平性。基于排队博弈理论，首先给出了fcfs排队规则下的时间平均aoi：
[0207]
对于有m个任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
，ρ
‑
i
＝ρ
‑
ρ
i
＝∑
j≠i
ρ
i
的m/m/1fcfs排队机制有平均时间信息年龄为：
[0208][0209]
任务请求者收入为服从正态分布的随机变量
[0210][0211][0212]
设定系统最大任务排队长度为n，当任务发布者发布任务时排队中有n个任务，则暂停任务发布，此时系统处于稳定状态，满足以下微分方程：
[0213][0214][0215][0216]
其中，构造得到
[0217][0218]
则任务请求者发布任务的速率为：
[0219][0220]
reqi的任务定价策略影响自身收益，进而影响reqi加入时的系统收益，则排队机制为先到先得fcfs时，最优任务定价为：
[0221][0222]
其中，
[0223][0224]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0225]
如图4所示算法1给出了从任务请求者发布任务到参与工作者完成任务的整个过程。
[0226]
在算法1中，第2行到第22行主要介绍第一阶段的过程，第23行到第27行主要介绍第二阶段的过程，第28行到第32行主要介绍最优定价的计算过程。算法获得最优任务定价的总周期数为n，因为当一个新任务到达排队时，本文假设最长的排队为n，因此只需要前进n步就可以从参与工作者那里得到服务。因此，算法1的复杂度可以是o(n)。
[0227]
可选地，排队机制为后到先得lcfs时，最优任务定价策略为：
[0228]
一种可行的实施方式中，对于后进先出状态更新规则，新的任务信息状态更新消息可以在先前到达的任务信息之前排队。但是当一个新的任务信息到达时，就有任务被发送到参与工作者的终端接口。新的任务信息应该代替任务信息来接受下一步的服务，并等待当前服务的完成。
[0229]
对于有m个任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
的m/m/1lcfs排队机制有平均时间信息年龄为：
[0230][0231]
其中，
[0232][0233]
排队机制为后到先得lcfs时，最优任务定价为：
[0234]
[0235]
其中，
[0236]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0237]
从任务请求者发布任务到参与工作者在lcfsw排队机制下完成任务的整个过程如图5所示算法2：
[0238]
第2行到第31行介绍了网络中的任务信息调度，直到第一阶段被参与工作者接受，然后在第33行，可以用一句话演示了第二阶段类似于算法1的过程。最后，第34行到第36行主要介绍最优定价的计算过程。由于第一阶段的复杂性高于算法1，算法2的复杂性计算为o(n2)。
[0239]
上述方案中，引入了信息年龄(aoi)概念作为模型系统的关键性能指标，以量化任务信息年龄的新鲜度，或量化状态更新生成的年龄，或简化年龄。aoi是一个用来描述系统中信息传递的新鲜度的概念。在这里，它可以用来表示网络队列中任务信息的新鲜度，从而为计算的等待时间成本提供了一个清晰生动的数学表达式。并且上述方案针对不同情况制定不同的定价策略，当请求者发布一个任务时，设置了一个最优的任务定价来鼓励参与工作者的参与，并保证mcs系统中信息的aoi最小化。
[0240]
图2是根据一示例性实施例示出的一种移动群智感知网络中的动态任务定价装置框图，参照图2，该装置包括：
[0241]
身份获取模块210，用于获取任务请求者i为m个，参与工作者f为y个,任务请求者i发布n个任务；
[0242]
任务定价模块220，用于根据获得的用户角色及其对应的任务，获得任务请求者i
i
的收益u
i
以及参与工作者f
j
的收益v
j
使其分别最大化时，二者与任务定价p
i
的关系；
[0243]
等待成本处理模块230，用于根据获得的任务定价p
i
，确定参与工作者接受任务的概率，并确定任务请求者i
i
在一个状态更新生成时的等待成本w
i
；一个状态更新生成的含义是从任务请求者发布任务，平台接收任务并发送给参与工作者，参与工作者完成任务并将任务数据发送给平台，平台将任务数据发送给任务请求者，任务请求者接收任务数据；
[0244]
净收益处理模块240，用于根据获得的任务请求者i
i
的收益u
i
以及参与工作者c
j
的收益v
j
与任务定价p
i
的关系，以及s3获得的等待成本w
i
，确定任务请求者净收益z(p
i
)；
[0245]
总收益处理模块250，用于根据获得的任务请求者净收益z(p
i
)，以及参与工作者的收益v
j
确定系统的总收益w
i
；
[0246]
动态最优任务定价模块260，用于根据获得的系统的总收益w
i
，在z(p
i
)≥0系统总收益w
i
最大时，确定任务请求者在不同排队机制下的最优任务定价策略，完成动态最优任务定价。
[0247]
可选地，所述任务定价模块220，进一步用于：
[0248]
任务定价p
i
为：
[0249]
任务定价p
i
是任务请求者i支付给参与工作者c的报酬，根据博弈理论将任务请求者i分成req0和reqa两类，任务请求者req0任务定价为p0；任务请求者reqa任务定价为p
a
；则任务请求者的任务定价为在双寡头垄断竞争下的任务定价；
[0250]
任务定价为
[0251]
其中，c
i
是任务请求者向平台支付的单位任务成本，是任务请求者能够提供
的最高价格。
[0252]
可选地，所述等待成本处理模块230，进一步用于：
[0253]
参与工作者接受任务的概率为：
[0254]
参与工作者根据任务的质量m
i
和任务定价p
i
决定是否接受和完成任务，如果价格质量比参与工作者将拒绝完成任务；如果价格质量比参与工作者仍会以r
i
的概率拒绝完成任务。
[0255]
可选地，所述等待成本处理模块230，进一步用于：
[0256]
等待成本w
i
为：
[0257]
ω
i
＝[(δ
i
)
τ
+ζ
i
]s
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0258]
其中，(δ
i
)
τ
为平均时间信息年龄；ζ
i
为参与工作者完成任务的时间；s
i
为任务请求者从发布任务到接收任务数据的单位等待时间成本；
[0259]
平均时间信息年龄为：
[0260]
由一个任务请求者和一个参与工作者组成的移动智群感知任务定价系统，t
k
为任务请求者发出任务的时间；t
′
k
是参与工作者完成前一任务的时间；在任何时刻t，最近接收到的任务为：
[0261]
k＝max{j|t
′
j
≤t}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0262]
在t时刻参与工作者的任务最大生成时间为：
[0263]
u(t)＝t
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0264]
则由任务请求者i发出的任务的信息年龄被定义为随机过程：
[0265]
δ
i
(t)＝t
‑
u(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0266]
对任务请求者i，在t＝0时，系统排队是空的时开始，信息年龄为(δ0(t))
i
＝(δ0)
i
，当时间间隔为(0，τ)，τ＝t
′
n
时，状态更新过程的时间平均年龄为：
[0267][0268]
可选地，所述净收益处理模块240，进一步用于：
[0269]
任务请求者的净收入z(p
i
)为：
[0270][0271]
其中，对于事件件件为事件的指示函数，满足
[0272][0273]
为任务请求者i
i
的收益u
i
；c
i
λ
i
为向平台支付费用；为参与工作者f
i
的收益v
i
；ω
i
为等待成本；μ为平均服务速率；λ
i
为任务请求者发布任务的速率且遵循泊松分布。
[0274]
可选地，所述总收益处理模块250，进一步用于：
[0275]
系统的总收益w
i
为：
[0276]
从req0获得的系统的总收益为：
[0277][0278]
其中，n为任务排队长度的最大值；q
k
为当任务请求者发送任务时，平台有k个任务在排队的概率；表示req0选择加入排队的概率；(1
‑
q
n
)表示req0成功加入排队的概率；)表示req0成功加入排队的概率；表示当等待成本为ω0时，req0收益和参与工作者收益的和；
[0279]
从reqa获得的系统的总收益为：
[0280][0281]
可选地，所述动态最优任务定价模块260，进一步用于：
[0282]
任务请求者在不同排队机制下的最优任务定价策略，排队机制包括先到先得fcfs排队机制及后到先得lcfs排队机制。
[0283]
可选地，所述动态最优任务定价模块260，进一步用于：
[0284]
排队机制为先到先得fcfs时，最优任务定价策略为：
[0285]
对于有m个任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
，ρ
‑
i
＝ρ
‑
ρ
i
＝∑
j≠i
ρ
i
的m/m/1fcfs排队机制有平均时间信息年龄为：
[0286][0287]
任务请求者收入为服从正态分布的随机变量
[0288][0289][0290]
设定系统最大任务排队长度为n，当任务发布者发布任务时排队中有n个任务，则暂停任务发布，此时系统处于稳定状态，满足以下微分方程：
[0291][0292][0293][0294]
其中，构造得到
[0295]
[0296]
则任务请求者发布任务的速率为：
[0297][0298]
则排队机制为先到先得fcfs时，最优任务定价为：
[0299][0300]
其中，
[0301][0302]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0303]
可选地，所述动态最优任务定价模块260，进一步用于：
[0304]
排队机制为后到先得lcfs时，最优任务定价策略为：
[0305]
对于有m个任务请求者以状态更新服务速率μ发布任务量ρ1,ρ2,
…
,ρ
m
和总任务ρ＝ρ1+ρ2+
…
+ρ
m
的m/m/1lcfs排队机制有平均时间信息年龄为：
[0306][0307]
其中，
[0308][0309]
排队机制为后到先得lcfs时，最优任务定价为：
[0310][0311]
其中，
[0312]
w
i
＝[(δ
i
)
τ
+ζ
i
]s
i
,(i＝0,a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0313]
上述方案中，引入了信息年龄(aoi)概念作为模型系统的关键性能指标，以量化任务信息年龄的新鲜度，或量化状态更新生成的年龄，或简化年龄。aoi是一个用来描述系统中信息传递的新鲜度的概念。在这里，它可以用来表示网络队列中任务信息的新鲜度，从而为计算的等待时间成本提供了一个清晰生动的数学表达式。并且上述方案针对不同情况制定不同的定价策略，当请求者发布一个任务时，设置了一个最优的任务定价来鼓励参与工作者的参与，并保证mcs系统中信息的aoi最小化。
[0314]
图3是本发明实施例提供的一种电子设备300的结构示意图，该电子设备300可因
配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，cpu)301和一个或一个以上的存储器302，其中，所述存储器302中存储有至少一条指令，所述至少一条指令由所述处理器301加载并执行以实现下述移动群智感知网络中的动态任务定价方法的步骤：
[0315]
s1、任务请求者i为m个，参与工作者f为y个,任务请求者i发布n个任务；
[0316]
s2、根据s1获得的用户角色及其对应的任务，获得任务请求者i
i
的收益u
i
以及参与工作者f
j
的收益v
j
使其分别最大化时，二者与任务定价p
i
的关系；
[0317]
s3、根据s2获得的任务定价p
i
，确定参与工作者接受任务的概率，并确定任务请求者i
i
在一个状态更新生成时的等待成本w
i
；一个状态更新生成的含义是从任务请求者发布任务，平台接收任务并发送给参与工作者，参与工作者完成任务并将任务数据发送给平台，平台将任务数据发送给任务请求者，任务请求者接收任务数据；
[0318]
s4、根据s2获得的任务请求者i
i
的收益u
i
以及参与工作者c
j
的收益v
j
与任务定价p
i
的关系，以及s3获得的等待成本w
i
，确定任务请求者净收益z(p
i
)；
[0319]
s5、根据s4获得的任务请求者净收益z(p
i
)，以及参与工作者的收益v
j
确定系统的总收益w
i
；
[0320]
s6、根据s5获得的系统的总收益w
i
，在z(p
i
)≥0系统总收益w
i
最大时，确定任务请求者在不同排队机制下的最优任务定价策略，完成动态最优任务定价。
[0321]
在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成上述移动群智感知网络中的动态任务定价方法。例如，所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd
‑
rom、磁带、软盘和光数据存储设备等。
[0322]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0323]
以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许海涛;高红杰;林福宏;周贤伟
技术所有人：北京科技大学
我是此专利的发明人

上一篇：一种用于轻钢龙骨吊顶的连接结构的制作方法
上一篇：一种用于大理石装饰画的喷涂设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。