一种车载网络的移动群智感知方法
【技术领域】
[0001] 本发明涉及的是无线通信技术领域的方法,具体是涉及一种车载网络的移动群智 感知方法,激励车辆上传车载传感器数据到移动群智感知服务器,使服务器既能得到准确 的数据又能最大化自己的效益。
【背景技术】
[0002] 随着无线通信技术和传感器技术的快速发展,电子移动设备呈现爆炸性增长,移 动设备集成了越来越多的传感器以满足丰富的应用。如果能收集移动设备用户的传感器数 据,整合、处理、分析这些数据将会有许多新用途,移动群智感知应运而生。
[0003] 车辆是现代人出行必不可少的工具,在车辆上安装传感器早已不是什么新鲜事, 如GPS、加速度传感器、视频监控器等,利用这些传感器可以收集车辆周围环境的信息。而这 些传感器随着车辆的移动,覆盖范围广,因此车载传感器可以收集到大范围区域的信息。安 装在车辆上的传感器与安装在其他移动设备(如手机、平板电脑)上的传感器相比,对存储 容量和功率的限制较小,对传感器的类型、体积大小等也几乎没有限制,而且可能包含的用 户隐私内容也较少。
[0004] 移动群智感知技术结合车载网络产生了许多应用。如中国专利CN103236163 提出了一种基于群智网络的交通拥堵规避系统;中国专利CN103278605提出一种利用 车载装置C0 2sensor module的大范围032浓度监测方法;CarTel移动传感器计算系统 利用安装在汽车上的特殊的传感器收集数据,在本地进行数据的初步处理后利用WiFi 热点将数据上传到服务器,服务器通过进一步的处理数据可以测量交通堵塞状况,城市 WiFi 部署等(Hull,Bret,et al. "CarTel:a distributed mobile sensor computing system. ''Proceedings of the 4th international conference on Embedded networked sensor systems. ACM, 2006.) ;Pothole Patrol系统利用车上的震动传感器和GPS传 感器收集数据来评估路面状况(Eriksson, Jakob, et al.〃The pothole patrol:using a mobile sensor network for road surface monitoring. "Proceedings of the 6th international conference on Mobile systems, applications, and services. ACM, 2008.) 〇
[0005] 没有用户的参与,就没有数据来源,也就没有移动群智感知。很多移动群智感知应 用的提出都假设用户自愿贡献传感器数据,但是,这些移动设备属于个人,而用户参与到移 动群智感知中会消耗他们的电池,计算等资源,甚至会有泄露隐私的风险。因此,如何激励 用户参与到群智感知中是一个亟待解决的问题。
[0006] 直观上来说,如果参与到移动群智感知的用户能得到足够的报酬来弥补他们资源 的消耗,用户可能就比较愿意参与到群智感知系统中。但是服务器该给用户多少报酬才能 激励足够的用户参与到群智感知中来而又使自己的效益最大,用户该如何选择自己是否参 与群智感知,以及感知的精度,使自己效益最大。这就构成了服务器与用户间的博弈,用强 化学习技术可以为双方找到最佳策略。
【发明内容】
[0007] 本发明的目的是提供在车载移动群智感知博弈中为车辆和服务器确定策略,既使 服务器获得了所需的车载感知报告,又使双方的效益达到最大的一种车载网络的移动群智 感知方法。
[0008] 本发明包括以下步骤:
[0009] 步骤1 :移动群智感知服务器向相关区域内的m个车辆发送征集感知报告的环境 信息;
[0010] 步骤2 :车辆根据自身的感知开销,传输信道状态h和服务器给的报酬范围决定感 知精度X ;
[0011] 步骤3 :初始化每个车辆的仏值矩阵;
[0012] 步骤4 :初始化服务器的似直矩阵;
[0013] 步骤5 :车辆i观察目前所处的状态S1,按策略π,寸每个感知精度的概率分布选 择具有最大概率的感知精度x 1;
[0014] 步骤6 :服务器观察目前所处的状态Ss= X = [X丄根据策略31身每个价 格的概率分布选择具有最大概率的价格yi支付给车辆;
[0015] 步骤7 :服务器计算效益us:
[0016]
[0017] 其中β是服务器从单位精度的感知报告中获得的收益,设置为常数;
[0018] 步骤8 :服务器根据公式:
[0019]
[0020] 更新Qs值,Q s (ss,y)是服务器在状态Ss下选择y时的Q s值。s s'是服务器的下一 状态,假设服务器的下一状态与当前状态相同,y'是服务器在下一状态选择的行为;
[0021] 步骤9 :更新服务器的状态计数Cs(Ss)和平均策略;
[0022]
[0023]
[0024] 步骤10 :更新服务器的策略π s:[0025]
[0026] 其中,[0027]
[0028]
[0029] CN 105119987 A 仇叱卞> 3/6 页
[0030] 步骤11 :车辆收到服务器给的报酬后,计算即时效益:
[0031]
[0032] 其中,D1(X1)为车辆i发送感知精度为X1的报告时的单位能量消耗。h是当前信 道状态;
[0033] 步骤12 :车辆根据公式:
[0034]
[0035] 更新Q1值,Q i (Sl,X1)是车辆在状态S1下选择X i时的Q i值,s i'为车辆的下一状 态,假设车辆的下一状态与当前状态相同,X1'是车辆在下一状态选择的行为;
[0036] 步骤13 :更新车辆的状态计数C1 (S1)和平均策略:
[0037]
[0038]
[0039] 步骤14 :更新车辆的策略π i (Si):
[0040]
[0041] 其中,
[0042]
[0043]
[0044]
[0045] 步骤15 :重复步骤5~14,直到满足 IQ1 (S1, X1)-QJs1',Xl')I <0.01,VKKw, 且 |Qs(ss,y)_Qs(ss',ys')I < 0· 01,艮P Qjsi, Xi)和 Qs(ss,y)均收敛。
[0046] 在步骤1中,所述服务器根据车辆的GPS定位系统确定车辆所在地区,服务器征集 的信息是车辆周围的环境信息,根据车辆上安装的不同传感器设备,可以获取不同的环境 信息;所述环境信息包括但不限于某个路段的交通状况、某片区域的空气质量状况、某条路 的路面状况、给车辆的报酬范围等信息。
[0047] 在步骤2中,所述感知精度X可分为L+1个等级,表示为X e A = 其中 ai< a卩/ < / 5; 假设有N+1个信道状态h,表示为h e H = [hg]w N;所述服务器 可选择的价格 y 有 Ρ+l 种:y e B = [bk]0<k<p,其中 Id1C b k, VOS/<々 ?:/7;
[0048] 所述感知精度可根据文字描述的详细程度和图片的清晰程度来定感知精度,即感 知报告的精度,所述感知报告可以是文字形式或图片形式;所述感知报告都附有位置标签, 服务器根据不同的应用,有不同的选择报告的方法,可以在同一个地区内只选择一个精度 最高的报告或选择所有收到的感知报告;
[0049] 所述传输信道可设为动态信道。
[0050] 在步骤3中,所述初始化每个车辆的%值矩阵的具体方法可为:车辆i的状态s i 为服务器给的报酬,对于每个车辆的每一个可能状态S1,对车辆的所有可选择动作分配一 个对应的Q值,每个Q值初始赋值为0 ;初始化策略矩阵JP平均策略矩阵& :对每一个 可选择的动作分配一个概率,所有动作的概率和为1,初始赋值&,其中|A|是可供车辆选 择的感知精度个数A (S1)表示每个状态S1出现的次数,初始化为0 ;设置学习因子和折扣 因子 α γιε (〇, 1],两个学习速率 δ n> δ iwe (〇, 1]。
[0051] 在步骤4中,所述初始化服务器的Qs值矩阵的具体方法可为:服务器的状态s 3为 车辆上传的感知报告的精度,对于服务器的每一个可能状态Ss,对服务器的所有可选择动 作分配一个对应的Q值,每个Q值初始赋值为〇 ;初始化策略矩阵π 3和平均策略矩阵^, 初始赋值为其中|B|是可供服务器选择的价格个数;初始化状态计数(;(^)为〇;设 置学习因子和折扣因子αs, y se (〇, 1],两个学习速率δS1> δswe (〇, 1]。
[0052] 在步骤11中,所述即时效益若较好,则会提高车辆参与群智感知的积极性,即时 效益若有较低甚至负的效益,则会打击车辆下一次参与的积极性。
[0053] 本发明通过采用强化学习算法WoLF-PHC来决定服务器的定价和每个车辆的感知 精度,使得服务器和车辆的效益达到最大。
[0054] 本发明是为了实现无线信号覆盖和交通拥塞检测等多种基于位置的服务。该方法 包括:移动群智感知服务器向相关区域内的车辆发送征集感知报告的广播信息;收到征集 消息的车辆根据自身的感知开销和传输信道状态,采用增强学习算法WoLF-PHC决定是否 参与该项目,以及感知的精度;移动群智感知服务器收到车辆的感知报告后,对感知报告的 准确度进行评估,并使用WoLF-PHC算法来确定付给车辆的报酬。本发明通过调整给车辆的 报酬,激励车辆参与感知任务,从而使服务器获得所需要的车载感知报告。
【具体实施方式】
[0055] 为了能够更清楚地理解本发明的技术内