一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法与流程

文档序号:21274225发布日期:2020-06-26 23:08阅读:485来源:国知局
一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法与流程

本发明属于移动通信以及计算机应用技术领域,涉及一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法。



背景技术:

随着智能手机、智能行车记录仪等终端的应用和普及,通信运营商作为数据管道,积累了海量的移动信令数据。从移动信令数据中解析出来的位置信息则为城市计算领域中智能交通系统(intelligenttrafficsystems,its)的应用提供了详实的数据支撑。由移动数据构成的轨迹信息是用户运动行为的全时空采样,从中可以分离出用户驻留点和出行行为。出行行为对应的移动轨迹需要借助地图匹配(mapmatching,mm)技术匹配到城市路网数据中。

地图匹配技术是一种定位纠错技术,其核心思想是将定位轨迹和电子地图中的路网信息按照一定的逻辑进行比较和匹配,将与实际位置有偏差的定位点投影到位置对应路段上,从而矫正定位误差,提高定位精度。当前地图匹配算法研究多基于采样密度高、定位精度高、包含运动方向等信息的gps(globalpositioningsystem)数据或浮动车数据(floatingcardata,fcd)。适用于gps数据或浮动车数据的地图匹配算法主要有以下几类:模糊逻辑模型(fuzzylogicmodel,flm)、权重模型(weightmodel,wm)、隐马尔可夫模型(hiddenmarkovmodel,hmm)、拓扑模型(topologicalmodel,tm)和先进模型(advancedmodel,am)。具体地,flm方法利用模糊逻辑理论,将速度、方向、历史轨迹等因素分层量化,得到路网匹配结果,但在复杂的城市道路网络中匹配精度低且算法含有多个权重参数,算法鲁棒性差;wm方法通过对速度、方向、距离等因素分配不同权重并建立各个道路的权重阈值,超过该阈值则认为匹配成功,该类方法属于专家系统模型,其匹配结果严重依赖权重与阈值大小;hmm方法将用户定位轨迹作为观测序列,实际路网轨迹作为隐状态序列,考量运动速度、方向、与候选路段的距离等因素,其优点在于对噪声数据不敏感,但现有算法在低采样速率与低精度的定位的数据中匹配效果并不理想;tm方法利用路网信息中的几何形状、连通性和连续性完成地图匹配,这类方法对轨迹的几何形状有较高要求,不适用于低采样速率的定位数据;am方法包括卡尔曼滤波、粒子滤波、条件随机场模型等,这些模型的精确性较高,但是计算成本通常很高,如在卡尔曼滤波模型中涉及大量迭代的卡尔曼增益计算,已有研究表明先进模型在实现简单性和性能方面存在一定的不足。

相比gps数据或者浮动车数据,移动数据中的定位信息有如下特点:1)属性信息简单,仅包含时间和位置信息;2)时空采样率较低且采样不均匀;3)各区域基站部署疏密程度不同,整体定位精度较低。当前基于移动数据的地图匹配方法主要有三类:一是将定位数据与基站切换对数据库进行对比获得用户运动道路信息,但由于路网空间的复杂性以及用户移动路径多样性,建立和维护基站切换对数据库比较困难;二是基于道路拓扑结构的匹配方法,但是在复杂道路区域中准确率较低;三是针对基于gps数据的地图匹配算法的改进,但现有研究在搜索区域的设置与发射概率的设置均沿用原算法,且使用场景多为区域内简单路网环境。

因此,目前亟需一种能有效解决基于移动数据的地图匹配准确率低的地图匹配方法。



技术实现要素:

有鉴于此,本发明的目的在于提供一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法,通过一种适用于低采样密度、低定位精度的地图匹配算法来解决基于移动数据的地图匹配准确率低的问题。该方法通过构建hmm,将地图匹配问题转换为求解hmm的预测问题,最终使用维特比算法得到出行行为对应的路网轨迹信息。

为达到上述目的,本发明提供如下技术方案:

一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法,包括以下步骤:

s1:根据移动数据建立基站与路网信息数据库,以降低后续匹配过程中的计算复杂度,其中移动数据包括用户轨迹数据和基站位置数据;

s2:通过插值法对稀疏定位轨迹进行填充,以解决移动数据时空采样率较低且采样不均匀的问题;

s3:考虑城市路网的复杂性以及匹配时的计算成本,根据冯洛诺伊图制定候选路段搜索区域并计算候选路段集合,缩小隐状态空间集合的大小;

s4:考虑定位点与候选路段的大圆距离和候选路段在搜索区域内的长度等因素,计算隐马尔可夫模型发射概率;

s5:考虑匹配前后轨迹相似性、当前道路与候选道路之间的连通性以及道路中存在的单向行驶(one-way-traffic)的行车限制,计算隐马尔可夫模型转移概率;

s6:将地图匹配问题转换为隐马尔可夫模型(hiddenmarkovmodel,hmm)中的预测问题,并根据动态规划的思想,利用维特比算法求解,得到出行行为对应的路网轨迹信息。

进一步,所述步骤s1中,建立基站与路网信息数据库的具体方法为:利用arcgis等地图工具,以每个基站位置为中心,借助冯洛诺伊图生成各自的覆盖区域,并结合下载自openstreetmap的路网数据,建立基站与路网信息的匹配关系;其中,建立的数据库中包括:基站编号、基站位置、基站覆盖区域顶点列表、区域内道路编号、相邻基站编号。

进一步,所述步骤s2中,插值法对稀疏定位轨迹进行填充的具体步骤为:

s21:借助建立的基站与路网信息数据库,根据全量基站信息绘制冯洛诺伊图;

s22:连接原轨迹中时间相邻的两定位点pi、pj,记为线段pipj,生成以线段pipj为对角线的矩形缓冲区域;

s23:判断线段pipj与缓冲区域内基站对应多边形之间的拓扑关系;

s24:顺次提取与线段pipj拓扑关系为相交的多边形内基站的位置信息,作为补充位置信息;

s25:时间均等地将提取出的补充位置信息内插到原轨迹序列中,得到填充后的轨迹数据。

进一步,所述步骤s3中,制定候选路段搜索区域并计算候选路段集合的具体步骤为:

s31:根据定位点trn的经纬度信息确定该定位点的基站编号;

s32:根据基站与路网信息数据库获取当前基站以及相邻基站的编号集合bs;

s33:生成一个空的候选路段集合cen;

s34:遍历基站编号集合bs中的各个基站,借助基站与路网信息数据库查询基站覆盖区域内道路编号,若候选路段集合cen不包含某道路编号则将该道路加入集合cen中;

s35:最终得到候选路段集合为候选路段。

进一步,所述步骤s4中,隐马尔可夫模型发射概率由两部分构成,具体计算方法为:

考虑定位点trn与候选路段的大圆距离,定位点与候选路段距离越近,发射概率越大。具体表示为:

其中,σ表示定位数据的标准差,一般取值为50m;||trn+1-trn||gc表示定位点至候选路段的大圆距离;

考虑到由基站定位产生的位置信息与真实位置可能相差较远,且各基站覆盖范围不尽相同,同时受限于移动信令数据中属性内容简单,不包含瞬时速度。因此,在计算发射概率时考虑候选路段在搜索区域内的长度因素的影响,具体表示为:

其中,表示在定位点trn对应的搜索区域内所有路段长度的最大值;

由于本发明所建立的候选路段搜索区域并非半径固定的圆形区域,所以定位点至候选路段的大圆距离与候选路段在搜索区域内的长度两者是相互独立的。因此,综合考虑定位点至候选路段的距离和搜索区域内路段长度,发射概率的计算公式表示为:

进一步,所述步骤s5中,隐马尔可夫模型转移概率由三部分构成,具体计算方法为:

考虑到匹配前后相邻定位点形成的轨迹相似性越大,转移概率也就越大。定位点trn与trn+1的大圆距离表示为||trn+1-trn||gc;投影点之间利用dijkstra算法求得的最短路径长度表示为本发明借助||trn+1-trn||gc和的关系表征匹配前后轨迹的相似性,若||trn+1-trn||gc和两者大小越相近,则匹配前后轨迹的相似性越大。因此,由匹配前后轨迹相似性所决定的路段转移概率可以表示为:

考虑到城市道路网络中存在平行道路或高架桥、隧道等复杂道路结构,本发明在计算道路转移概率时引入了候选道路之间的连通性。具体地,使用矩阵表示在定位点trn和trn+1的搜索区域内各条道路的连通性,其中矩阵元素表示候选道路cei和cej之间的连通性。矩阵元素的可能取值为0、1、和一个较大常数k,分别表示同一个道路、不同道路但相连、不同道路且不相连。因此,由候选道路连通性所决定的路段转移概率可以表示为:

除考虑距离相似性和道路连通性等因素之外,当相邻定位点所对应的定位投影点在同一候选道路上时,需要额外考虑道路是否存在单向行驶(one-way-traffic)的限制。使用变量表示轨迹方向是否满足候选道路的限行要求,具体表示为:

其中,θ表示轨迹trntrn+1与对应的候选道路cei的夹角,当且cosθ<0时表示当前轨迹方向不满足候选道路的限行要求。

综上,考虑匹配前后轨迹的相似性、道路连通性以及候选道路的限行要求等因素,道路转移概率的计算公式表示为:

进一步,所述步骤s6中,维特比算法递推公式为:

其中,初始化π表示初始概率,而ψ1初始化为0;

利用维特比算法递推公式递推得到候选路径的最大概率,终点对应的匹配路径为然后算法从终点回溯到起点,记录每个时刻的回溯路径最终得到最优匹配路径

本发明的有益效果在于:本发明充分利用了移动数据中的基站位置信息与道路拓扑结构信息,建立隐马尔可夫模型,并使用维特比算法修正轨迹得到出行行为对应的道路位置信息。方法结果具有较高准确性,适用于以稀疏采样、定位精度低的移动数据为源数据的地图匹配,并为基于移动数据展开的出行方式和出行目的识别等相关研究奠定了重要基础。

从技术角度看,本发明针对数据内容单一、覆盖范围广、被动上传、采样稀疏的移动数据,提出一种基于隐马尔可夫模型的地图匹配算法,用以修正定位点信息,得到定位点对应的出行道路信息。相较gps定位或浮动车技术等数据来源,本发明依托的移动信令数据具有覆盖范围广、被动上传、可信度高、容易获取等优势。同时本发明解决了传统地图匹配算法不适用于低定位精度的数据源的问题,算法结果能够有较高的准确性。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:

图1为本发明的移动用户轨迹地图匹配方法的原理图;

图2为插值法填充基站定位点示意图;

图3为候选路段搜索区域示意图;

图4为轨迹相似性影响计算转移概率示意图;

图5为道路连通性影响计算转移概率示意图;

图6为维特比算法求解地图匹配问题示意图;

图7为实施例中采用本发明方法获得的移动用户轨迹地图匹配效果示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

请参阅图1~图7,如图1所示,本发明优选了一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法,由“数据预处理”、“隐马尔可夫模型建立”、“模型求解”三部分构成。该方法的具体步骤为:

步骤1),建立基站与路网信息数据库,以降低后续匹配过程中的计算复杂度。

其中,建立基站与路网信息数据库主要内容如表1所示。其中,基站编号唯一标识一个基站,由基站的位置区码(locationareacode,lac)和基站标识符(cell_id)决定;基站位置,表示基站的经纬度信息,具体是由经度和纬度构成的元组格式;基站覆盖区域顶点列表,表示当前基站覆盖区域的冯洛诺伊图顶点的坐标,具体是由顶点坐标组成的列表格式;区域内道路编号,表示在该冯洛诺伊图内的路网信息,道路编号为openstreetmap中的道路标识;相邻基站编号,表示覆盖范围与该基站覆盖范围相邻的基站编号。

表1基站与路网信息数据库各字段内容示例

步骤2),通过插值法对稀疏定位轨迹进行填充,以解决移动数据时空采样率较低且采样不均匀的问题。其中,插值法对稀疏定位轨迹进行填充具体方法为:

a)借助已经建立的基站与路网信息数据库,根据全量基站信息绘制冯洛诺伊图,如图2;

b)连接原轨迹中时间相邻的两定位点,如线段p1p5,借助线段p1p5生成矩形搜索区域;

c)判断线段p1p5与缓冲区域内基站对应多边形之间的拓扑关系;

d)顺次提取与线段p1p5拓扑关系为相交的多边形内基站的位置信息,作为补充位置信息;

e)时间均等地将提取出的补充位置信息内插到原轨迹序列中,得到填充后的轨迹数据,p1-p2-p3-p4-p5。

步骤3),考虑到城市路网的复杂性以及匹配时的计算成本,根据冯洛诺伊图制定候选路段搜索区域并计算候选路段集合,缩小隐状态空间集合的大小。

其中,候选路段搜索方法核心思想是,根据基站与路网信息数据库确定该定位点trn(如b0001)相邻的基站,将搜索区域设置为当前基站和相邻基站的覆盖的多边形区域(如b0001-b0005分别对应的冯洛诺伊图区域)。具体的基于基站覆盖范围的候选路段搜索方法为:

a)根据定位点trn的经纬度信息确定该定位点的基站编号;

b)根据基站与路网信息数据库获取当前基站以及相邻基站的编号集合bs;

c)生成一个空的候选路段集合cen;

d)遍历集合bs中的各个基站,借助基站与路网信息数据库查询基站覆盖区域内道路编号,若候选路段集合cen不包含该道路编号则将该道路加入集合cen中,

e)最终得到候选路段集合

步骤4),考虑定位点与候选路段的大圆距离、候选路段在搜索区域内的长度等因素的影响,计算隐马尔可夫模型发射概率。

其中,隐马尔可夫模型发射概率由两部分构成,具体计算方法为:考虑定位点trn与候选路段的大圆距离,定位点与候选路段距离越近,发射概率越大。具体可以表示为:

其中,σ表示定位数据的标准差,一般取值为50m;表示定位点至候选路段的大圆距离。

考虑到由基站定位产生的位置信息与真实位置可能相差较远,且各基站覆盖范围不尽相同,同时受限于移动信令数据中属性内容简单,不包含瞬时速度。因此,在计算发射概率时考虑了候选路段在搜索区域内的长度因素的影响,具体表示为:

其中,表示在定位点trn对应的搜索区域内所有路段长度的最大值。

由于本发明所建立的候选路段搜索区域并非半径固定的圆形区域,所以定位点至候选路段的大圆距离与候选路段在搜索区域内的长度两者是相互独立的。因此,综合定位点至候选路段的距离因素和搜索区域内路段长度因素,发射概率的计算公式可以表示为:

步骤5),考虑匹配前后轨迹相似性、当前道路与候选道路之间的连通性以及道路中存在的单向行驶(one-way-traffic)的行车限制,计算隐马尔可夫模型转移概率。

其中,步骤5)所述隐马尔可夫模型转移概率由三部分构成,具体计算方法如下:

如图4所示,考虑到匹配前后相邻定位点形成的轨迹相似性越大,转移概率也就越大。定位轨迹trn与trn+1的大圆距离表示为||trn+1-trn||gc;投影点之间利用dijkstra算法求得的最短路径长度表示为本发明借助||trn+1-trn||gc和的关系表征匹配前后轨迹的相似性,若||trn+1-trn||gc和两者大小越相近,则匹配前后轨迹的相似性越大。因此,由匹配前后轨迹相似性所决定的路段转移概率可以表示为:

如图5所示,考虑到城市道路网络中存在平行道路或高架桥、隧道等复杂道路结构,本发明在计算道路转移概率时引入了候选道路之间的连通性。具体地,使用矩阵表示在定位点trn和trn+1的搜索区域内各条道路的连通性,其中矩阵元素表示候选道路cei和cej之间的连通性。矩阵元素的可能取值为0、1、和一个较大常数k,分别表示同一个道路、不同道路但相连、不同道路且不相连。如图5所示,在搜索区域内有6条候选道路,其中没有相交。因此其连通矩阵可以表示为:

因此,由候选道路连通性所决定的路段转移概率可以表示为:

除考虑距离相似性和道路连通性等因素之外,当相邻定位点所对应的定位投影点在同一候选道路上时(如图4中轨迹trmtrm+1),需要额外考虑道路是否存在单向行驶的限制。使用变量表示轨迹方向是否满足候选道路的限行要求,具体表示为:

其中,θ表示轨迹trmtrm+1与对应的相同道路cei的夹角,当且cosθ<0时表示当前轨迹方向不满足候选道路的限行要求。

综上,考虑匹配前后轨迹的相似性、道路连通性以及候选道路的限行要求等因素,道路转移概率的计算公式可以表示为

步骤6),将地图匹配问题转换为hmm中的预测问题,并根据动态规划的思想,利用维特比算法求解,得到出行行为对应的路网轨迹信息。

其中,维特比算法递推公式可以表示为

其中,初始化π表示初始概率;而ψ1初始化为0。

本发明将初始概率简化为第一个轨迹点搜索区域内候选路径数的倒数,表示等可能地匹配。利用(9)(10)式可以递推得到候选路径的最大概率,终点对应的匹配路径为然后算法从终点回溯到起点,记录每个时刻的回溯路径最终可以得到最优匹配路径如图6所示,已知定位点序列为tr={tr1,tr2,tr3,tr4},并通过候选路段搜索得到区域内的候选路径。借助(9)式迭代计算得到定位点tr4对应的最优匹配路段是e8,进行回溯操作,得到轨迹点tr3的最优匹配路段仍是e8。以此类推,得到轨迹点tr2最优匹配路段e5,轨迹点tr1最优匹配路段e1。至此得到定位点序列tr={tr1,tr2,tr3,tr4}的最优匹配路径是e={e1,e5,e8}。

如图7所示,采用本发明方法获得的具体用户轨迹地图匹配效果示意图,从图7可以看出,本发明的匹配效果很好。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1