本发明涉及基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法,属于智能交通系统的技术领域。
背景技术:
为解决城市交通需求日益增长所带来的交通拥堵问题,公共交通优先已经成为城市交通管理者着力实施的改善策略之一。对于城市交通管理者而言,为了刺激更多的城市居民使用公交方式出行,则需要尽可能提高公交系统的服务水平,这依赖于及时掌握公交线网的运行状态,尤其是公交车在道路系统中运行时间或运行速度,从而有利于在多模式网络环境下合理规划公交优先措施。同时,公交系统运营者也需要科学的公交线网运行评价方法来研究实施的公交系统服务水平,为主动调整公交线路路径、公交站点位置等提供决策依据。因此,研究城市公交线网运行评价算法有利于提高公交系统与道路系统组合资源配置的合理性,引导公交系统享有更高质量的道路通行环境,从而提高公交车运行效率,刺激更多的居民选用公交方式出行,缓解城市交通拥堵状况。
城市公交线网依附于道路网络,由线路与站点构成,是一个具有高度复杂性的客流服务网络。迄今国内外普遍应用的线网运行评价方法,主要是通过构建评价模型对线网一定时期内服务水平进行静态评估。在评价模型中,偏重于乘客感知角度,利用公交线路行程时间、舒适度、便捷性等指标完成评价。部分学者也会关注单一的公交站间行程时间或站点停靠时间等,常利用GPS或IC卡数据对公交线网进行局部动态评价。
现有的公交线网运行评价理论方法的局限性主要包括以下几点:
1)评价模型或指标体系是建立在静态分析方法之上,然而公交线网的客流量以及行车计划呈现一定规律的动态变化特征。因此,基于评价模型的分析结果只能用于中长期的稳定线网运行评价,无法应用于公交线网实时运行环境。
2)基于GPS数据的公交车行程时间估计是根据车载GPS设施实时上传的车辆定位坐标,计算站点或交叉口之间的旅行时间差。目前基于GPS数据的现有评价方法仅应用于单一路段或线路的实时状态评估,无法适用于复杂的城市大规模线网。
3)公交车与小汽车的车辆属性与使用者特性不同。在道路运行状况评价中,拥堵指数代表以小汽车为主的混合车流行驶状态,更能反应汽车使用者的拥堵感受,缺点在于无法反应交通拥堵对公交乘客带来的切实感受,这就决定了无法将较为成熟的基于出租车GPS数据的道路运行评价技术直接应用到公交系统。
技术实现要素:
针对现有公交线网运行水平评价技术存在的上述缺陷,本发明提出一种基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法,该方法能够比较科学的给出基于旅行时间估计的适用于公交系统的服务等级划分。
本发明从数据质量处理、地图匹配、实时并行数据分析、旅行时间估计、服务分级划分五个方面进行技术研究,有效提高了大范围城市公交线网运行评价的准确性和快速性。
本发明的技术方案如下:
术语解释:
折线距离,是两个点之间有多个点(不一定都在一条直线上),把各点用线段顺次连接起来的长度是这两点之间的折线距离。
发明概述:
一种基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法,利用公交车的GPS数据,从公交车的站点停靠时间与路段旅行时间两方面进行综合分析,得到公交线网拥堵指数,实时评价公交线网的运行水平。本发明所述方法包括数据预处理、地图匹配、旅行时间指数计算、站点停靠时间指数计算以及拥堵指数计算:数据预处理过程是根据公交线网的营运计划,按照时间序列对公交车实时GPS数据进行校验,删除无效信息及错误信息,并进行必要的数据修正;地图匹配是快速标定公交车GPS点在地图上的空间位置,充分利用公交线网与道路网络的关联性,提高了地图匹配的效率和准确度;旅行时间指数计算是利用单辆公交车的地图匹配结果进行单车行驶轨迹推算,关联分析公交车在路段进出时间和站点到离站时间,估计单车在所有途径路段的旅行时间,并通过引入单条路段畅通状态下旅行时间基准值最终求得全线网的旅行时间指数;站点停靠时间指标计算主要是估计单车在单个站点的单次停靠时间,引入单个站点通畅状态下停靠时间基准值最终求解站点的停靠时间指数;在拥堵指数计算部分,根据旅行时间指数与站点停靠时间指数分布特征设计拥堵指数计算函数,并比较科学的给出了适用于公交线网特性的拥堵等级划分方法。本发明为了实现实时的公交线网运行评价,设计并行数据处理逻辑,可以实现一定时间间隔内的实时拥堵指数计算。
发明详述:
基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法,包括步骤如下:
(1)建立标准化的静态路网基础信息数据库和公交线网基础信息数据库,建立公交线网基础信息数据库包括:定义路段、定义子路段、定义路段折线段、确定公交站点信息、确定公交线路信息、匹配站点与路段信息;
两个相邻路口之间的道路为一个路段,路段信息包括路口起点编号、路口终点编号、路段编号、路段名称、路段长度、路段方向、路段所在道路名称、路段所在道路的等级;
子路段由路口与公交站点将路段进一步划分确定,路口与公交站点、公交站点与公交站点之间的路段均定义为子路段,同一路段的所有子路段按照该路段方向排序编号,子路段信息包括子路段起点编号、子路段终点编号、子路段长度和子路段方向;
路段折线段是指为同一条路段上的相邻折点之间的路段,路段折线段信息包括折点编号、路段折线段起点编号、路段折线段终点编号、路段折线段编号、路段折线段方向、路段折线段所在道路的等级、折点的经度和纬度;
所述公交站点信息是指公交线网上所有公交站点的统一命名编号,可保证不同公交线路经过相同站点的数据索引唯一性,所述公交站点信息包括站点唯一编号、站点名称、站点经纬度、站点方向、站点所在的路段;
所述公交线路信息是指公交线网上每条公交线路途经的站点以及路段信息,以便后续地图匹配与旅行时间计算中利用线路信息使公交车GPS数据处理过程更加高效、准确。所述公交线路信息包括线路编号、站点编号、站点序列号;
所述匹配站点与路段信息是建立道路网络与公交线网之间的关联数据库,确定公交线网内所有公交站点在道路网络中所处路段位置,并利用公交站点将道路网络内一个路段分为多个子路段,计算并存储每个子路段的长度;
(2)建立公交车GPS动态数据表,公交车GPS动态数据表存储当前处理间隔内的所有公交车GPS定位数据,公交车GPS定位数据包括车载机编号、公交线路编号、站点编号、到站编号、离站编号、GPS设备上传的WGS-84经纬度坐标数据、定位时刻和公交车头方向,所述车载机编号即车辆编号,到站编号即进站编号,离站编号即出站编号,定位时刻即上传时间;并对公交车GPS定位数据进行预处理;
(3)基于地图匹配的公交车旅行时间的数据处理与指标分析;
A、公交线网分区:根据城市路网规模将公交线网分割为多个子区,按照子区对同一处理间隔内分区的公交车GPS数据并行处理;
B、公交车GPS数据地图匹配:将步骤(1)标准化的静态路网基础信息数据与步骤(2)所述公交车GPS笛卡尔平面坐标数据进行结合,进行地图匹配;
C、计算单车单次在单路段上的旅行时间,即单辆公交车一次经过某路段所用的时间,以公交车个体作为研究对象;设定处理间隔内一辆公交车在一条路段上的行驶轨迹为一条路径,基于步骤A得到的公交车GPS数据,将公交车单车单次旅程的GPS数据链按路径分组,将相邻的3个处理间隔的路径连接形成单车行驶轨迹,假设公交车在路段上匀速行驶,利用离中间路段的两个GPS点的时间差与距离差成正比的关系,求出公交车驶入、驶出路段的时间,进而计算出中间路段的旅行时间;
D、实时计算单车单次经过子路段的旅行时间并存储在公交车GPS动态数据表中,单车单次经过子路段的旅行时间即单辆公交车一次经过某子路段所用的时间,以公交车个体作为研究对象:根据步骤B选定的单路段上布设站点个数,已知可划分的子路段数据,根据公交车的到离站时间以及步骤B中所述的公交车驶入与驶出单路段的时间,计算每条子路段的旅行时间,再根据静态路网信息中的子路段长度,求出单车单次经过子路段的旅行时间;
E、路段旅行时间指数评价:基于路段的历史旅行时间数据设置其通畅状态下旅行时间作为旅行时间基准值,定义畅通状态下旅行时间为该路段历史同期一个月平峰时段的平均旅行时间,将步骤C所述的单车单次在单路段上的旅行时间与旅行时间基准值的比值作为在当前处理间隔内单车单次经过单路段的旅行时间指数,将特定处理间隔内经过目标路段的旅行时间指数求平均,得到该目标路段的旅行时间指数,按照此方法,得到公交线网所有路段的旅行时间指数;
F、将公交车GPS动态数据表中存储的单车单次经过子路段的旅行时间导入旅行时间数据总表;步骤D计算出来的单车单次经过子路段的旅行时间为实时数据,存储在公交车GPS动态数据表中。通过数据库操作,将公交车GPS动态数据表中的实时数据转存到旅行时间数据表中,对历史公交车运营状况评价时,可以跳过地图匹配、旅行时间计算等步骤,直接从旅行时间数据总表调取数据,进行路段旅行时间指数评价,极大地方便了对历史公交运营状况的评价,提高了计算效率。
(4)基于站点停靠时间的数据处理与指标分析;
G、计算单车单次站点停靠时间,即单辆公交车一次经过某站点的停靠时间,以公交车个体为研究对象;根据步骤A确定的公交线网分区,利用数据库强大的数据处理与运算能力,处理当前间隔内采集到的所有公交车GPS到离站数据,并将其与公交路网基础信息数据相关联,得到该当前处理间隔内的单车单次在其途径站点的停靠时间;
H、计算单车单次的站点停靠时间指数:基于站点的历史停靠时间数据设置其畅通状态下站点停靠时间为停靠时间基准值,定义畅通状态下站点停靠时间为站点历史同期一个月的平均停靠时间,将步骤G所述的单车单次站点停靠时间与该站点停靠时间基准值的比值作为在当前处理间隔内单车单次的站点停靠时间指数;
I、站点停靠时间指数评价:按评价对象要求(全市、行政区、线路等)在特定处理间隔内加权求和,得到全网站点停靠时间评价指标;
J、将该处理间隔内的站点停靠时间数据处理结果导入到站点停靠时间总表,即将该处理间隔内的站点停靠时间数据处理结果导入到站点停靠时间总表,保存当前处理间隔内的数据结果,并估计下一处理间隔内的站点停靠时间,极大地方便了对历史公交运营状况的评价,同时也提高了计算效率。
(5)总运行指标分析与处理:
将数据处理间隔内的路段旅行时间指数与站点停靠时间指数加权求和,确定各指数的权重并映射到0至10,得到当前处理间隔内的公交线网总运行指数;
(6)公交线网服务分级;
根据步骤(5)求得的公交线网总运行指数,判断当前处理间隔内公交车运行水平。
所述步骤(1),建立标准化的静态路网基础信息数据库,具体步骤包括:
所述标准化的静态路网基础信息包括交叉口即路口、路段、站点,依次对路口、路段、站点进行要素特性分解,确定其位置、方向、属性值及其它们之间的关联性,首先确定基础路网的构建范围,然后对比百度地图的路口信息,并在谷歌地图中识别对应位置并编号,统计该路网范围内所有路口信息,路口信息包括路口编号、路口名称、所在区号以及路口经纬度;识别路段与路口位置的关联性,并对路段进行命名、编号,统计路段信息,由于以起始点路口位置连接的路段,无法体现实际弯曲路段的情况,针对路段弯曲特性,需在路段起始点中间添加若干点,来拟合实际路线,统计路段的折线段信息;对公交站点进行统一命名编号,并统计公交站点所在路段方向、站点方向及经度和纬度位置信息,建立公交线路与途径站点的相关性数据,统计每条线路的站点序列号,获取公交站点的信息。将路网基础信息导入电子地图完成校验并完善,至此完成基础路网的构建。
根据本发明优选的,所述步骤(2),对公交车GPS定位数据进行预处理,是指对公交车GPS定位数据依次进行错误数据处理、重复数据处理、缺失数据处理和冗余数据处理;
所述错误数据处理是指删除公交车GPS动态数据表中数据类型标识为错误的数据,以及按照城市范围内所有路段组成的最大路网范围为边界删除超出边界的坐标点;
所述重复数据处理是指删除车辆编号、线路编号、站点编号、到站编号、离站编号、GPS设备上传的WGS-84经纬度坐标数据、定位时刻完全重复的任意两条上传记录中一条GPS数据;
所述缺失数据处理是指删除不完整的数据,所述不完整数据包括站点编号、到站编号、离站编号数据缺失或者到站编号、离站序号为空的GPS数据;
所述冗余数据处理是指删除线路编号、车辆编号、站点编号、到站编号、离站编号完全相同但多条到站或离站记录,保留一个到站或离站数据。
根据本发明优选的,所述步骤B中的地图匹配,包括步骤如下:
a、对GPS动态数据表中公交车GPS定位数据进行筛选:限定在全市范围内,利用高斯-克吕格投影原理将GPS设备上传的WGS-84经纬度坐标数据转化为笛卡尔平面坐标,得到公交车GPS笛卡尔平面坐标数据;
b、计算相邻GPS设备记录的上传时间间隔,以及相邻GPS设备上传点之间的折线距离;
c、以GPS设备上传点为中心,框选方形区域,选定区域内的路段折线段;框选方形区域是为匹配GPS点所在的路段选择出一个待选路段范围,以减少计算量。方形区域的大小经过数据分析选取边长为1500米的正方形;
d、计算GPS设备上传点到选定的各路段折线段的距离和投影点坐标;
e、根据车载机和上传时间对GPS记录进行分组,根据步骤d的计算结果,选择与GPS点距离最近的一条路段折线段,与GPS点进行匹配,距离GPS点距离最近的这条路段折线段所在路段即为GPS点所在的路段;
f、计算GPS设备上传点到选定的各路段折线段的投影点坐标到路段起点的距离:GPS设备上传点到选定的各路段折线段的投影点坐标到路段起点的距离为:GPS设备上传点到选定的各路段折线段的投影点坐标到路段折线段起点距离,与路段折线段起点到路段起点距离之和;
g、修正地图匹配错误:避免路段重复、跳跃的问题;
h、结合线路信息删除无效数据,校正到、离站所在路段的信息;无效数据是指某线路上运营的公交车GPS信息匹配到的路段不在该线路经过的路段范围内;校正到、离站所在路段的信息是指根据静态路网基础信息中线路的各站点所在路段信息来校正GPS在到、离站时所在的路段信息;
i、根据基础路网信息,确定每条GPS记录所属路段的道路方向,根据相邻GPS的位置关系,确定车辆的行驶方向;
j、更新相邻GPS设备记录的上传时间间隔,以及相邻GPS设备上传点之间的折线距离,重复步骤b-步骤j。
在地图匹配的过程中,结合公交线路信息进行数据处理,比如,在GPS数据与路段匹配时,根据GPS数据所属线路途经的路段信息,从待匹配路段中剔除无效路段,可以大大节省了计算时间,提高了匹配准确率。
根据本发明优选的,所述步骤(3),对公交线网中所有路段旅行时间指数包括如下步骤:
k、结合步骤B中公交车GPS定位数据匹配的路段信息,按照公交车GPS数据时间序列构建特定处理时间间隔内单车单次行驶轨迹,并以路段为单位将行车轨迹划分为单个子路径,即同一路段内的所有GPS数据为一个子路径;
l、选择公交线网中任意路段Li作为旅行时间计算对象,以路段Li为中间路段选择连续的3个子路径,分别定义为Pi-1,Pi,Pi+1;
m、提取公交车GPS关键数据,包括:子路径Pi-1中距离子路径Pi起点最近的最后一条GPS数据的时刻ti-1和位置di-1,子路径Pi+1中距离子路径Pi终点最近的第一条GPS数据的时刻ti+1和位置di+1,子路径Pi中距离其起点最近的第一条GPS数据的时刻ti1和位置di1,子路径Pi中距离其终点最近的最后一条GPS数据的时刻ti2和位置di2,子路径Pi所在路段长度li,子路径Pi所在路段Li上的站点数q以及公交车在站点j的到站时间tj1和离站时间tj2,站点j为路段Li中的任意站点;
n、计算子路径Pi的旅行时间,分为以下两种情况:
当GPS记录的相邻路径在相邻路段上,则车辆驶入路径Pi的时间utcin_i、车辆驶出路径Pi的时间utcout_i的计算公式如式(Ⅰ)、式(Ⅱ)所示:
utcin_i=ti-1+(ti+1-ti-1)*di-1/(di-1+li+di+1) (Ⅰ)
utcout_i=ti+1-(ti+1-ti-1)*di+1/(di-1+li+di+1) (Ⅱ)
当GPS记录的相邻路径在不相邻路段上且相隔一个路段,则车辆驶入路径Pi的时间utcin_i、车辆驶出路径Pi的时间utcout_i的计算公式如式(Ⅲ)、式(Ⅳ)所示:
utcin_i=ti1-(ti1-ti-1)*di1/(di-1+di1) (Ⅲ)
utcout_i=ti2+(ti+1-ti2)*di2/(di2+di+1) (Ⅳ)
o、假设路径Pi上的q个站点按照车辆经过的先后顺序编号为1,2,…,k,…,q,以q个站点为分割点,将路段Li分成q+1个子路段Qij,选择路段Li上的子路段Qij作为旅行时间计算对象,沿公交车前进方向,以子路段Qij为中间子路段选择位置相邻的3个子路段,分别定义为子路段Qi(j-1),Qij,Qi(j+1);基于公交车在路径Pi所在路段Li上的驶入时间与驶出时间,以及公交车在站点j的到站时间tj1和离站时间tj2,计算第s车次经过路段Li上的子路段Qij的旅行时间ts(ij),如式(Ⅴ)所示:
式(Ⅴ)中,tj1为公交车在第j个站点处的到站时间,t(j-1)2为公交车在第j-1个站点处的离站时间;
p、求取畅通状态下的旅行时间基准值Tv(ij),即取历史一个月的平峰时段经过该子路段的所有车辆的平均旅行时间,如式(Ⅵ)所示:
式(Ⅵ)中,n为历史一个月的平峰时段内经过子路段Qij的车次总数;
q、求取单车第s次经过单子路段Qij的旅行时间指数Isij,如式(Ⅶ)所示:
Isij=ts(ij)/Tv(ij) (Ⅶ)
r、计算全网路段旅行时间评价指标travel_index:
①计算每条子路段指数权重pij,按照子路段长度占路网总长度的比例值作为指数权重,如式(Ⅷ)所示:
式(Ⅷ)中,n为评价范围内的路段数目,m为路段上的子路段数目,lij为子路段Qij的长度,
②将第s车次经过子路段Qij的单车旅行时间指数,按照评价对象要求(全市,分区,分线路等)在特定处理间隔内加权求和,得到全网路段旅行时间评价指标travel_index,如式(Ⅸ)所示:
式(Ⅸ)中,z为特定的处理间隔内经过子路段Qij的车次总数,Isij为第s车次经过子路段Qij的单车旅行时间指数。特定的处理间隔指分析指数时,所定义的处理间隔长度,假如定义特定的处理间隔为5分钟,则每5分钟的数据可求出一个旅行时间指数。为使计算方便,本发明将此处时间间隔与步骤2.中的动态数据表数据处理间隔取相同值。
根据本发明优选的,所述步骤(4),计算公交线网中所有站点停靠时间指数,包括步骤如下:
s、选择单车单次经过路段Li的子路段Qij上的站点j作为站点停靠时间计算对象,站点停靠时间为单车单次站点停靠时间,单车单次站点停靠时间由式(Ⅹ)求出:
stop_timeij=tj1-tj2 (Ⅹ)
式(Ⅹ)中,stop_timeij为单车单次经过路段Li的子路段Qij上的站点j的停靠时间,tj1为站点j到站时间,tj2为站点j离站时间;
t、畅通状态下停靠时间基准值Tt(ij)取历史一个月经过该站点的平均停靠时间,由式(Ⅺ)求出:
式(Ⅺ)中,Tt(ij)为路段Li上站点j的畅通状态下停靠时间的基准值,tkij为第k车次经过路段Li上站点j的停靠时间,n为历史一个月经过站点j的车次总数;
u、单车第k次经过路段Li上站点j的停靠时间指数为wait_indexkij,由式(Ⅻ)求出:
wait_indexkij=tkij/Tt(ij) (Ⅻ)
式(Ⅻ)中,wait_indexkij为单车第k次经过路段Li上站点j的停靠时间指数;
v、计算全路网站点停靠时间指标stop_index,按评价对象要求(全市、行政区、线路等)在特定时间间隔内加权求和,得到全网站点停靠时间评价指标,由式(XIII)求出:
式(XIII)中,n为特定时间段内的站点的总数。
为使计算方便,本发明将此处时间间隔与步骤2.中的动态数据表数据处理间隔取相同值。
根据本发明优选的,所述步骤(5),所述权重为指标在整体评价中的相对重要程度,设路段旅行时间指数的权重为p1,站点停靠时间指数的权重为p2,加权求和后的总指数为index',由站点停靠时间指数与路段旅行时间指数求总指数的公式如式(XIV)所示:
index'=p1*travel_index+p2*stop_index (XIV)。
在对聚类结果进行分析确定权重,要考虑到映射后指数的分布,使指数分布大致符合正态分布规律。
根据本发明优选的,所述步骤(5)的映射按如式(XV)进行:
index={index'-min(index')}/{max(index')-min(index')}*(M-N) (XV)
式(XV)中,M为映射后区间的上限,N为映射后区间的下限,min(index')是指:取指数index'的最小值,max(index')是指:取指数index'的最大值。
根据本发明优选的,M=10,N=0。
根据本发明优选的,所述步骤(6),具体步骤包括:如果当前处理间隔内的公交线网总运行指数处于区间[0,2],则判定当前处理间隔内公交车运行水平为畅通状态,如果当前处理间隔内的公交线网总运行指数处于区间(2,4],则判定当前处理间隔内公交车运行水平为基本畅通状态,如果当前处理间隔内的公交线网总运行指数处于区间(4,6],则判定当前处理间隔内公交车运行水平为轻度拥堵状态,如果当前处理间隔内的公交线网总运行指数处于区间(6,8],则判定当前处理间隔内公交车运行水平为中度拥堵状态,如果当前处理间隔内的公交线网总运行指数处于区间(8,10],则判定当前处理间隔内公交车运行水平为严重拥堵状态。
本发明的有益效果为:
1、更高效、准确的地图匹配算法。本发明在用GPS点在路段上的投影点匹配GPS点地理位置的过程中,结合公交线路的途经路段、站点位置、到离站时间等信息,删除大量不符合条件的记录,提高了匹配效率,并且在匹配过程中,用站点方向、到离站时间等信息校验计算结果,大大提高了地图匹配的准确性;
2、单公交车出行链数据质量处理。本发明的数据处理首先是基于单车单次旅行进行分析,地图匹配之后,通过GPS数据追踪单车轨迹,计算出单车单次旅行时间,从而计算出全路网的运营指数。在数据质量处理的过程中,结合公交线路信息,进行无效、冗余、错误数据的删除。比如,删除同一车辆在同一站点相邻时间内多次到、离站数据,保留第一个到站数据和第一个离站数据;删除不完整的到离站数据;利用站点的方向校正根据车头方向计算的车辆行驶方向等。
3、改进了公交车运行评价方法。主要体现在以下方面:
(1)在评价路段旅行时间、站点停靠时间的过程中,是经过大量数据分析得到一个基准值来反应公交车自由流状态,而非采用公交设计时速,使计算结果更贴合实际状况,从而更好的反应公交车的真实运行状况;
(2)路段旅行时间指数与站点停靠指数联合分析,得到最后的拥堵指数,从而可以从公交车的路段运行状况和站点停靠状况两方面来综合评价公交车的运行状况,更加全面客观;
(3)评价对象多元化。由于路段旅行时间指数是基于单车单次经过某子路段求旅行时间指数,停靠时间指数是基于单车单次停靠某站点求停靠时间指数,因而大大地方便了多种评价需求,比如分区域、分线路、分时段评价公交线网运行状况等,更利于从多个角度来评价分析公交线网;
4、实时数据处理。本发明采取建立动态数据表的方法来分析数据,程序模块化,数据预处理、地图匹配、旅行时间指标计算、停靠时间计算功能模块化,各模块并行处理,极大地提高了程序运行效率,从而达到数据实时处理的效果;
5、公交线网服务分级方法。区别于传统的用路段速度进行服务分级的方法,本发明在分析大量数据之后,取出适当的参数,将旅行时间指数与停靠时间指数加权求和,并映射到0-10的区间,根据指数的分布进行公交线网服务分级。GPS的漂移、建筑物长期遮挡、到离站信息上传过早等因素会导致到离站信息上传位置与实际站点位置有差别,从而造成的计算的误差。传统速度分级的方法对单个数据依赖性强,数据误差波动大,无法避免上述各种问题。而本发明所使用的分级方法基于大量历史数据求取参数,有效地减少了上述各种问题所导致的误差,能够更加准确的反映出当前公交路网的实际运行状况。
附图说明
图1是本发明基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法的流程图;
图2是本发明标准化的静态路网基础信息数据库的构建流程图;
图3是本发明地图匹配的流程图;
图4是本发明站点停靠时间指标计算的流程图;
图5是本发明路段旅行时间指标计算的流程图;
图6是本发明总指标分析处理流程图;
图7是采用传统的用速度评价路网运营状况的方法求出来的2016年3月1日路段旅行速度分布示意图;
图8是实施例中2016年3月1日路段旅行时间指数的分布示意图;
图9是实施例中2016年3月1日路网各项指数变化趋势示意图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例
基于公交车GPS数据的大范围城市公交线网实时运行水平评价方法,如图1所示,包括步骤如下:
(1)建立标准化的静态路网基础信息数据库和公交线网基础信息数据库,建立公交线网基础信息数据库包括:定义路段、定义子路段、定义路段折线段、确定公交站点信息、确定公交线路信息、匹配站点与路段信息;
两个相邻路口之间的道路为一个路段,路段信息包括路口起点编号、路口终点编号、路段编号、路段名称、路段长度、路段方向、路段所在道路名称、路段所在道路的等级;
子路段由路口与公交站点将路段进一步划分确定,路口与公交站点、公交站点与公交站点之间的路段均定义为子路段,同一路段的所有子路段按照该路段方向排序编号,子路段信息包括子路段起点编号、子路段终点编号、子路段长度和子路段方向;
路段折线段是指为同一条路段上的相邻折点之间的路段,路段折线段信息包括折点编号、路段折线段起点编号、路段折线段终点编号、路段折线段编号、路段折线段方向、路段折线段所在道路的等级、折点的经度和纬度;
公交站点信息是指公交线网上所有公交站点的统一命名编号,可保证不同公交线路经过相同站点的数据索引唯一性,所述公交站点信息包括站点唯一编号、站点名称、站点经纬度、站点方向、站点所在的路段;
公交线路信息是指公交线网上每条公交线路途经的站点以及路段信息,以便后续地图匹配与旅行时间计算中利用线路信息使公交车GPS数据处理过程更加高效、准确。所述公交线路信息包括线路编号、站点编号、站点序列号;
匹配站点与路段信息是建立道路网络与公交线网之间的关联数据库,确定公交线网内所有公交站点在道路网络中所处路段位置,并利用公交站点将道路网络内一个路段分为多个子路段,计算并存储每个子路段的长度;
建立标准化的静态路网基础信息数据库,如图2所示,具体步骤包括:
所述标准化的静态路网基础信息包括交叉口即路口、路段、站点,依次对路口、路段、站点进行要素特性分解,确定其位置、方向、属性值及其它们之间的关联性,首先确定基础路网的构建范围,然后对比百度地图的路口信息,并在谷歌地图中识别对应位置并编号,统计该路网范围内所有路口信息,路口信息包括路口编号、路口名称、所在区号以及路口经纬度;识别路段与路口位置的关联性,并对路段进行命名、编号,统计路段信息,由于以起始点路口位置连接的路段,无法体现实际弯曲路段的情况,针对路段弯曲特性,需在路段起始点中间添加若干点,来拟合实际路线,统计路段的折线段信息;对公交站点进行统一命名编号,并统计公交站点所在路段方向、站点方向及经度和纬度位置信息,建立公交线路与途径站点的相关性数据,统计每条线路的站点序列号,获取公交站点的信息。将路网基础信息导入电子地图完成校验并完善,至此完成基础路网的构建。
(2)建立公交车GPS动态数据表,公交车GPS动态数据表存储当前处理间隔内的所有公交车GPS定位数据,1个处理间隔为1分钟,公交车GPS定位数据包括车载机编号、公交线路编号、站点编号、到站编号、离站编号、GPS设备上传的WGS-84经纬度坐标数据、定位时刻和公交车头方向,所述车载机编号即车辆编号,到站编号即进站编号,离站编号即出站编号,定位时刻即上传时间;并对公交车GPS定位数据进行预处理;对公交车GPS定位数据进行预处理,是指对公交车GPS定位数据依次进行错误数据处理、重复数据处理、缺失数据处理和冗余数据处理;
所述错误数据处理是指删除公交车GPS动态数据表中数据类型标识为错误的数据,以及按照城市范围内所有路段组成的最大路网范围为边界删除超出边界的坐标点;
所述重复数据处理是指删除车辆编号、线路编号、站点编号、到站编号、离站编号、GPS设备上传的WGS-84经纬度坐标数据、定位时刻完全重复的任意两条上传记录中一条GPS数据;
所述缺失数据处理是指删除不完整的数据,所述不完整数据包括站点编号、到站编号、离站编号数据缺失或者到站编号、离站序号为空的GPS数据;
所述冗余数据处理是指删除线路编号、车辆编号、站点编号、到站编号、离站编号完全相同但多条到站或离站记录,保留一个到站或离站数据。
(3)基于地图匹配的公交车旅行时间的数据处理与指标分析;
A、公交线网分区:根据城市路网规模将公交线网分割为多个子区,按照子区对同一处理间隔内分区的公交车GPS数据并行处理;
B、公交车GPS数据地图匹配:如图3所示,包括步骤如下:
a、对GPS动态数据表中公交车GPS定位数据进行筛选:限定在全市范围内,利用高斯-克吕格投影原理将GPS设备上传的WGS-84经纬度坐标数据转化为笛卡尔平面坐标,得到公交车GPS笛卡尔平面坐标数据;
b、计算相邻GPS设备记录的上传时间间隔,以及相邻GPS设备上传点之间的折线距离;
c、以GPS设备上传点为中心,框选方形区域,选定区域内的路段折线段;框选方形区域是为匹配GPS点所在的路段选择出一个待选路段范围,以减少计算量。方形区域的大小经过数据分析选取边长为1500米的正方形;
d、计算GPS设备上传点到选定的各路段折线段的距离和投影点坐标;
e、根据车载机和上传时间对GPS记录进行分组,根据步骤d的计算结果,选择与GPS点距离最近的一条路段折线段,与GPS点进行匹配,距离GPS点距离最近的这条路段折线段所在路段即为GPS点所在的路段;
f、计算GPS设备上传点到选定的各路段折线段的投影点坐标到路段起点的距离:GPS设备上传点到选定的各路段折线段的投影点坐标到路段起点的距离为:GPS设备上传点到选定的各路段折线段的投影点坐标到路段折线段起点距离,与路段折线段起点到路段起点距离之和;
g、修正地图匹配错误:避免路段重复、跳跃的问题;
h、结合线路信息删除无效数据,校正到、离站所在路段的信息;无效数据是指某线路上运营的公交车GPS信息匹配到的路段不在该线路经过的路段范围内;校正到、离站所在路段的信息是指根据静态路网基础信息中线路的各站点所在路段信息来校正GPS在到、离站时所在的路段信息;
i、根据基础路网信息,确定每条GPS记录所属路段的道路方向,根据相邻GPS的位置关系,确定车辆的行驶方向;
j、更新相邻GPS设备记录的上传时间间隔,以及相邻GPS设备上传点之间的折线距离,重复步骤b-步骤j。在地图匹配的过程中,结合公交线路信息进行数据处理,比如,在GPS数据与路段匹配时,根据GPS数据所属线路途经的路段信息,从待匹配路段中剔除无效路段,可以大大节省了计算时间,提高了匹配准确率。
C、计算单车单次在单路段上的旅行时间,即单辆公交车一次经过某路段所用的时间,以公交车个体作为研究对象;设定处理间隔内一辆公交车在一条路段上的行驶轨迹为一条路径,基于步骤A得到的公交车GPS数据,将公交车单车单次旅程的GPS数据链按路径分组,将相邻的3个处理间隔的路径连接形成单车行驶轨迹,假设公交车在路段上匀速行驶,利用离中间路段的两个GPS点的时间差与距离差成正比的关系,求出公交车驶入、驶出路段的时间,进而计算出中间路段的旅行时间;
D、实时计算单车单次经过子路段的旅行时间并存储在公交车GPS动态数据表中,单车单次经过子路段的旅行时间即单辆公交车一次经过某子路段所用的时间,以公交车个体作为研究对象:根据步骤B选定的单路段上布设站点个数,已知可划分的子路段数据,根据公交车的到离站时间以及步骤B中所述的公交车驶入与驶出单路段的时间,计算每条子路段的旅行时间,再根据静态路网信息中的子路段长度,求出单车单次经过子路段的旅行时间;
E、路段旅行时间指数评价:基于路段的历史旅行时间数据设置其通畅状态下旅行时间作为旅行时间基准值,定义畅通状态下旅行时间为该路段历史同期一个月平峰时段的平均旅行时间,将步骤C所述的单车单次在单路段上的旅行时间与旅行时间基准值的比值作为在当前处理间隔内单车单次经过单路段的旅行时间指数,将特定处理间隔内经过目标路段的旅行时间指数求平均,得到该目标路段的旅行时间指数,按照此方法,得到公交线网所有路段的旅行时间指数;步骤包括:
所述步骤(3),对公交线网中所有路段旅行时间指数的计算,如图5所示,包括如下步骤:
k、结合步骤B中公交车GPS定位数据匹配的路段信息,按照公交车GPS数据时间序列构建特定处理时间间隔内单车单次行驶轨迹,并以路段为单位将行车轨迹划分为单个子路径,即同一路段内的所有GPS数据为一个子路径;
l、选择公交线网中任意路段Li作为旅行时间计算对象,以路段Li为中间路段选择连续的3个子路径,分别定义为Pi-1,Pi,Pi+1;
m、提取公交车GPS关键数据,包括:子路径Pi-1中距离子路径Pi起点最近的最后一条GPS数据的时刻ti-1和位置di-1,子路径Pi+1中距离子路径Pi终点最近的第一条GPS数据的时刻ti+1和位置di+1,子路径Pi中距离其起点最近的第一条GPS数据的时刻ti1和位置di1,子路径Pi中距离其终点最近的最后一条GPS数据的时刻ti2和位置di2,子路径Pi所在路段长度li,子路径Pi所在路段Li上的站点数q以及公交车在站点j的到站时间tj1和离站时间tj2,站点j为路段Li中的任意站点;
n、计算子路径Pi的旅行时间,分为以下两种情况:
当GPS记录的相邻路径在相邻路段上,则车辆驶入路径Pi的时间utcin_i、车辆驶出路径Pi的时间utcout_i的计算公式如式(Ⅰ)、式(Ⅱ)所示:
utcin_i=ti-1+(ti+1-ti-1)*di-1/(di-1+li+di+1) (Ⅰ)
utcout_i=ti+1-(ti+1-ti-1)*di+1/(di-1+li+di+1) (Ⅱ)
当GPS记录的相邻路径在不相邻路段上且相隔一个路段,则车辆驶入路径Pi的时间utcin_i、车辆驶出路径Pi的时间utcout_i的计算公式如式(Ⅲ)、式(Ⅳ)所示:
utcin_i=ti1-(ti1-ti-1)*di1/(di-1+di1) (Ⅲ)
utcout_i=ti2+(ti+1-ti2)*di2/(di2+di+1) (Ⅳ)
o、假设路径Pi上的q个站点按照车辆经过的先后顺序编号为1,2,…,k,…,q,以q个站点为分割点,将路段Li分成q+1个子路段Qij,选择路段Li上的子路段Qij作为旅行时间计算对象,沿公交车前进方向,以子路段Qij为中间子路段选择位置相邻的3个子路段,分别定义为子路段Qi(j-1),Qij,Qi(j+1);基于公交车在路径Pi所在路段Li上的驶入时间与驶出时间,以及公交车在站点j的到站时间tj1和离站时间tj2,计算第s车次经过路段Li上的子路段Qij的旅行时间ts(ij),如式(Ⅴ)所示:
式(Ⅴ)中,tj1为公交车在第j个站点处的到站时间,t(j-1)2为公交车在第j-1个站点处的离站时间;
p、求取畅通状态下的旅行时间基准值Tv(ij),本实施例中取历史一个月的平峰时段经过该子路段的所有车辆的平均旅行时间,如式(Ⅵ)所示:
式(Ⅵ)中,n为历史一个月的平峰时段内经过子路段Qij的车次总数;
q、求取单车第s次经过单子路段Qij的旅行时间指数Isij,如式(Ⅶ)所示:
Isij=ts(ij)/Tv(ij) (Ⅶ)
r、计算全网路段旅行时间评价指标travel_index:
①计算每条子路段指数权重pij,按照子路段长度占路网总长度的比例值作为指数权重,如式(Ⅷ)所示:
式(Ⅷ)中,n为评价范围内的路段数目,m为路段上的子路段数目,lij为子路段Qij的长度,
②将第s车次经过子路段Qij的单车旅行时间指数,按照评价对象要求(全市,分区,分线路等)在特定处理间隔内加权求和,得到全网路段旅行时间评价指标travel_index,如式(Ⅸ)所示:
式(Ⅸ)中,z为特定的处理间隔内经过子路段Qij的车次总数,Isij为第s车次经过子路段Qij的单车旅行时间指数。特定的处理间隔指分析指数时,所定义的处理间隔长度,假如定义特定的处理间隔为5分钟,则每5分钟的数据可求出一个旅行时间指数。为使计算方便,本发明将此处时间间隔与步骤2.中的动态数据表数据处理间隔取相同值。
F、将公交车GPS动态数据表中存储的单车单次经过子路段的旅行时间导入旅行时间数据总表;步骤D计算出来的单车单次经过子路段的旅行时间为实时数据,存储在公交车GPS动态数据表中。通过数据库操作,将公交车GPS动态数据表中的实时数据转存到旅行时间数据表中,对历史公交车运营状况评价时,可以跳过地图匹配、旅行时间计算等步骤,直接从旅行时间数据总表调取数据,进行路段旅行时间指数评价,极大地方便了对历史公交运营状况的评价,提高了计算效率。
(4)基于站点停靠时间的数据处理与指标分析;如图4所示:
G、计算单车单次站点停靠时间,即单辆公交车一次经过某站点的停靠时间,以公交车个体为研究对象;根据步骤A确定的公交线网分区,利用数据库强大的数据处理与运算能力,处理当前间隔内采集到的所有公交车GPS到离站数据,并将其与公交路网基础信息数据相关联,得到该当前处理间隔内的单车单次在其途径站点的停靠时间;
H、计算单车单次的站点停靠时间指数:基于站点的历史停靠时间数据设置其畅通状态下站点停靠时间为停靠时间基准值,定义畅通状态下站点停靠时间为站点历史同期一个月的平均停靠时间,将步骤G所述的单车单次站点停靠时间与该站点停靠时间基准值的比值作为在当前处理间隔内单车单次的站点停靠时间指数;
I、站点停靠时间指数评价:按评价对象要求(全市、行政区、线路等)在特定处理间隔内加权求和,得到全网站点停靠时间评价指标;如图6所示,包括步骤如下:
s、选择单车单次经过路段Li的子路段Qij上的站点j作为站点停靠时间计算对象,站点停靠时间为单车单次站点停靠时间,单车单次站点停靠时间由式(Ⅹ)求出:
stop_timeij=tj1-tj2 (Ⅹ)
式(Ⅹ)中,stop_timeij为单车单次经过路段Li的子路段Qij上的站点j的停靠时间,tj1为站点j到站时间,tj2为站点j离站时间;
t、畅通状态下停靠时间基准值Tt(ij)取历史一个月经过该站点的平均停靠时间,由式(Ⅺ)求出:
式(Ⅺ)中,Tt(ij)为路段Li上站点j的畅通状态下停靠时间的基准值,tkij为第k车次经过路段Li上站点j的停靠时间,n为历史一个月经过站点j的车次总数;
u、单车第k次经过路段Li上站点j的停靠时间指数为wait_indexkij,由式(Ⅻ)求出:
wait_indexkij=tkij/Tt(ij) (Ⅻ)
式(Ⅻ)中,wait_indexkij为单车第k次经过路段Li上站点j的停靠时间指数;
v、计算全路网站点停靠时间指标stop_index,按评价对象要求(全市、行政区、线路等)在特定时间间隔内加权求和,得到全网站点停靠时间评价指标,由式(XIII)求出:
式(XIII)中,n为特定时间段内的站点的总数。
为使计算方便,本发明将此处时间间隔与步骤2.中的动态数据表数据处理间隔取相同值。
J、将该处理间隔内的站点停靠时间数据处理结果导入到站点停靠时间总表,即将该处理间隔内的站点停靠时间数据处理结果导入到站点停靠时间总表,保存当前处理间隔内的数据结果,并估计下一处理间隔内的站点停靠时间,极大地方便了对历史公交运营状况的评价,同时也提高了计算效率。
(5)总运行指标分析与处理:
将数据处理间隔内的路段旅行时间指数与站点停靠时间指数加权求和,确定各指数的权重并映射到0至10,得到当前处理间隔内的公交线网总运行指数;
所述权重为指标在整体评价中的相对重要程度,设路段旅行时间指数的权重为p1,站点停靠时间指数的权重为p2,加权求和后的总指数为index',由站点停靠时间指数与路段旅行时间指数求总指数的公式如式(XIV)所示:
index'=p1*travel_index+p2*stop_index (XIV)。
在对聚类结果进行分析确定权重,要考虑到映射后指数的分布,使指数分布大致符合正态分布规律。
步骤(5)的映射按如式(XV)进行:
index={index'-min(index')}/{max(index')-min(index')}*(M-N) (XV)
式(XV)中,M为映射后区间的上限,N为映射后区间的下限,min(index')是指:取指数index'的最小值,max(index')是指:取指数index'的最大值。
M=10,N=0。
(6)公交线网服务分级;如果当前处理间隔内的公交线网总运行指数处于区间[0,2],则判定当前处理间隔内公交车运行水平为畅通状态,如果当前处理间隔内的公交线网总运行指数处于区间(2,4],则判定当前处理间隔内公交车运行水平为基本畅通状态,如果当前处理间隔内的公交线网总运行指数处于区间(4,6],则判定当前处理间隔内公交车运行水平为轻度拥堵状态,如果当前处理间隔内的公交线网总运行指数处于区间(6,8],则判定当前处理间隔内公交车运行水平为中度拥堵状态,如果当前处理间隔内的公交线网总运行指数处于区间(8,10],则判定当前处理间隔内公交车运行水平为严重拥堵状态。
本实例根据公交数据自身的统计特性比较科学的对拥堵程度进行了分类。
本实例将本发明所提出的路段旅行时间指标评价方法与传统的用路段速度评价的方法进行了对比,分别使用上述两种方法对多日GPS数据进行分析,此处2016年3月1日的分析结果进行展示,图7为传统的用速度评价路网运营状况的方法求出来的路段旅行速度分布示意图,图8是使用本实施例所提出的路段旅行时间指标评价方法计算出来的路段旅行时间指数分布示意图。由图7、图8对比可见,采用传统的用速度评价路网运营状况的方法得到的路段旅行速度并不能反应路网在早晚高峰时的实际运行状况,而用路段旅行时间指标能更加科学的反映路段真实的运行状况。
为了能更加合理、全面的反映公交路网的交通运行状态,本实例在分析了大量数据之后,取出适当的权重参数,将旅行时间指数与停靠时间指数加权求和,并映射到0-10的区间。此处选取2016年3月1日的分析图进行展示,路段旅行时间指数和站点停靠时间指数与加权之后的总指数,即公交线网总运行指数(路网综合指数)、路段旅行时间指数以及站点停靠时间指数曲线图见图9。
由图9可以看出,本实施例中,本发明所提出的用路段旅行时间指数与站点停靠时间指数联合分析并映射所得的评价指数能够更加实际的反映出公交车运行状况,且该评价方法综合考虑到两个方面,评价更加全面具体,贴合实际。