本发明属于交通运输技术领域,可基于手机信令数据和浮动车数据获取城市小汽车不同时段的动态出行OD矩阵。
背景技术:
获取小汽车出行OD是合理制定交通管理策略、交通规划的必要条件,目前主要通过大规模人工调查实现,费时、费力且精度低,北京市于2014的开展的第5次居民出行调查,花费约3000万,耗时近一年时间,抽样率不足1%,能够调查到的信息非常有限。OD估计技术是实现小汽车OD获取的重要途经,可靠的先验OD与充分的约束条件是获得准确OD估计结果的必要条件。然而由于目前难以获取可靠的动态先验OD,且城市路网中用于作为OD估计约束条件的动态观测流量有限,使得难以通过OD估计技术实现小汽车动态OD获取。
技术实现要素:
本发明提供一种基于信令数据和浮动车数据的小汽车动态OD估计方法,其主要内容是:
一是针对目前动态OD估计缺乏动态先验OD的问题,本发明提供了基于手机信令数据和交通调查数据的动态先验OD获取方法;二是针对动态OD过程中观测交通流量覆盖范围有限、约束不足的问题,本发明提供了基于浮动车数据的出行分布特征约束条件,并提供了不同样本量条件下的出行分布特征计算方法;三是为了将路段流量约束和出行分布特征约束共同纳入到OD估计过程中,本发明建立了双约束条件的极大熵OD估计模型并提供了求解方法。
为实现上述目的,本方法采用的技术方案为一种基于信令和浮动车数据的小汽车OD提取方法,该方法的具体实施内容如下:
1)基于信令数据的小汽车动态先验OD获取方法
目前,基于信令数据提取全交通方式出行OD的技术已较为成熟,虽然难以获得实时的信令数据,但仍可借助其大样本量、可分时段的优势提取小汽车动态先验OD,为动态OD估计提供基础条件。然而,由信令数据获取的OD矩阵通常是“全方式OD”,不能将其直接作为小汽车先验OD矩阵。
本方法通过改进信令OD实现了小汽车先验OD提取方法。设由信令数据提取得到的t时段的全方式OD矩阵为中由i小区到j小区的出行量为则在理想条件下,若能获得对应时段i小区到j小区的小汽车出行比例则在该时段由i小区到j小区的小汽车出行量为:
该时段的小汽车出行OD矩阵为:
其中C(t)为各个交通小区间的小汽车出行比例矩阵,即
然而在实际进行出行方式的比例调查时,往往只考虑出行的起点小区,不考虑出行目的地,且很少区分时段进行调查,则由i小区出发的前往其他各小区的所有出行中,小汽车的出行比例均为ci,此时只能对进行粗略估计:
则该时段的小汽车出行OD矩阵的估计结果为:
其中C为不区分时段的任意两小区间的小汽车出行比例矩阵。显然,由此获得的各时段小汽车OD精度有限,若可获得部分路段的历史流量数据,则可通过OD估计的方法进一步提高各时段小汽车OD的精度,最终基于信令数据、交通方式调查数据、历史流量数据获得可靠的小汽车动态先验OD。
2)基于浮动车数据的出行分布特征约束条件提取
目前进行城市路网动态OD估计时可使用的约束条件为动态流量观测数据,然而由于目前道路流量观测设备有限,使得在以路段流量作为约束条件进行OD估计时约束条件较少,导致全路网动态OD估计精度较低。本方法提出了小汽车出行分布特征概念,并将其作为流量约束外的并存约束条件纳入OD估计过程中,用以提高OD估计精度。
对于任意小区,称由该小区出发的小汽车前往不同小区的比例分布构成情况为该小区的小汽车出行分布特征。路网中的浮动车即载客出租车视为路网中小汽车的部分样本,其出行分布特征能够有效反应小汽车的出行分布特性,因而利用浮动车数据进行小汽车出行分布特征的提取:
其中,Pij是i小区至j小区的小汽车交通量占由i小区出发的所有小汽车交通量的比例,是i小区至j小区的浮动车交通量占i小区出发的所有浮动车交通量的比例,Tij是小区i到小区j的小汽车交通量,Fij是小区i到小区j的浮动车交通量。{Pi*}为i小区的出行分布特征矩阵。
由于浮动车数据样本量有限,出现个别小区间浮动车流量Fij为0的情况,则由浮动车数据获取的这些小区间的小汽车出行分布比例为0,可能与客观情况不符。为了避免这种现象,对公式1进行改进,对于某个小区i而言,仅利用浮动车数据描述i小区到Fij>0的多个目的地小区的出行分布情况:
其中,Jij为满足下述条件的所有的小区集合:i小区到这些小区的浮动车流量Fij>0;P′ij为i小区至该Jij小区集合中j小区的小汽车出行分布比例;为i小区至该Jij小区集合中j小区的浮动车出行分布比例。{P′i*}为改进后i小区的出行分布特征矩阵。在浮动车样本量充足的情况下,由该式即可完成基于浮动车数据的出行分布特征提取。
3)样本量不足情况下的出行分布特征估计方法
本方法提供了基于浮动车数据提取小汽车出行分布特征时的样本量需求计算方法。对于某一OD对ij而言,由该小区i出发的任意载客浮动车视为一次伯努利试验,试验结果包括两种:浮动车由i小区出发前往了j小区,浮动车未从i小区出发前往j小区。由于浮动车样本的绝对量大,因而结合正态分布性质进行样本量分析,最终得到样本量需求为:
其中,为计算ij间小汽车出行分布特征时i小区所需的浮动车总样本量,为使用现有浮动车数据计算得到的ij间出行分布比例,Δij为误差允许范围,(1-α)为置信水平。可见所需的置信水平越高、误差范围越小、出行分布比例越小,则起点小区i所需的样本量越大。
在样本量满足要求的情况下,直接采用公式2进行小汽车出行分布特征计算;在样本量不足时,提出了基于聚类算法的出行分布特征估计方法。其基本原理是通过小区聚类的方法聚集前往特定d小区近似可能性较大且样本量不足的小区,聚类后的各小区形成一个抽象的融合小区k,将这些小区的样本集合作为融合小区k的样本。显然,相比各个组成小区而言,融合小区k的样本将明显扩大,其满足样本量需求的可能性即更大。若融合小区的样本量满足要求,则以样本集合完成融合小区的的计算,并将计算结果赋予各个组成小区,各个组成小区最将终获得相同的估计值。在进行聚类时,由于现有样本量不足,难以基于现有样本进行相似性的判断,基于大量历史数据实现当前时段潜在相似性的判断,则在聚类时小区间的相似性判断标准为采用多种聚类算法实施聚类。
在完成聚类后,对于满足样本需求的融合小区,则可利用融合小区完成各组成小区的出行分布特征估计,对于仍无法满足样本需求的小区,则采用历史同期数据进行出行分布特征估计。
4)流量和出行分布特征双重约束OD估计模型
在基于浮动车数据获取小汽车出行分布特征后,将出行分布特征和路段流量作为并存约束,结合动态先验OD即可实现小汽车动态OD的估计。基于极大熵思想模型构建了双重约束下的OD估计方法。
其中,Va表示路段a上的观测交通流量;为OD对ij间交通量Tij途经路段a的比例,通常由交通分配模型获得,作为OD估计中的已知条件;n为交通小区总数。Ji为满足下述条件的所有的小区集合:当前时段,i小区到这些小区的浮动车流量Fij>0。P′ij为该小区至该Jij小区集合中小区j的小汽车交通量占该小区至Jij中所有小区小汽车交通量的比例。{tij}为当前时段的先验OD矩阵。
上述OD估计模型可通过拉格朗日乘子法进行展开,获得与未知量个数相同的非线性方程,进而实现求解。
非线性方程的求解方法采用遗传算法或蚁群算法等予以实现。
本发明具有以下有益效果:
该发明的基础数据来源于目前使用广泛的信令数据、浮动车数据和道路检测器数据,可有效解决目前动态OD估计中动态先验OD难以获取的问题,在现有数据条件下提供充分的约束条件进而实现小汽车动态OD估计。
附图说明
图1为本方法的实施流程。
图2为基于信令数据的全方式OD提取结果。
图3为各小区前往50108小区的各小区最终结果。
具体实施方式
下面结合附图1对本发明详细描述其具体实施过程。
整体过程如图1:本方法计算流程所示。分为三部分内容:基于信令数据的小汽车动态先验OD的获取、基于浮动车数据的出行分布特征的获取、双重约束下的OD估计。
以北京市2015年某工作日6:00~22:00间逐小时的小汽车OD估计为例进行说明。
1.小汽车动态先验OD的获取
(1)动态全方式OD的获取
首先由信令数据完成分析时段内的原始全方式出行OD提取,并进行清洗、扩样等处理,再以1小时为间隔进行OD拆分,获得各小时的全方式出行OD,如图2所示。
(2)小汽车动态先验OD的获取
在全方式OD的基础上,进一步结合出行方式调查数据和流量调查数据进行小汽车动态先验OD的提取。本例中采用北京市第四次交通大调查数据为例进行方式划分,以2015年北京市大范围交通流量人工调查数据作为流量调查数据,采用静态极大熵OD估计方法完成先验OD的校准,获得6:00~22:00间各小时的小汽车先验OD。
2.基于浮动车的小汽车出行分布特征提取
(1)载客出租车OD提取
浮动车原始数据中记录了车辆位置、载客状态、经纬度、时间等信息,如表1所示。
表1原始浮动车数据内容实例表
由浮动车原始数据可处理得到载客出租车的出行事件信息,其中主要包括出行起止位置、时间等信息,如表2所示。
表2浮动车载客出行事件信息提取结果实例
将载客出租车出行起终点与交通小区完成匹配后即可获得各小时的载客出租车出行OD矩阵,进而可用于小汽车出行分布特征的提出。
(2)小汽车出行分布特征提取
在基于浮动车数据进行出行分布特征提取时需进行样本量满足性检验,本例中以80%置信水平和25%误差允许范围为例进行样本满足性检验。经检验,全日16个时段各小区间的浮动车样本满足率仅为8.4%,因而需采用聚类算法展开出行分布特征估计。
本算例采用近邻传播聚类算法(AP算法)进行小区聚类。以17:00~18:00时段某小区(编号50108)为目的地小区为例,聚类前(图3)该时段共有298个小区至该小区样本量不足,聚类后75%的小区满足了样本量需求,其余25%的小区采用历史同期值进行估计。最终各小区至50108小区的出行分布特征如图3所示。
采用上述方法对全天16个时段各OD间的小汽车出行分布特征进行计算后,样本满足率达到了76.1%,相比于未聚类前的8.4%改善效果明显,对于当前时段样本量仍然不足的部分OD,采用历史同期值进行估计,至此完成基于浮动车数据的小汽车出行分布特征提取。
3.小汽车动态OD估计
采用上述内容获得的各小时动态先验OD、小汽车出行分布比例,进一步结合流量检测器数据即可利用公式4完成OD估计,求解算法采用遗传算法。本例中采用分析日当日的北京市快速路微波检测器观测得到逐小时流量数据作为流量约束条件。
经OD估计并进行交通分配后得到:分析日北京市小汽车出行总量为489万辆次,小汽车平均出行距离为36.6公里。以路段流量的模型计算结果和观测结果的拟合程度验证OD估计结果,检验结果显示:各小时快速路路段流量平均误差为8.6%,次干路、主干路流量平均误差为14.3%,可见验证结果理想,OD估计结果较为精确,实现在现有数据条件下的小汽车动态OD估计。
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。