一种基于时空地理加权回归的公交客流影响因素识别与预测方法与流程

文档序号:11432929阅读:3090来源:国知局
一种基于时空地理加权回归的公交客流影响因素识别与预测方法与流程

本发明属于智能交通信息处理技术领域,具体地说是一种基于时空地理加权回归(gtwr)的公交客流影响因素识别与预测方法。



背景技术:

随着城市化进程的不断加快和汽车的普及,道路交通量逐渐增加。大量的私家车导致交通拥堵,环境污染等一系列问题。大力发展公共交通是解决城市拥堵最有效的方式之一。公交需求分析是发展公共交通的基础,而探究公交客流的成因,预测客流量是公交需求分析的核心内容。充分了解客流的影响因素,准确预测公交客流能够有效的提高公共交通规划的可行性,从而提高公共交通的吸引力,减少小汽车的使用,缓解城市拥堵。用地作为交通形成的根本原因,对于客流量的大小和分布起到决定性的作用。目前的研究多以建成环境为自变量,来探索用地对客流的影响。研究发现区域公交客流与周围的用地密度关系密切,用地密度的增加会导致公交出行的增加。

目前最常用的客流预测的模型有普通最小二乘法(ols)和地理加权回归(gwr)。普通最小二乘回归是最经典的回归模型,但是模型过于简单,难以解决复杂的空间问题。而地理加权回归在最小二乘法回归基础上加入空间信息,将客流的位置坐标加入模型中,能够揭示用地与客流之间关系的空间异质性,即不同地理位置中两者的关系可能存在差异,非常适用于空间客流的分析。然而随着公共交通系统的不断完善和发展,客流不仅表现出空间的不均衡性,也表现出时间上的不均衡性。早晚高峰时间段内客流集中,客流量大;而平峰时间段内公交客流较少。因此挖掘土地利用与客流关系的时间变化对于解决客流的不均衡分布,提高公共交通服务水平起到至关重要的作用。同时考虑客流的时间非平稳性和空间非平稳性的客流预测是研究的新思路,而目前的方法大多以空间变化为基础,不能够将时间变化纳入方法中,因此研究结果会丢失相关性的时间变化信息,不能完整的表征用地与客流关系的变化特征,预测的精度较差。

线路走向和站位选择是公交线路规划的核心问题之一。利用本次研究的结果,能够更好的识别不同地理位置下各种用地与公交需求之间的关系,为站位的选择和线路的走向提供更具针对性的指导。同时根据更准确的客流预测结果能够更好的设计线路的能力和时刻表,提高服务水平,增加公共交通的吸引力。而在公共交通系统的运营过程中,需要随时针对客流情况调整管理方案。本发明识别得到的相关系数时间变化特征可以为公交系统管理者提供更细致的理论指导从而根据不同时段制定出更具针对性的运营措施。



技术实现要素:

本发明为克服上述现有技术和研究的不足,提供一种基于时空地理加权回归的公交客流影响因素识别与预测方法。相比于ols模型和gwr模型,本发明可以同时考虑时间非平稳性和空间非平稳性,揭示用地对客流影响的时空特征,克服已有方法缺少时间变量的缺点,提高了拟合精度,能够提取更多的时空信息,对于深入探究客流的特征,准确预测客流,进行公交优化具有重要的意义。

本发明的一种基于时空地理加权回归的公交客流影响因素识别与预测方法,首先利用公交ic基础数据以小区为单位进行数据聚类处理,以15分钟为一个统计时段计算公交上客量。用地数据使用城市poi(pointofinterest)提取不同小区内各类poi数量,与小区面积相除得到用地密度基础数据。然后根据研究方向,统计需要的时段客流量(小时/天)。基础数据处理得到研究所用的客流时空点,包含每个客流点所在小区的经纬度和测量时间。根据数据结构构建时空坐标系,以小区中心点经纬度为xy平面,客流量为z轴。因为距离和时间度量使用不同的单位,因此建立的时空坐标是需要对z坐标进行转换,得到椭圆坐标系。在椭圆坐标系内计算各时空客流点之间的距离,并根据距离构建每一个客流点与其他客流点之间的时空回归权重矩阵。权重值与客流点之间的距离成反比,距离越近相互之间的影响越大。得到时空回归权重矩阵后利用加权最小二乘法计算回归系数,得到不同交通小区不同时段公交上客量与用地密度之间的回归方程。gtwr模型计算复杂,得到的信息十分丰富,根据分析需求可以绘制时间和空间维度的相关系数变化图,探究客流与建成环境相关关系的时空特征。同时能够更加准确的预测公交客流量,为公交规划提供更精确的数据支持。

本发明的优点在于:

(1)本发明最大的特点就是将客流的时间非平稳性加入传统的客流预测和分析模型中,通过构建时空坐标系度量时空客流点之间的距离,以时空回归权重矩阵的形式表达时空客流观测点之间的影响。不仅提高了拟合精度,同时提供更多的细节,对于挖掘客流深层次规律具有十分重要的意义,能够有效提高客流预测的精度。

(2)本发明可以同时提供相关系数在时间和空间上的变化,满足不同的分析需求,同时可以进行可视化处理,提高分析的形象性和可读性。其中相关系数的时间序列是本次发明的亮点之一,根据相关系数的时间变化可以指定具有时间针对性的客流管理方案,在不同时段采取不同的管理措施更好的满足乘客的需求。

附图说明

图1时空三维坐标系示意图

图2北京市六环交通小区示意图

图3公交相关系数均值空间分布示意图

具体实施方式

下面将结合附图和实施例对本发明作进一步的详细说明。

本发明提供一种基于时空地理加权回归的公交客流影响因素识别与预测方法,包括以下几个步骤:

步骤一、客流与用地密度提取

公交客流的原始数据为ic卡数据,利用ic数据中乘客的上车站点、时间等信息将乘客聚类至交通小区内,统计不同时段小区公交上客量,具体时长可根据研究需求确定,通常情况以小时或天为单位进行客流统计。用地密度以城市poi数据为基础,同样以交通小区为基本空间统计单位,首先计算不同小区不同用地poi的数量,与小区面积相除得到小区用地密度数据作为城市建成环境的度量。poi具体分类如下表:

步骤二、基于gtwr模型的时空特征计算

本发明以gtwr模型为基础,最大创新点是同时加入时间和空间的非平稳性,考虑不同时空下的客流之间的相互影响。具体计算步骤为:

1)构建时空坐标系

度量非平稳性的关键是建立权重矩阵度量不同观测点之间的影响程度的大小,通常认为距离与相互之间的影响成反比。计算时空距离的关键是平衡时间和空间的度量单位。在空间三维坐标系中,因为xyz轴单位相同,可以利用一个球体表征各点之间的相对关系。而时空坐标系中,因为时间和空间度量的单位不同,因此使用椭圆形坐标系更合理,如图1所示。设两点之间的空间距离差为

其中表示观测点i、j点之间的空间距离,ui和vi表示观测点的经度和维度。观测点之间时间距离可表示为:

其中表示观测点i、j点之间的时间距离,ti和tj表示数据的观测时间。

类比三维空间欧氏距离计算公式,构建时空距离计算公式如下:

其中λ,μ为平衡时空单位的权重参数。

2)计算时空回归权重矩阵

根据各个观测点的时空距离可以构建每个观测点的时空权重矩阵用来度量回归分析中不同测量点之间的影响。使用高斯函数构建权重矩阵:

其中为点i,j之间的时空距离,hst为高斯函数中比例权重,称为带宽。将时空距离计算公式带入权重计算中得到

其中是空间权重,是时间权重。

当客流量在同一平面内时,权重值λ=0;当客流量在同一时间段测量时,则权重值μ=0。在实际应用中,一般情况下观测点的时间和空间都不相同,因此必须同时确定λ,μ的值。为了简化模型,令则距离计算公式可以改写成:

同理,权重值公式可以改写成:

其中,因为wij的分子分母同时除以λ并不影响权重值的计算,因此可以将权重函数简化,此时只需要计算一个时空参数τ。

在权重计算公式中,需要同时确定带宽值hst和时空距离参数τ。利用交叉验证(cross-validation)计算交叉验证残差平方和(cvrss)来确定最优的参数值。具体计算公式为:

其中,yi为当带宽为hst时,观测点i的回归值。y≠i(hst)为除去点i之外其他各点回归值。当cvrss值最小时,取到合适的带宽值。同理可以确定时空距离参数τ。

3)回归参数估计

利用1)2)中计算得到的时空回归权重矩阵可以构建回归方程:

其中yi为i点的回归值,β0(ui,vi,ti)为截距,βk(ui,vi,tt)为变量k的回归系数,xik为建成环境密度变量,εi为误差项。

利用加权最小二乘法,通过计算

使得其取得最小值来进行参数估计,其中wiuvt为时空权重值。设对角线矩阵w(ui,vi,ti)=diag(w1uvt,w2uvt,...wnuvt),则参数估计可以用矩阵表示为:

步骤三、用地对客流影响系数时空分布可视化处理

利用步骤二求得每一个时空客流点与周围用地之间的相关系数。同一类型的用地的相关系数在时间和空间上都存在很大差异,这为客流与土地利用之间的关系研究提供十分详细的理论支持,是本发明的核心贡献点之一。根据分析需求,可以分别绘制相关系数在空间分布的示意图以及时序折线图,为研究提供更直观更易理解的图形表示。

实施例

为了验证本发明所诉的一种基于时空地理加权回归的公交客流影响因素识别与预测方法的系统性能,采集北京市六环内2015年6月交通小区客流量进行实例验证。

1)如图2所示,为北京市六环内交通小区示意图,共有1377个小区,其中有公交客流的共有1207个交通小区。实例研究交通小区小时客流量与小区建成环境的关系,时间选取为6:00-23:00共18小时。原始客流数据量为1207×18=21726.

建成环境数据为北京市poi基础数据,共包含北京市1355509个兴趣点。根据建成环境分类,利用空间处理计算1207个交通小区内11类建成环境的密度,分别为:居住用地、旅店住宿、商业娱乐、生活服务、工作就业、风景名胜、公交站点、地铁站点、道路、对外交通、停车场。

2)根据gtwr模型构建时空三维坐标系,利用交叉验证计算时空参数。当时间单位为天,距离单位为米时,时空平衡参数可选用35.同时求解公式

最小值确定高斯函数带宽为:0.1027。

3)根据gtwr计算不同小时内小区客流量与用地密度的相关系数。统计不同用地的相关系数的特征值如下表。特征值表征建成环境对小区小时公交上客量影响的总体特征,例如影响的平均水平,离散程度等。

除了整体特征的统计分析,本发明还提供了针对特征地点和特定时间内的影响分析方法,深入研究不同时空条件下客流与建成环境之间的关系的变化规律。图3表征公交站点与客流量之间相关系数均值在空间中分布情况。

实例结果展示本发明在研究小区交通客流与用地之间相关关系中有较高的准确性,这表明发明提出的一整套一种基于时空地理加权回归的公交客流影响因素识别与预测方法具有较高的可行性的。

以上所述,仅是本发明较佳的实施例,并非对本发明任何形式上的限制,凡是根据本发明的技术实质对以上实施例所做的任何简单修改、等同变化和修饰,均仍属于本发明技术方案保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1