一种融合多尺度时空统计信息的短时交通需求预测方法

文档序号:24556736发布日期:2021-04-06 12:07阅读:140来源:国知局
一种融合多尺度时空统计信息的短时交通需求预测方法

本发明涉及一种融合多尺度时空统计信息的短时交通需求预测方法,属于深度学习与交通需求预测的交叉技术应用领域。



背景技术:

需求响应网约出行服务作为信息通信技术(ict)在智能交通中的创新应用之一,在居民日常出行中越来越受欢迎。作为需求响应出行服务之一的网约车服务提高了人们的出行质量,提供了更多的出行选择,但是基于动态需求预测的网约车调度的成功率和满意度不高,如何进一步减少空车运营和等待时间,仍然是一个尚未解决和迫切需要解决的问题。动态网约出行服务的核心是以较高的时空效率连接司机和乘客。更好地进行乘客需求的时空预测,是为运营车队优化调度提供建议、节约司机运营成本、以及提高居民出行服务质量的关键。如何有效挖掘历史出行需求数据潜在的时空特征,提供更准确的需求预测,已成为智能交通领域日益关注的问题。

针对需求响应交通出行需求与供给匹配过程中的各种不确定性,研究人员开发了大量的需求预测模型,以提高这种日益增长的需求响应型交通服务的质量。早期的研究除了常用的统计方法如移动平均法,以自回归综合移动平均模型(arima)为代表的时间序列方法被广泛应用于交通需求预测。jiang等人在文献[jiang,x.,zhang,l.,chen,m.x.,2014.short-termforecastingofhigh-speedraildemand:ahybridapproachcombiningensembleempiricalmodedecompositionandgraysupportvectormachinewithreal-worldapplicationsinchina.transportationresearchpartc:emergingtechnologies44,110–127.]中提出了一种结合集成经验模式分解(eemd)和灰色支持向量机(gsvm)模型的高速铁路混合需求预测方法。随着深度学习技术在计算机视觉和自然语言处理方面的成功,相应的方法逐渐被应用到交通预测中。xu等人[xu,j.,rahmatizadeh,r.,boloni,l.,turgut,d.,2018.real-timepredictionoftaxidemandusingrecurrentneuralnetworks.ieeetransactionsonintelligenttransportationsystems19,2572–2581.]结合长短期记忆模型(lstm)和混合密度网络来预测城市不同区域的出租车需求。ke等人[ke,j.,zheng,h.,yang,h.,chen,x.(michael),2017.short-termforecastingofpassengerdemandunderon-demandrideservices:aspatio-temporaldeeplearningapproach.transportationresearchpartc:emergingtechnologies85,591–608.]将卷积长短期记忆模型(convlstm)用于交通需求预测。

现有的方法或发明的缺陷:1)现有方法在网格划分与需求时空特征的捕获上缺乏综合的考量,预测精度有待于进一步的提升;2)现有方法在时空尺度的选择上依据经验进行选择,对多种尺度时空统计误差引起的不确定性缺乏足够的研究;3)现有方法在数据清洗的过程中往往通过设定阈值的方式,过滤掉需求量较小的样本,忽略了偏远郊区的稀疏需求问题。



技术实现要素:

为解决上述问题,本发明提出了多尺度六边形分区方法对城市进行区域划分,并计算各区域在不同时空尺度下的交通需求量;构建基于多尺度六边形的卷积长短期记忆交通需求预测模型;根据历史数据对模型进行训练,并用训练好的模型对各区域的需求进行多尺度实时预测。本发明将多尺度下六边形分区与卷积长短期记忆模型相结合,捕捉区域多尺度时空需求特征,同时给出多尺度下的需求预测结果,用于预测短时需求响应式交通需求,增加了预测信息量,缓解了交通需求的时空分布不均匀性,提升模型预测精度。

本发明的技术方案:

一种融合多尺度时空统计信息的短时交通需求预测方法,步骤如下:

(1)多尺度下六边形网格划分,计算不同尺度下各分区时空需求量

采用不同空间尺度的六边形网格ls={ls1,ls2,...,lsi,...lsn}对城市进行分区,在边长100-300m范围内选择六边形分区作为基准分区,然后通过边长乘以2倍、4倍、8倍的方式拓展六边形分区的空间尺度模式。采用不同时间尺度tr={tr1,tr2,...,trt,...trm}对一天的时间进行分段,在5-15min范围内选择适宜的时间段作为基准时间尺度,然后分别通过乘以2倍、4倍、8倍的方式拓展时间尺度模式;根据经纬度信息将需求响应出行历史订单数据映射到不同时空尺度的网格中,则有表示在空间尺度s、时间尺度r的情况下,分区lsi的第trt时间段的交通需求。

以最小尺度的六边形分区作为基准分区,获取基准分区所对应的各级别高尺度分区编号,则对应的多尺度时空需求在筛选基准分区对应高级别尺度的分区时,存在两种情况:若基准分区被高级别尺度分区完全覆盖时,则覆盖分区即为基准分区相应尺度下对应分区;若基准分区被两个高级别尺度分区均分时,则两分区各以50%的概率作为基准分区相应尺度下对应分区。

每一个目标分区的交通需求在空间上受其邻近的区域影响较大,同时选取目标分区及环绕其周围的第1层6个邻近分区、以及第2层的12个邻近分区的交通需求来共同捕获目标分区的空间特征,目标分区与其2层邻近分区的空间分布关系(如图2所示),则的局部邻域需求可表示为向量其中

将目标分区的局部邻域需求映射到矩阵的5行9列之中,局部邻域中各需求在矩阵中的分布为:

对矩阵中各局部邻域分区需求进行归一化:其中为原始交通需求,分别代表相应时空尺度下的需求量最小值和最大值,为归一化后的值。

用同样的手段获取基准分区对应的其他各空间尺度归一化局部领域矩阵,并将各尺度的矩阵叠加为5行9列s层(尺度)的三维张量,记为表示为基准分区i、基准时间段t、时间尺度r对应的多空间尺度的局部领域需求特征。以时间尺度r对应的历史h个时间段的多空间尺度需求作为输入,预测时间尺度r下一个时间段各空间尺度下的需求构建相应的输入和输出样本,并按比例划分时间尺度r下的训练集和测试集。按同样的方式分别构建其他各时间尺度下的训练集和测试集,用于测试相应时间尺度下的预测结果。

(2)设计交通需求预测模型

采用卷积长短期记忆模型进行时空序列预测,将目标分区的历史多空间尺度交通需求作为卷积长短期记忆模型的输入,输出即为交通预测模型包括4个convlstm层,分别具有8,16,32,32个隐藏态,在边缘区域使用补零的操作,卷积核大小为3×3,最后通过4层全连接层,最后输出各空间尺度下的交通需求预测结果。

构建空间尺度自适应误差损失选择函数l为均方根误差rmse和平均绝对百分比误差mape的组合:其中定示真实需求,表示预测值,对每次预测得到的各空间尺度下的需求值,筛选出误差较小的一组用作模型整体损失函数计算,等价于,在每次迭代的过程中,模型自适应地朝着目标位置的最优尺度方向来更新参数。

(3)根据历史数据训练模型,并进行实时需求预测

利用步骤(1)中的各时间尺度下的训练集对步骤(2)中的预测模型进行训练,选取均方根误差rmse和平均绝对百分比误差mape作为模型预测精度指标。对于每个基准分区,首先通过各时间尺度下的测试集的预测结果评估各时间尺度的综合预测精度;其次选择最优时间尺度下的测试集,评估相应各空间尺度下的预测结果,选择最优空间尺度。获取各基准分区最优的时空尺度,建立最优多时空尺度的交通需求预测模型,将实时需求数据归一化后输入到最优的交通需求预测模型,得到预测结果,再进行反归一化,得到最终预测结果,实现城市各区域最优多时空尺度的实时需求预测。

本发明的有益效果:

本发明首先将多尺度六边形分区与卷积长短期记忆模型相结合,能更好地捕获交通需求的时空特征,交通需求预测模型在误差损失函数计算时动态地选择各尺度下预测误差,提升了模型的预测精度;最后,本模型在进行需求预测时,同时获得多尺度下需求预测结果,增加了需求预测信息量。

附图说明

图1是多层六边形网格划分图,其中,k=3;

图2是局部邻域六边形分区图;

图3是输入端数据处理模型图;

图4是卷积长短期记忆模型图;

图5是误差损失函数计算图;

图6是时空尺度需求预测模型图;

图7是本发明方法的流程示意图。

具体实施方式

以下结合附图和技术方案,进一步说明本发明的具体实施方式。

本发明的一种融合多尺度时空统计信息的短时交通需求预测方法的流程如图7所示,具体步骤如下:

首先,采用多级空间尺度的六边形网格对某城市进行分区,计算不同空间尺度下各分区的动态响应式出行的时空需求量。采用不同空间尺度的六边形网格ls={ls1,ls2,...,lsi,...lsn}对城市进行分区,在边长100-300m范围内选择适宜的六边形分区作为基准分区,然后通过边长乘以2倍、4倍、8倍的方式拓展六边形分区的空间尺度模式。采用不同时间尺度tr={tr1,tr2,...,trt,...trm}对一天的时间进行分段,在5-15min范围内选择适宜的时间段作为基准时间尺度,然后分别通过乘以2倍、4倍、8倍的方式拓展时间尺度模式。分别用s={1,2,3,4}、r={1,2,3,4}表示不同的空间和时间尺度模式。根据经纬度信息将订单数据映射到不同时空尺度的网格中,则确表示在空间尺度s、时间尺度r的情况下,分区lsi的第trt时间段的交通需求。不同的尺度的六边形网格关系如图1所示,其中g=3表示相邻尺度的两个六边形网格中,较高级别的六边形网格面积是较低级别六边形网格面积的3倍数。

以200m尺度的六边形分区作为基准分区,获取其所对应的各级别高尺度分区编号,则对应的多尺度时空需求在筛选基准分区对应高级别尺度的分区时,存在两种情况:若其被高级别尺度分区完全覆盖时,则覆盖分区即为其相应尺度下对应分区;若其被两个高级别尺度分区均分时,则两分区各以50%的概率作为其相应尺度下对应分区。

一个区域的交通需求在空间上受其邻近的区域影响较大,同时选取目标分区及环绕其周围的第1层6个邻近分区、以及第2层的12个邻近分区的交通需求来共同捕获目标分区的空间特征,目标分区与其2层邻近分区的空间分布关系如图2所示,则的局部邻域需求可表示为向量其中

将目标分区的各尺度下的局部邻域需求映射到矩阵(5行9列)之中,以便于深度学习的前向传播和反馈传播计算,在该过程中尽量减少局部邻域分区之间的空间拓扑损失,局部邻域中各需求在矩阵中的分布为:

对矩阵中各局部邻域分区需求进行归一化:其中为原始交通需求,分别代表相应时空尺度下的需求量最小值和最大值,为归一化后的值。

用同样的手段获取基准分区对应的其他各空间尺度归一化局部领域矩阵,并将各尺度的矩阵叠加为5行9列4层(尺度)的三维张量,如图3所示,记为表示为基准分区i、基准时间段t、时间尺度r对应的多空间尺度的局部领域需求特征。以时间尺度r对应的历史h个时间段的需求作为输入,预测时间尺度r下一个时间段各空间尺度下的需求构建相应的输入和输出样本,并按比例划分时间尺度r下的训练集和测试集。按同样的方式分别构建其他各时间尺度下的训练集和测试集,用于测试相应时间尺度下的预测结果。

其次,设计交通需求预测模型。采用卷积长短期记忆模型进行时空序列预测,将目标分区的历史多空间尺度交通需求作为卷积长短期记忆模型的输入,输出即为预测模型包括4个convlstm层,分别具有8,16,32,32个隐藏态,在边缘区域使用补零的操作,卷积核大小为3×3,最后通过4层全连接层连接最后的输出结果,具体的卷积长短期记忆预测模型如图4所示。

最后,对于每个时间尺度r,根据历史数据训练模型,评估相应的各空间尺度下的预测精度,确定各基准位置的最优时空尺度,并进行实时最优多尺度需求预测。利用训练集对预测模型进行训练,损失函数为均方根误差(rmse)和平均绝对百分比误差的组合:其中表示真实需求,表示预测值,对每次预测得到时间尺度r下的4个空间尺度下的需求值,筛选出误差较小的一组用作误差损失函数计算,预测模型也因此在每次训练过程中动态的筛选最优的空间尺度。根选取rmse和mape作为模型预测精度指标,通过测试集的预测结果评估时间尺度r对应不同时空尺度的模型预测精度,误差函数计算模型如图5所示。

对于每个基准分区,首先通过各时间尺度下的测试集的预测结果评估各时间尺度的综合预测精度;其次选择最优时间尺度下的测试集,评估对应各空间尺度下的预测结果,选择最优空间尺度。获取各基准分区最优的时空尺度,建立最优多时空尺度需求预测模型,将实时需求数据归一化后输入到最优需求预测模型,得到预测结果,再进行反归一化,得到最终预测结果,实现城市各区域最优多空间尺度的实时需求预测。多时空尺度需求预测模型的整体框架如图6所示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1