本发明涉及一种融合多尺度时空统计信息的短时交通需求预测方法,属于深度学习与交通需求预测的交叉技术应用领域。
背景技术:
需求响应网约出行服务作为信息通信技术(ict)在智能交通中的创新应用之一,在居民日常出行中越来越受欢迎。作为需求响应出行服务之一的网约车服务提高了人们的出行质量,提供了更多的出行选择,但是基于动态需求预测的网约车调度的成功率和满意度不高,如何进一步减少空车运营和等待时间,仍然是一个尚未解决和迫切需要解决的问题。动态网约出行服务的核心是以较高的时空效率连接司机和乘客。更好地进行乘客需求的时空预测,是为运营车队优化调度提供建议、节约司机运营成本、以及提高居民出行服务质量的关键。如何有效挖掘历史出行需求数据潜在的时空特征,提供更准确的需求预测,已成为智能交通领域日益关注的问题。
针对需求响应交通出行需求与供给匹配过程中的各种不确定性,研究人员开发了大量的需求预测模型,以提高这种日益增长的需求响应型交通服务的质量。早期的研究除了常用的统计方法如移动平均法,以自回归综合移动平均模型(arima)为代表的时间序列方法被广泛应用于交通需求预测。jiang等人在文献[jiang,x.,zhang,l.,chen,m.x.,2014.short-termforecastingofhigh-speedraildemand:ahybridapproachcombiningensembleempiricalmodedecompositionandgraysupportvectormachinewithreal-worldapplicationsinchina.transportationresearchpartc:emergingtechnologies44,110–127.]中提出了一种结合集成经验模式分解(eemd)和灰色支持向量机(gsvm)模型的高速铁路混合需求预测方法。随着深度学习技术在计算机视觉和自然语言处理方面的成功,相应的方法逐渐被应用到交通预测中。xu等人[xu,j.,rahmatizadeh,r.,boloni,l.,turgut,d.,2018.real-timepredictionoftaxidemandusingrecurrentneuralnetworks.ieeetransactionsonintelligenttransportationsystems19,2572–2581.]结合长短期记忆模型(lstm)和混合密度网络来预测城市不同区域的出租车需求。ke等人[ke,j.,zheng,h.,yang,h.,chen,x.(michael),2017.short-termforecastingofpassengerdemandunderon-demandrideservices:aspatio-temporaldeeplearningapproach.transportationresearchpartc:emergingtechnologies85,591–608.]将卷积长短期记忆模型(convlstm)用于交通需求预测。
现有的方法或发明的缺陷:1)现有方法在网格划分与需求时空特征的捕获上缺乏综合的考量,预测精度有待于进一步的提升;2)现有方法在时空尺度的选择上依据经验进行选择,对多种尺度时空统计误差引起的不确定性缺乏足够的研究;3)现有方法在数据清洗的过程中往往通过设定阈值的方式,过滤掉需求量较小的样本,忽略了偏远郊区的稀疏需求问题。
技术实现要素:
为解决上述问题,本发明提出了多尺度六边形分区方法对城市进行区域划分,并计算各区域在不同时空尺度下的交通需求量;构建基于多尺度六边形的卷积长短期记忆交通需求预测模型;根据历史数据对模型进行训练,并用训练好的模型对各区域的需求进行多尺度实时预测。本发明将多尺度下六边形分区与卷积长短期记忆模型相结合,捕捉区域多尺度时空需求特征,同时给出多尺度下的需求预测结果,用于预测短时需求响应式交通需求,增加了预测信息量,缓解了交通需求的时空分布不均匀性,提升模型预测精度。
本发明的技术方案:
一种融合多尺度时空统计信息的短时交通需求预测方法,步骤如下:
(1)多尺度下六边形网格划分,计算不同尺度下各分区时空需求量
采用不同空间尺度的六边形网格ls={ls1,ls2,...,lsi,...lsn}对城市进行分区,在边长100-300m范围内选择六边形分区作为基准分区,然后通过边长乘以2倍、4倍、8倍的方式拓展六边形分区的空间尺度模式。采用不同时间尺度tr={tr1,tr2,...,trt,...trm}对一天的时间进行分段,在5-15min范围内选择适宜的时间段作为基准时间尺度,然后分别通过乘以2倍、4倍、8倍的方式拓展时间尺度模式;根据经纬度信息将需求响应出行历史订单数据映射到不同时空尺度的网格中,则有
以最小尺度的六边形分区作为基准分区,获取基准分区所对应的各级别高尺度分区编号,则
每一个目标分区的交通需求在空间上受其邻近的区域影响较大,同时选取目标分区及环绕其周围的第1层6个邻近分区、以及第2层的12个邻近分区的交通需求来共同捕获目标分区的空间特征,目标分区与其2层邻近分区的空间分布关系(如图2所示),则
将目标分区的局部邻域需求
对矩阵中各局部邻域分区需求进行归一化:
用同样的手段获取基准分区
(2)设计交通需求预测模型
采用卷积长短期记忆模型进行时空序列预测,将目标分区的历史多空间尺度交通需求
构建空间尺度自适应误差损失选择函数l为均方根误差rmse和平均绝对百分比误差mape的组合:
(3)根据历史数据训练模型,并进行实时需求预测
利用步骤(1)中的各时间尺度下的训练集对步骤(2)中的预测模型进行训练,选取均方根误差rmse和平均绝对百分比误差mape作为模型预测精度指标。对于每个基准分区,首先通过各时间尺度下的测试集的预测结果评估各时间尺度的综合预测精度;其次选择最优时间尺度下的测试集,评估相应各空间尺度下的预测结果,选择最优空间尺度。获取各基准分区最优的时空尺度,建立最优多时空尺度的交通需求预测模型,将实时需求数据归一化后输入到最优的交通需求预测模型,得到预测结果,再进行反归一化,得到最终预测结果,实现城市各区域最优多时空尺度的实时需求预测。
本发明的有益效果:
本发明首先将多尺度六边形分区与卷积长短期记忆模型相结合,能更好地捕获交通需求的时空特征,交通需求预测模型在误差损失函数计算时动态地选择各尺度下预测误差,提升了模型的预测精度;最后,本模型在进行需求预测时,同时获得多尺度下需求预测结果,增加了需求预测信息量。
附图说明
图1是多层六边形网格划分图,其中,k=3;
图2是局部邻域六边形分区图;
图3是输入端数据处理模型图;
图4是卷积长短期记忆模型图;
图5是误差损失函数计算图;
图6是时空尺度需求预测模型图;
图7是本发明方法的流程示意图。
具体实施方式
以下结合附图和技术方案,进一步说明本发明的具体实施方式。
本发明的一种融合多尺度时空统计信息的短时交通需求预测方法的流程如图7所示,具体步骤如下:
首先,采用多级空间尺度的六边形网格对某城市进行分区,计算不同空间尺度下各分区的动态响应式出行的时空需求量。采用不同空间尺度的六边形网格ls={ls1,ls2,...,lsi,...lsn}对城市进行分区,在边长100-300m范围内选择适宜的六边形分区作为基准分区,然后通过边长乘以2倍、4倍、8倍的方式拓展六边形分区的空间尺度模式。采用不同时间尺度tr={tr1,tr2,...,trt,...trm}对一天的时间进行分段,在5-15min范围内选择适宜的时间段作为基准时间尺度,然后分别通过乘以2倍、4倍、8倍的方式拓展时间尺度模式。分别用s={1,2,3,4}、r={1,2,3,4}表示不同的空间和时间尺度模式。根据经纬度信息将订单数据映射到不同时空尺度的网格中,则确
以200m尺度的六边形分区作为基准分区,获取其所对应的各级别高尺度分区编号,则
一个区域的交通需求在空间上受其邻近的区域影响较大,同时选取目标分区及环绕其周围的第1层6个邻近分区、以及第2层的12个邻近分区的交通需求来共同捕获目标分区的空间特征,目标分区与其2层邻近分区的空间分布关系如图2所示,则
将目标分区的各尺度下的局部邻域需求
对矩阵中各局部邻域分区需求进行归一化:
用同样的手段获取基准分区
其次,设计交通需求预测模型。采用卷积长短期记忆模型进行时空序列预测,将目标分区的历史多空间尺度交通需求
最后,对于每个时间尺度r,根据历史数据训练模型,评估相应的各空间尺度下的预测精度,确定各基准位置的最优时空尺度,并进行实时最优多尺度需求预测。利用训练集对预测模型进行训练,损失函数为均方根误差(rmse)和平均绝对百分比误差的组合:
对于每个基准分区,首先通过各时间尺度下的测试集的预测结果评估各时间尺度的综合预测精度;其次选择最优时间尺度下的测试集,评估对应各空间尺度下的预测结果,选择最优空间尺度。获取各基准分区最优的时空尺度,建立最优多时空尺度需求预测模型,将实时需求数据归一化后输入到最优需求预测模型,得到预测结果,再进行反归一化,得到最终预测结果,实现城市各区域最优多空间尺度的实时需求预测。多时空尺度需求预测模型的整体框架如图6所示。