一种可进行置信区间估计的短时交通流预测方法与流程

文档序号:16044206发布日期:2018-11-24 10:43阅读:286来源:国知局

本发明涉及一种交通流的预测方法,具体涉及一种可进行置信区间估计的短时交通流预测方法。

背景技术

交通流预测是智能交通系统的关键组成部分,具有重要的研究意义。交通流预测主要是针对实时交通流时间序列构成的动力系统进行的一种预测性研究。认为交通流混沌在短期内是可以被预测的,短时间交通预测是指对统计间隔为2至15分钟内的短时交通流时间序列所进行的预测。短时交通流预测按技术手段可概括为三大类:第一类是线性预测方法,主要包括时间序列预测方法、状态空间预测方法和卡尔曼滤波预测方法等;第二类是非线性预测方法,主要包括非参数回归方法、神经网络预测方法和支持向量机预测方法等。第三类是混合预测方法,主要是指两种及两种以上预测方法在中间预测过程的结合或最终预测结果的融合。其中,由于短时交通流动力系统的非线性特征,线性预测方法预测效果通常并不理想。非线性预测方法符合短时交通流非线性的特点,通过针对历史数据的监督学习获得预测模型,具有较强的自适应性。混合预测模型能够提升模型的预测精度,但却降低了模型的预测速度并增加模型的复杂度;同时,混合模型中子模型与混合方式的选择无系统化方法,主要依赖于实际应用和工程经验。

根据学习理论基本原理,通过对样本数据的学习而获得的对总体的认识只是概率意义上的逼近。在有限样本的条件下,任何一种短时交通流预测方法仅能使预测值依概率收敛于实际值,因此有必要在给出预测值的同时对其预测的不确定性进行量化估计。然而,已有的短时交通流预测方法均属于确定性预测,即对某一时刻交通流的预测结果通常是一个确定数值,无法对预测的不确定性进行定量分析。



技术实现要素:

针对上述现有技术中存在的问题,本发明的目的在于,提供一种可进行置信区间估计的短时交通流预测方法,实现对短时交通流进行预测的同时可获得短时交通流预测值方差的估计值,并利用该方差的估计值进一步确定短时交通流预测值的置信区间。

为了实现上述任务,本发明采用以下技术方案:

一种可进行置信区间估计的短时交通流预测方法,包括以下步骤:

选定需要进行交通流预测的路段,获取所选路段的短时交通流历史数据并构建所选路段的短时交通流历史数据库,选择短时交通流预测的预测时段,确定短时交通流数据的样本周期;

确定用于生成短时交通流预测模型的训练数据集的交通流历史数据的规模,从所述数据库中选择相应数量的短时交通流历史数据,根据所述的样本周期,对选择的短时交通流历史数据进行周期性差分处理,将差分处理后的结果作为所述的训练数据集;

建立可进行置信区间估计的短时交通流预测模型,确定预测模型中需要求解的待定参数,根据所述的训练数据集求得待定参数的最优值,然后通过所述预测模型进行短时交通流预测,分别获得短时交通流的预测值及其方差估计值,并在给定的置信水平条件下,获得针对所述预测值的置信区间。

进一步地,所述的根据所述的训练数据集求得待定参数的最优值,包括:

求取训练数据条件概率的负对数似然函数,对负对数似然函数按预测模型中的待定参数求偏导数,通过求取使得所述偏导数最小的参数值即可获得待定参数的最优值。

进一步地,所述的从所述数据库中选择相应数量的短时交通流历史数据,表示为:

{yj|j=1,2,...,m}式1

在式1中,yj的下标j表示短时交通流历史数据的编号,其取值范围为1至m,m为从数据库中选择的短时交通流历史数据的数量。

进一步地,所述的对选择的短时交通流历史数据进行周期性差分处理,差分处理后的结果表示为:

在式2中,n=m-t,其中t表示短时交通流数据的样本周期,xi表示交通流差分数据的编号,xi的值等于其下标i,即xi=i;表示交通流差分数据,即第i+t号、第i号短时交通流历史数据的差。

进一步地,所述的正态分布为多元正态分布,表示为:

上式中,表示所述的训练数据集中交通流差分数据构成的向量,表示均值为n维0向量、方差矩阵为的多元正态分布;x=(x1,...,xn)t表示训练数据集中交通流差分数据编号构成的n维向量;in为n阶单位矩阵,为短时交通流预测值噪声的方差,为待定参数;k(x,x)=(k(xi,xj))n×n为协方差矩阵,其中k(xi,xj)表示为:

上式中,l为方差尺度,为信号方差,l和均为待定参数。

进一步地,所述的建立可进行置信区间估计的短时交通流预测模型,表示为:

其中,m为期望预测的短时交通流数据编号;ym-t表示编号为m-t的短时交通流历史数据;k(m,x)=(k(m,xi))1×n,其中k(m,xi)根据式4进行计算;k(x,m)=(k(xi,m))n×1,其中k(xi,m)也根据式4进行计算;h(m)为短时交通流数据预测值;cov(m)为短时交通流数据预测值方差的估计值;

所述的预测模型中需要求解的待定参数分别为:方差尺度l,信号方差和预测噪声方差用集合表示。

进一步地,所述的训练数据条件概率的负对数似然函数表示为:

上式中,表示方差矩阵的行列式,集合表示待定参数集合,使式7对待定参数集合中的各待定参数求偏导数可得下式:

上式中,θp∈θ,函数tr()表示矩阵的迹,a=c-1y。

进一步地,所述的待定参数的最优值,是利用式8得到的偏导数,采用共轭梯度法或牛顿法求得使得公式7最小化的待定参数的最优解就是所述的最优值。

进一步地,所述的通过所述预测模型进行短时交通流预测,分别获得短时交通流的预测值及其方差估计值,包括:

步骤7.1,根据需要实际预测的短时交通流编号m',使用式9获得期望预测的短时交通流数据编号m:

m=m'modn式9

上式中,运算mod表示整数求余运算,n表示预测模型训练数据集中数据的数量;

步骤7.2,将所述的期望预测的短时交通流数据编号m代入式5,获得短时交通流的预测值h(m);

步骤7.3,将所述的期望预测的短时交通流数据编号m代入式6,获得短时交通流预测值方差的估计值cov(m)。

进一步地,当给定的置信水平为1-a的条件下,预测值的1-a置信区间可表示成下面的数值区间:

上式中,za/2为标准正态分布显著水平a的分位数。

本发明于现有技术相比具有以下技术特点:

本发明在进行在线短时交通流预测时,不仅可以获得短时交通流的预测值,而且能够同时获得上述预测值的方差估计值,并利用该方差的估计值可以进一步获得短时交通流预测值的置信区间,从而实现对短时交通流预测的不确定性进行定量分析。本发明的方法适用于交通流预测,在智能交通系统中有重要的应用价值。

附图说明

图1为本发明方法的流程图;

图2为本发明实施例在未来一个预测周期内的短时交通流预测结果;

具体实施方式

相对于神经网络和支持向量机回归模型,本发明提出的可进行置信区间估计的短时交通流预测方法具有容易实现、超参数自适应获取、非参数推断灵活以及预测输出具有概率意义等特点。本发明的预测方法在对短时交通流进行预测的同时还可以获得预测值方差的估计值,并依此可以获得预测值的置信区间,从而有效实现短时交通流概率意义上的预测。

本发明详细步骤如下:

一种可进行置信区间估计的短时交通流预测方法,包括以下步骤:

步骤1,选定需要进行交通流预测的路段,获取所选路段的短时交通流历史数据并构建所选路段的短时交通流历史数据库

所述的路段短时交通流历史数据是指路段短时交通流量数据,该数据通过公路运营管理部门获取;路段短时交通流历史数据按时间顺序存储,数据中包括数据采集日期、时刻和交通流量值等内容;构建所选路段的短时交通流历史数据库,数据库中按时间存储所选路段的短时交通流量数据。

步骤2,选择短时交通流预测的预测时段

所述的预测时段即需要预测未来多长时间内的交通流;短时交通流预测的预测时段通常为5分钟至15分钟,本实施例将预测时段设定为15分钟。

步骤3,确定短时交通流数据的样本周期

通过样本自相关分析发现,所述的短时交通流数据的样本周期t可定义为一天内采集交通流数据的数量。本实施例中使用采样间隔为15分钟的短时交通流数据,其一天内采集96条数据,则短时交通流数据的样本周期t为96。

步骤4,确定用于生成短时交通流预测模型的训练数据集的交通流历史数据的规模

所述的交通流历史数据的规模m即构建短时交通流预测模型的训练数据集时所需要使用的交通流历史数据的数量,所述的规模m被指定为样本周期t的整数倍,可表示成d*t,其中d为所使用数据样本的连续的天数,t为短时交通流数据的样本周期。本实施例中短时交通流数据的样本周期为96,选用连续5天的5*96=480条交通流历史数据构建预测模型训练数据集。

步骤5,根据所述的规模,从所述数据库中选择相应数量的短时交通流历史数据,根据所述的样本周期,对选择的短时交通流历史数据进行周期性差分处理,将差分处理后的结果作为所述的训练数据集;

所述的从所述数据库中选择相应数量的短时交通流历史数据,表示为:

{yj|j=1,2,...,m}式1

在式1中,yj的下标j表示短时交通流历史数据的编号,其取值范围为1至m,m为从数据库中选择的短时交通流历史数据的数量。所述的预测模型训练数据集中的交通流历史数据按采样时刻和样本周期的顺序排序并进行编号,例如,第1个样本周期的第1时刻的交通流历史数据编号为1,第1个样本周期的第2时刻的交通流历史数据编号为2,……,第2个样本周期的第1时刻的交通流历史数据编号为97,……,第5个样本周期的第96时刻的交通流历史数据编号为480等。

对选择的短时交通流历史数据进行周期性差分处理,差分处理后的结果表示为:

在式2中,n=m-t,其中t表示短时交通流数据的样本周期,xi表示交通流差分数据的编号,xi的值等于其下标i,即xi=i;在本实施例中,所选的样本周期t为96,规模m为480,则n=480-96=384;因此xi的下标i取值范围为1至384;表示交通流差分数据,即第i+t号、第i号短时交通流历史数据的差,如

步骤6,建立可进行置信区间估计的短时交通流预测模型,确定预测模型中需要求解的待定参数

该步骤中,首选根据所述的训练数据集,分别构建交通流差分数据编号的n维向量x=(x1,...,xn)t以及短时交通流差分数据的n维向量本实施例中,训练数据集的规模n为384。

设所述的向量y作为随机向量且其先验分布服从多元正态分布,如下式所示:

上式中,表示均值为n维0向量、方差矩阵为的多元正态分布;in为n阶单位矩阵,为短时交通流预测值噪声的方差,为待定参数;k(x,x)=(k(xi,xj))n×n为n×n维的协方差矩阵,其中第i行、第j列元素k(xi,xj)表示为:

上式中,l为方差尺度,为信号方差,l和均为待定参数。

所述的建立可进行置信区间估计的短时交通流预测模型,表示为:

其中,m为期望预测的短时交通流数据编号;ym-t表示编号为m-t的短时交通流历史数据;k(m,x)=(k(m,xi))1×n,其中k(m,xi)根据式4进行计算;k(x,m)=(k(xi,m))n×1,其中k(xi,m)也根据式4进行计算;h(m)为短时交通流数据预测值;cov(m)为短时交通流数据预测值方差的估计值;

所述的预测模型中需要求解的待定参数分别为:方差尺度l,信号方差和预测噪声方差用集合表示。

步骤7,根据所述的训练数据集求得待定参数的最优解

该步骤的思路是,在步骤6中设交通流差分数据构成的向量y的先验分布服从多元正态分布的基础上,求取训练数据条件概率的负对数似然函数,对负对数似然函数按预测模型中的待定参数求偏导数,通过求取使得所述偏导数最小的参数值即可获得待定参数的最优值,公式如下:

所述的训练数据条件概率的负对数似然函数表示为:

上式中,表示方差矩阵的行列式,集合表示待定参数集合,使式7对待定参数集合中的各待定参数求偏导数可得下式:

上式中,θp∈θ,函数tr()表示矩阵的迹,a=c-1y。

所述的待定参数的最优值,是利用式8得到的偏导数,采用共轭梯度法或牛顿法等优化方法求得使得公式7最小化的待定参数的最优解就是所述的最优值;将三个待定参数的最优值带入到短时交通流预测模型,即可得到最终的可进行置信区间估计的短时交通流预测模型。

步骤7,通过所述预测模型进行短时交通流预测,分别获得短时交通流的预测值及其方差估计值

步骤7.1,根据需要实际预测的短时交通流编号,使用式9获得期望预测的短时交通流数据编号m:

本实施例中,所述的期望预测的短时交通流数据编号m需要通过下式计算获得

m=m'modn式9

上式中,运算mod表示整数求余运算,n表示预测模型训练数据集中数据的数量,本实施例中n为384。所述的需要实际预测的短时交通流数据的编号表示为m',本实施例中,根据需要实际预测的短时交通流数据的预测周期和预测时刻的顺序对其进行编号。具体地:

所述的预测周期与本实施例的步骤3所述的样本周期t保持一致,即预测周期等于96。所述的预测时刻是指短时交通流数据预测值在一个预测周期内的顺序编号,在一个预测周期内,预测时刻取值为从1至96的正整数;例如,需预测的未来第1个周期的第1时刻的交通流数据编号为1,未来第1个样本周期的第2时刻的交通流数据编号为2,……,未来第2个样本周期的第1时刻的交通流数据编号为97,……,未来第q个样本周期的第r时刻的交通流历史数据编号为96*q+r。

步骤7.2,将所述的期望预测的短时交通流数据编号m代入式5,获得短时交通流的预测值h(m);

步骤7.3,将所述的期望预测的短时交通流数据编号m代入式6,获得短时交通流预测值方差的估计值cov(m)。

步骤8,在给定的置信水平条件下,获得针对所述预测值的置信区间

在给定的置信水平为1-a的条件下,短时交通流数据预测值的1-a置信区间可表示成下面的数值区间:

上式中,za/2为标准正态分布显著水平a的分位数。

本实施例中,显著水平a=0.05,置信水平为1-0.05=0.95,标准正态分布显著水平0.05的分位数za2=1.96,根据式9,本实施例中,短时交通流数据预测值的0.95置信区间为如图2所示。

交通流预测是智能交通系统的关键组成部分,具有重要的研究意义。在通过对交通流样本数据的学习而获得的对交通流总体的认识的基础上,交通流预测是对未来交通流数据概率意义上的逼近。在有限样本的条件下,任何有效的短时交通流预测方法仅能使预测值依概率收敛于实际值,因此有必要在给出预测值的同时对其预测的不确定性进行量化估计。然而,传统的短时交通流预测方法均属于确定性预测,即对某一时刻交通流的预测结果通常是一个确定数值,无法对预测的不确定性进行定量分析。本发明提出了一种可进行置信区间估计的短时交通流预测方法,在对短时交通流进行预测的同时还可以得到预测值方差的估计值,并进一步可以获得对应预测值的置信区间。本发明在进行短时交通流预测时,可以实现对短时交通流预测不确定性的定量分析。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1