一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法

文档序号:31476734发布日期:2022-09-10 00:38阅读:614来源:国知局
一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法
一种基于ceemdan-lstm的城市轨道交通短时客流预测方法
技术领域
1.发明涉及一种基于ceemdan-lstm的城市轨道交通短时客流预测方法,尤其涉及模态分解与深度学习结合的领域。


背景技术:

2.由于城市轨道交通容量大、速度快以及能耗低等优点,已经成为缓解交通拥堵、满足大都市区城市居民出行需求的主要公共交通工具之一。客流预测是城市轨道交通运营管理的基础,其中,中长期客流预测结果是城市轨道交通规划建设阶段的重要依据,而短时客流预测结果可支撑城市轨道交通运行计划、客流诱导、应急管理等决策,对于调整旅客出行行为、减少旅客拥挤、提高城市轨道交通服务质量等具有重要指导意义。
3.通常来说,短时客流预测的时间粒度一般为5min、10min和15min。对于城市轨道交通来说,考虑到列车发车间隔较短等运输组织特性,时间粒度为15min的短时客流预测更具实际意义。但由于时间粒度的缩减,数据的波动程度以及携带的噪声往往更多,增加了预测的复杂度。而且城市轨道交通短时客流数据本身往往具有非线性、非平稳等特征,传统的预测方法难以获得较好的预测结果。同时,由于短时客流数据的动态特性,客流数据也可视为一段时间序列数据。因此,只有构建既能有效分析城市轨道交通客流数据非平稳性、非线性等特性,又能获取其时序信息的预测模型,才能最大程度地提高客流预测模型的精确度及鲁棒性。
4.虽然关于短时客流预测的研究在近几年来受到了广泛的关注,但大部分方法的研究重点仍在于优化模型结构和提高训练算法效率,未能充分把握短时客流数据具有的时序性、非线性和非平稳性等特征,忽略了客流数据噪声对预测模型性能的干扰。
5.目前,国内外针对城市轨道交通短时客流预测模型的研究主要分为三类:参数预测模型、非参数预测模型和组合预测模型。基于参数方法的预测模型包括历史平均法、arima模型、sarima模型和marima模型等。考虑到城市轨道交通短时客流的非线性和非平稳等特性,上述参数模型都具有一定的局限性:参数模型假定变量之间存在线性关系,无法获取变量之间的非线性关系,具有一定的局限性。
6.为了解决上述问题,部分学者提出了基于非参数方法的预测模型,如非参数回归法、卡尔曼滤波等传统的数学或统计学模型,贝叶斯网络、支持向量机、最邻近算法及其改进算法等机器学习模型。特别地,由于神经网络能较为理想地解决复杂的非线性问题,神经网络及其改进方法被广泛的应用于短时客流预测中。同时,随着人工智能的发展,越来越多的学者开始采用深度学习方法构建城市轨道交通短时客流预测模型,在众多深度学习方法中,lstm(long short-term memory neural network,长短时记忆神经网络)被认为是目前最适合用于获取客流数据时间属性的深度学习的方法。
7.近几年来,越来越多的学者根据不同方法的优点构建组合模型从而进一步提高客流预测模型精度,如arima-garch模型,gm-arma模型,wavalet-svm模型和sae-dnn模型等。还有一些学者认为,先对城市轨道交通自动售检票系统采集的进(出)站客流数据进行预处
理,提取数据中的有效特征,减少预测模型识别输入与输出信号时的数据噪声,提前降低客流数据噪声对预测模型的干扰,进一步提高输入变量的稳定性。emd(empirical model decomposition,经验模态分解)是一种数据驱动的自适应信号分析方法,适用于分析和处理非线性、非平稳的数据。emd可将输入数据分解为一系列频率由高到低依次排列的固有模态函数imfs(intrinsic mode functions,imfs)和一项可表示数据总体变化趋势的余量res。因此,emd及其改进的分解算法eemd(ensemble empirical model decomposition,集合经验模态分解)常被用于分析客流时序数据特征。基于此,部分学者采用数据处理模型与神经网络预测模型相结合的方式构建组合模型。有的学者将emd模型分解后的数据作为bpnn(back propagation neural network,反向传播神经网络)的输入,提出了融合emd与bpnn的组合预测模型;有的学者将emd-sae组合模型运用到交通流预测中;一些学者还提出了融合eemd与gsvm的组合预测模型。在上述基于emd与eemd的组合模型中,emd和eemd在数据分解过程中分别容易出现模态混叠和残留噪声等问题。运用bpnn、gsvm及sae等单一模型预测客流量,不能充分利用客流数据的时序特性,且上述单一模型不能有效区分高频和低频imfs,并且不能在降维的同时保留完整的数据信息。
8.而现有研究如ceemdan(complete ensemble empirical model decomposition with adaptive noise,自适应噪声完备集合经验模态分解)的提出克服了emd以及eemd各自的缺点,通过自适应地添加高斯白噪声来避免模态混叠现象和残留噪声问题,并且分解结果具有完整性、无重构性误差等特性。同时,lstm神经网络在具有时序特性的短时交通流预测中往往具有良好的表现,保持了lstm的数据处理效果的同时又使神经网络结构更加简单,更适用于短时客流预测对实时操作的要求。
9.综上所述,国内外已有大量对城市轨道交通短时客流预测的研究,但是上述模型都未充分利用短时客流数据时序性、非线性以及非平稳性的特征,不利于提高城市轨道交通短时客流预测的精确度和鲁棒性。


技术实现要素:

10.为了克服上述现有技术的缺点,本发明提出了一种融合ceemdan与lstm的城市轨道交通短时客流预测模型。充分结合两个模型的优点,利用ceemdan将原始客流数据分解为有限个具有局部特征且不同频率的imfs和一个残差res,以获取数据非平稳、非线性的特征,利用ceemdan算法将非线性的城市轨道交通客流数据进行平稳化处理后,运用lstm神经网络作为客流预测方法,提前弱化客流数据噪声对预测模型的干扰,减少预测误差,进一步提高城市轨道交通客流预测模型的精度。
11.本发明解决其技术问题所采用的技术方案是:一种基于模态分解与深度学习的城市轨道交通短时客流预测方法,包括客流数据预处理阶段、ceemdan分解阶段、lstm预测阶段和预测误差分析阶段。其中:所述客流数据预处理阶段,通过剔除原始客流数据中的缺失值和异常值等,减少预测模型识别输入与输出信号时的数据噪声;所述ceemdan分解阶段,将预处理后的客流数据分解为n个具有局部特征且不同频率的固有模态函数分量imfs和一个残差res,提前降低客流数据噪声对预测模型的干扰,进一步提高输入数据的稳定性;所述lstm预测阶段,将分解出来的n+1个平稳分量输入到lstm神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;所述预测误差分析阶
段,通过分析ceemdan-lstm预测模型的均方根误差rmse和平均绝对百分比误差mape,验证ceemdan-lstm预测模型的有效性,说明本方法可精确预测城市轨道交通短时客流量。具体采用如下技术方案:
12.基于ceemdan-lstm的城市轨道交通短时客流预测方法包括如下步骤:
13.(1)客流数据预处理,通过剔除原始客流数据中的缺失值和异常值,减少预测模型识别输入与输出信号时的数据噪声;
14.(2)ceemdan分解,将预处理后的客流数据分解为n个具有局部特征且不同频率的固有模态函数分量imfs和一个残差res,提前降低客流数据噪声对预测模型的干扰;
15.(3)lstm预测,将分解出来的n+1个平稳分量输入到lstm神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;
16.(4)预测误差分析,通过分析ceemdan-lstm预测模型的均方根误差rmse和平均绝对百分比误差mape,验证ceemdan-lstm预测模型的有效性。
17.优选地,步骤(1)中所述客流数据预处理,通过剔除城市轨道交通自动售检票系统采集的进出站客流数据中存在的缺失、异常和冗余数据,将其转换为可输入模型的数据形式,减少预测模型识别输入与输出信号时的数据噪声,提前降低客流数据噪声对预测模型的干扰。
18.优选地,步骤(2)中所述ceemdan分解包括emd分解过程和ceemdan分解过程,其中:
19.(一)emd分解过程包括如下步骤:
20.step1、找出城市轨道交通原始客流时间序列数据x(t)中的所有局部极值点,采用插值法对极大值点形成上包络线u(t),对极小值点形成下包络线l(t);
21.step2、计算上包络线和下包络线的平均值m(t):
22.step3、记原始客流时序数据x(t)与上、下包络线均值m(t)的差为h(t):h(t)=x(t)-m(t);
23.step4、判断h(t)是否满足imf的两条性质:原始客流数据的极值点数目和过零点数目相等或最多相差一个;上线包络线的平均值为0;若满足,则m(t)为第一项imf;h(t)为第一项res;否则,重复step1~3,直至获得第一个imf,并记为c1(t);
24.step5、记r1(t)=x(t)-c1(t)为新的待分解数据,重复step1~4,以得到第二项imf,并记为c2(t),此时余量r2(t)=x(t)-c2(t);重复上述步骤,直到得到的余量cn(t)单调或满足阈值要求,到此分解结束,则原始客流时序数据x(t)最终被分解为:
25.(二)ceemdan分解过程包括如下步骤:
26.step1、向城市轨道交通客流原始时间序列数据x(t)中添加i次不同的白噪声,得到新序列xi(t)=x(t)+β0ωi(t)。其中,xi(t)为经过第i次分解的客流时间序列;β0为信噪比;ωi(t)为服从标准正态分布的高斯白噪声序列;
27.step2、xi(t)经过emd分解后,得到第1个模态分量且(取平均值为以下同理,k+1个模态分量均取平均值为)和第1个
剩余分量其中,i为实验次数;
28.step3、以r1(t)为原序列,利用emd算法,分解新构建的r1(t)+β1e1[ωi(t)]序列,得到第2个模态分量的平均值和剩余分量其中,e1(
·
)为emd分解后的第1阶imf分量的客流数据;
[0029]
step4、重复步骤3,得到第k+1个模态分量的平均值和第k个剩余分量
[0030]
step5、当满足emd的终止条件时,则分解结束;否则,继续分解;原始客流时序数据x(t)最终被分解为:
[0031]
优选地,步骤(3)中所述lstm预测阶段包括如下步骤:
[0032]
step1、lstm神经网络的输入记为x(t)=(x1,

,x
t
,

,x
t
),隐藏层输出记为h(t)=(h1,

,h
t
,

,h
t
),细胞状态记为c(t)=(c1,

,c
t
,

,c
t
),最终输出记为y(t)=(y1,

,y
t
,

,y
t
);
[0033]
step2、对于任意的x
t
∈x(t),h
t
∈h(t),c
t
∈c(t),y
t
∈y(t)。其中,
[0034]
step3、在城市轨道交通短时客流预测中,x
t
各元素为预测t+1时刻客流的输入变量,包括客流量、站点空间位置和天气等;h
t
各元素为预测中间值,为进一步提取的x
t
时空特征;y
t
各元素为时刻t的客流预测值;n1为各时刻的输入长度;n2和n3分别为各时刻隐藏层和输出层的输出长度;
[0035]
step4、遗忘门控制信息从上一时刻细胞状态中丢弃,输入门选择当前输入的有效信息,两者共同决定当前时刻内的细胞状态,输出门在的基础上进一步过滤,决定隐藏层的输出;通过3个门控单元的共同作用,输出选择性保留上一时刻和当前时刻的有效信息。
[0036]
优选地,步骤(4)中所述预测误差分析阶段按如下公式进行计算:
[0037][0038][0039]
式中:rmse为均方根误差;mape为平均绝对百分比误差;n为预测样本总数;和y(t)分别为t时刻城市轨道交通客流的预测值和观测值。
[0040]
与现有技术相比,本发明的有益效果是:
[0041]
1、稳定性:本发明采用ceemdan算法作为城市轨道交通短时客流时序数据的分解方法,能有效获取短时客流数据非线性、非平稳的特性,并克服emd和eemd算法在分解过程中分别存在的模态混叠现象和残留噪声问题,有效提升了客流数据分析的稳定性。
[0042]
2、优越性:本发明采用lstm神经网络作为城市轨道交通短时客流的预测方法,该模型特有的链式结构具有保持信息持久性的特点,适用于处理时序数据。与传统rnn模型相
比,lstm模型在克服梯度爆炸缺陷的同时具有更易计算等优点。
[0043]
3、精确性:本发明提出一种基于ceemdan-lstm的组合模型预测城市轨道交通短时客流量。充分结合ceemdan分解算法和lstm神经网络的优点,提前弱化原始客流时序数据噪声对预测模型精度的干扰,与单一模型相比,可显著提高客流预测模型的精度。
附图说明
[0044]
本发明将通过例子并参照附图的方式说明,其中:
[0045]
图1为ceemdan-lstm模型预测流程图;
[0046]
图2为emd分解算法流程图;
[0047]
图3为ceemdan分解算法流程图;
[0048]
图4为lstm神经网络内部结构图。
具体实施方式
[0049]
一种基于ceemdan-lstm的城市轨道交通短时客流预测方法,如图1所示,主要由客流数据预处理阶段、ceemdan分解阶段、lstm预测阶段和预测误差分析阶段组成,具体内容如下:
[0050]
一、客流数据预处理阶段
[0051]
城市轨道交通自动售检票系统采集的进(出)站客流数据中包括海量数据,其中存在缺失值、冗余值和异常值等。客流数据预处理的具体过程包括如下步骤:
[0052]
step1、数据清洗
[0053]
利用python的numpy库和panndas库对缺失值和异常值进行分析和处理。缺失值主要由于刷卡数据较少导致,可采用多重插补的方法的进行插补。异常值主要包括明显与现实不符的值,需要去除或者进行降噪处理。
[0054]
step2、时间间隔划分
[0055]
目前,主要对城市轨道交通客流量进行短时预测,可将时间划分为很短的时间间隔,如5分钟、10分钟和15分钟等。
[0056]
step3、数据归一化
[0057]
在建立客流预测模型的过程中,为加快模型训练的收敛速度,当输入数据较大时,需要对预处理后的客流数据进行转换,将数据归一化。归一化是指将预处理后的客流数据进行区间缩放,对原始客流数据作线性变换,进而将数据映射到闭区间[0,1]上。在城市轨道交通短时客流量预测中,为了消除数据波动差异对预测模型结果的影响,应对数据进行归一化处理:其中,x表示所有预测样本数量,x
max
和x
min
分别表示城市轨道交通客流数据中的最大值和最小值。
[0058]
二、ceemdan分解阶段
[0059]
在这一阶段,将城市轨道交通客流数据视为一段由连续平滑信号和异常噪声组成的数据。利用ceemdan算法对原始客流数据进行分解处理。
[0060]
emd分解的具体过程如图2所示,包括如下步骤:
[0061]
step1、找出城市轨道交通原始客流时间序列数据x(t)中的所有局部极值点,采用
插值法对极大值点形成上包络线u(t),对极小值点形成下包络线l(t)。
[0062]
step2、计算上包络线和下包络线的平均值m(t):
[0063]
step3、记原始客流时序数据x(t)与上、下包络线均值m(t)的差为h(t):h(t)=x(t)-m(t)。
[0064]
step4、判断h(t)是否满足imf的两条性质:原始数据的极值点数目和过零点数目相等或最多相差一个;上下包络线的平均值为0。若满足,则m(t)为第一项imf,且h(t)为第一项res;否则,重复step1~3,直至获得第一个imf,并记为c1(t);
[0065]
step5、记r1(t)=x(t)-c1(t)为新的待分解数据,重复step1~4,以得到第二项imf,并记为c2(t)。此时,余量r2(t)=x(t)-c2(t)。重复上述步骤,直到得到的余量cn(t)单调或满足阈值要求。到此分解结束,则原始客流数据为:
[0066]
将由emd分解得到的第j阶模态分量imfj(t)记为ej(
·
)。ωi(t)为服从标准正态分布的白噪声。ceemdan分解过程如图3所示,包括如下步骤:
[0067]
step1、向原始城市轨道交通客流时间序列x(t)中添加i次不同的白噪声,得到序列xi(t):
[0068]
xi(t)=x(t)+β0ωi(t)
[0069]
式中:xi(t)为经过第i次分解的客流时间序列;β0为信噪比;ωi(t)为服从标准正态分布的高斯白噪声序列。
[0070]
step2、xi(t)经过emd分解后,得到第1个模态分量(取平均值为以下同理,k+1个模态分量均取平均值为),和第1个剩余分量r1(t):
[0071][0072][0073]
式中:i为实验次数。
[0074]
step3、以r1(t)为原序列,利用emd算法,分解新构建的r1(t)+β1e1[ωi(t)]序列,得到第2个模态分量的平均值和剩余分量r2(t):
[0075][0076][0077]
式中:e1(
·
)为emd分解后的第1阶imf分量的客流数据。
[0078]
step4、重复步骤3,得到第k+1个模态分量的平均值和第k个剩余分量rk(t):
[0079][0080]
[0081]
step5、当满足emd的终止条件时,则分解结束;否则,继续分解。原始客流序列x(t)最终被分解为:
[0082][0083]
三、lstm预测阶段
[0084]
在ceemdan分解的基础上,构建多输入、单输出的单步预测lstm神经网络。将第d天内与t时刻相邻的前历史p个观测值x(t-p,d)=(x
t-p,d
,x
t-(p-1),d
,

,x
t-1,d
)作为输入,t时刻后q个连续的观测值x(t,d)=(x
t,d
,x
t+1,d
,

,x
t+q,d
)作为输出,其中p为时间步长,q为预测步长,q=1时为单步预测,其实质为拟合输入空间r
p
×n中的任意点至输出空间rn×q中的任意点。输入层、隐藏层和输出层的神经元个数分别记为ni、nh和no。
[0085]
step1、输入层
[0086]
由于ceemdan-lstm预测方法仅考虑时间维度下的客流流量特征,故各时间步长下的输入长度为1,时间步长取值为4,ni取1,输入维度为(1,4,n
h1
),其中n
h1
为第一个隐藏层的神经元数。
[0087]
step2、隐藏层
[0088]
隐藏层数取2,隐藏层神经元个数一般采用经验值,为nh=(ni+no)β。其中,β为调节系数,避免模型欠拟合或过拟合,0.5≤β≤1.5。采用网格搜索确定nh,分别取β的上、下限和中间值,即各隐藏层nh分别取1、2、3,选择模型训练误差最小对应的nh。
[0089]
step3、输出层
[0090]
添加一个全连接层作为输出层,本方法预测步长为1,故no取值为1。为防止预测模型过拟合,各层采用dropout技术,随机断开神经元数目比例取0.1,批次训练样本数为2。训练样本数为待训练参数数量的5~10倍,故取中间值50。学习率取值过小,模型易陷入局部最优;学习率取值过大,模型则在某一点处来回震荡,甚至无法收敛。因此,采用指数衰减法动态调整学习率,即其中γ为初始学习率,取0.001;γ

为更新后的学习率;λ为衰减系数,取0.95;κ为当前迭代次数;μ为衰减速度,即进行μ轮迭代γ衰减一次,μ取值为150,损失函数为均方误差。
[0091]
四、预测误差分析阶段
[0092]
为了更好地评价ceemdan-lstm模型的预测效果,选取均方根误差(root mean square error,rmse)和平均绝对百分比误差(mean absolute percentage error,mape)作为ceemdan-lstm模型的评价指标。在分析非线性拟合时,rmse与mape表明样本的离散程度,值越小,说明预测值与观测值之间的线性相关程度越高。
[0093]
step1、rmse可直接体现预测值与观测值之间的绝对差异,且对特大或特小误差反映非常敏感。
[0094][0095]
step2、mape体现了预测值与观测值之间的相对偏差,常用于评价预测模型的优劣。
[0096][0097]
式中:n为预测样本总数;和y(t)分别为t时刻城市轨道交通客流的预测值和观测值。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1