一种基于LSTM网络的地铁断面客流预测方法与流程

文档序号:30182200发布日期:2022-05-26 14:04阅读:430来源:国知局
一种基于LSTM网络的地铁断面客流预测方法与流程
一种基于lstm网络的地铁断面客流预测方法
技术领域
1.本发明属于城市轨道交通领域,尤其涉及一种基于lstm网络的地铁断面客流预测方法。


背景技术:

2.随着城市轨道交通的建设,地铁线网的规模和客流不断增长,但客流在时间和空间上的分布并不均匀,拥堵时有发生,且通常发生在高峰时段的个别断面。地铁运营方通常希望能提前预测到拥堵的发生,并据此调整列车调度。现有的地铁客流预测技术通常针对进出站客流,基于统计学、机器学习、深度学习等通用技术,根据历史运营日的客流进行客流预测。但这种预测方式仅能预测进出站客流,进出站客流虽然可以辅助车站管理,但断面客流才是更直观的列车调度参考指标。并且历史运营日的客流只代表了客流长期的趋势,仅根据历史运营日的客流进行预测无法应对突发事件导致的突发高客流的情况。
3.因此,现有的地铁客流预测技术在预测的范围、准确性、实时性上,有明显改进空间。


技术实现要素:

4.为了解决现有技术中存在的缺点和不足,本发明提出了一种基于lstm网络的地铁断面客流预测方法,包括:
5.确定地铁指定线路的待预测断面,获取待预测断面截至运营日d的历史客流数据,将历史客流数据输入基于lstm网络的断面客流基础模型中,输出第一预测变量;
6.实时采集运营日d+1时的实时交易数据,通过实时交易数据分析乘客的出站车站以及乘车路径,根据分析结果基于预设更新频率计算第二预测变量;
7.将第一预测变量和第二预测变量共同输入全连接神经网络,周期性的预测待预测断面在运营日d+1时的客流。
8.可选的,所述确定地铁指定线路的待预测断面,包括:
9.根据地铁指定线路的历史发车密度和历史车辆额定载客量,动态计算指定线路在各个断面(i,j)的额定客运量,选择断面的历史客流超过额定客运量的断面为待预测断面;
10.其中,i表示时段编号,i对应的时段为[ti,ti+δt),ti为时段的起始时刻,δt为预设间隔参数,i的取值范围为[1,24*60/δt]之间的整数;
[0011]
j表示断面编号,j的取值范围为不超过断面总数量的正整数。
[0012]
可选的,所述地铁断面客流预测方法还包括断面客流基础模型的训练过程,所述训练过程包括:
[0013]
基于lstm网络的架构构建断面客流基础模型;
[0014]
获取待预测断面在运营日d-m至运营日d期间内的历史客流数据,根据历史客流数据生成断面客流数值时间序列以及日期标签时间序列;
[0015]
将断面客流数值时间序列以及日期标签时间序列共同作为训练数据,根据训练数
据对断面客流基础模型的网络参数进行训练。
[0016]
可选的,所述日期标签时间序列包括常规日期标签时间序列以及特殊日期标签时间序列;
[0017]
所述常规日期标签时间序列用于标记运营日是否为工作日,所述特殊日期标签时间序列用于标记运营日是否为节日。
[0018]
可选的,所述通过实时交易数据分析乘客的出站车站以及乘车路径,根据分析结果基于预设更新频率计算第二预测变量,包括:
[0019]
从实时交易数据中提取出进站交易数据,所述进站交易数据为在待预测断面对应的时段之前进站且在所述时段内未出站的实时交易数据;
[0020]
提取进站交易数据中的进站车站和刷卡卡号,根据刷卡卡号判断产生进站交易数据的乘客是否为常乘客;
[0021]
若是常乘客,获取常旅客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径的概率分布,计算常乘客通过待预测断面的第一概率;
[0022]
若不是常乘客,获取在运营日d-m至运营日d期间所有乘客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径,计算除常乘客以外其他乘客通过待预测断面的第二概率;
[0023]
将所有第一概率和第二概率累加,得到第二预测变量。
[0024]
可选的,所述根据刷卡卡号判断产生进站交易数据的乘客是否为常乘客,包括:
[0025]
若在运营日d-m至运营日d期间内的所有历史交易数据中,刷卡卡号在进站时间的前后一小时形成的时间区间,进站次数超过m*p次,则判定该乘客为常旅客,p为预设参数。
[0026]
可选的,所述获取常旅客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径的概率分布,计算常乘客通过待预测断面的第一概率,包括:
[0027]
获取在运营日d-m至运营日d期间,所述刷卡卡号在当前的进站时间前后一小时形成的时间区间内进站后对应产生的出站交易数据,统计出站交易数据中出站车站的出现次数,根据统计结果计算常旅客的出站车站的概率分布p1
exitst

[0028]
通过客流清分数据库找到进站车站与出站车站之间的所有乘车路径以及每条乘车路径的选择概率p
ep

[0029]
结合列车时刻表,分别判断每条乘车路径是否通过待预测断面,若通过则计算第一概率为p1
exitst
×
p
ep

[0030]
可选的,所述获取在运营日d-m至运营日d期间所有乘客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径,计算除常乘客以外其他乘客通过待预测断面的第二概率,包括:
[0031]
获取在运营日d-m至运营日d期间,所有乘客在当前的进站时间前后一小时形成的时间区间内进站后对应产生的出站交易数据,统计出站交易数据中出站车站的出现次数,根据统计结果计算常旅客的出站车站的概率分布p2
exitst

[0032]
通过客流清分数据库找到进站车站与出站车站之间的所有乘车路径以及每条乘车路径的选择概率p
ep

[0033]
结合列车时刻表,分别判断每条乘车路径是否通过待预测断面,若通过则计算第二概率为p2
exitst
×
p
ep

[0034]
可选的,所述全连接神经网络包括隐藏层,所述全连接神经网络采用的激活函数为sigmoid,所述全连接神经网络采用的损失函数为均方误差函数。
[0035]
本发明提供的技术方案带来的有益效果是:
[0036]
本发明利用历史断面客流数据对未来的断面客流进行基础预测,同时利用当日的实时交易数据对基础预测的结果进行修正,以应对突发短时客流,提高了断面客流预测的准确性。
附图说明
[0037]
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]
图1为本发明实施例提出的一种基于lstm网络的地铁断面客流预测方法的流程示意图;
[0039]
图2为地铁断面客流预测方法的阶段流程示意图。
具体实施方式
[0040]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0041]
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
[0042]
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0043]
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0044]
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2个或3个。
[0045]
应当理解,在本发明中,“与a对应的b”、“与a相对应的b”、“a与b相对应”或者“b与a相对应”,表示b与a相关联,根据a可以确定b。根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。a与b的匹配,是a与b的相似度大于或等于预设的阈值。
[0046]
取决于语境,如在此所使用的“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。
[0047]
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0048]
实施例一
[0049]
如图1所示,本实施例提出一种基于lstm网络的地铁断面客流预测方法,包括:
[0050]
s1:确定地铁指定线路的待预测断面,获取待预测断面截至运营日d的历史客流数据,将历史客流数据输入基于lstm网络的断面客流基础模型中,输出第一预测变量;
[0051]
s2:实时采集运营日d+1时的实时交易数据,通过实时交易数据分析乘客的出站车站以及乘车路径,根据分析结果基于预设更新频率计算第二预测变量;
[0052]
s3:将第一预测变量和第二预测变量共同输入全连接神经网络,周期性的预测待预测断面在运营日d+1时的客流。
[0053]
本实施例所提出的地铁断面客流预测方法分为断面分析阶段、模型构造阶段以及客流预测阶段,如图2所示。
[0054]
在断面分析阶段,本实施例主要进行历史客流汇总分析,用于选出历史客流量较大的断面进行分析,因此本实施例无需对所有断面进行分析,节省了预测计算资源,并能以历史客流情况为依据准确的选择更有必要进行预测的断面,有利于断面客流预测效果的提升。
[0055]
本实施例在运营日d结束后进入模型构造阶段,一方面构造并训练lstm模型,从而得到断面客流基础模型,用于输出第一预测变量,另一方面构造断面客流修正模型,用于输出第二预测变量。除此之外,以断面客流基础模型和断面客流修正模型的训练结果构造训练数据,以此来训练全连接神经网络通过第一预测变量和第二预测变量拟合出最终的断面客流预测结果。
[0056]
本实施例在运营日d+1时进入客流预测阶段,一方面获取历史客流数据,通过断面客流基础模型预测,输出第一预测变量,另一方面获取当日的实时交易数据,通过断面客流修正模型计算,输出第二预测变量,再将第一预测变量和第二预测变量共同输入全连接神经网络,通过全连接神经网络预测得到断面客流。
[0057]
下面对上述三个阶段的实施过程进行具体说明。
[0058]
在本实施例中,所述确定地铁指定线路的待预测断面,包括:
[0059]
根据地铁指定线路的历史发车密度和历史车辆额定载客量,动态计算指定线路在各个断面(i,j)的额定客运量,选择断面客流超过额定客运量的断面为待预测断面;
[0060]
其中,i表示时段编号,i对应的时段为[ti,ti+δt),ti为时段的起始时刻,δt为预设间隔参数,i的取值范围为[1,24*60/δt]之间的整数;j表示断面编号,j的取值范围为不超过断面总数量的正整数。本实施例中δt取15分钟,15分钟的粒度足够小,可以满足线路的列车调度需求,也足够大,可以保证断面客流时间序列的稳定性。
[0061]
确定了待预测断面后,在运营日d结束后,获取待预测断面截至运营日d的历史客流数据,将历史客流数据输入基于lstm网络的断面客流基础模型中,输出第一预测变量表示根据运营日d+1前的历史客流数据预测的运营日d+1时的断面客流。lstm
网络是一种特殊的rnn网络,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题,适用于具有时序性特点的地铁断面客流预测场景。
[0062]
本实施例还包括断面客流基础模型的训练过程,所述训练过程包括:
[0063]
基于lstm网络的架构构建断面客流基础模型;
[0064]
获取待预测断面在运营日d-m至运营日d期间内的历史客流数据,即待预测断面(i,j)在运营日为(d-m,d]范围内的历史客流数据,本实施例中m的确定方法为:选取线网发生大规模扩张到当前日期的日期跨度,且不小于90。根据历史客流数据生成断面客流数值时间序列以及日期标签时间序列,所述日期标签时间序列包括常规日期标签时间序列以及特殊日期标签时间序列,所述常规日期标签时间序列用于标记运营日是否为工作日,所述特殊日期标签时间序列用于标记运营日是否为节日。优选的,本实施例构造三种长度为m的时间序列,分别为断面客流数值时间序列常规日期标签时间序列和特殊日期标签时间序列的标签包括工作日、长度为1-2天的休息日、长度为3-4天的休息日、长度超过5天的休息日,的标签包括除夕、元旦前一天、平安夜、妇女节以及周边重大活动日等。用于在lstm网络预测过程中引入不同性质的日期对客流量的影响因素,有利于提高断面客流基础模型的预测准确性。
[0065]
将断面客流数值时间序列以及日期标签时间序列共同作为训练数据,根据训练数据对断面客流基础模型的网络参数进行训练。lstm隐藏状态维度初始值设置为64,但在训练过程中手动调整。
[0066]
本实施例还在运营日d结束后为待预测断面(i,j)构建断面客流修正模型用于通过实时交易数据分析乘客的出站车站以及乘车路径,根据分析结果基于预设更新频率计算第二预测变量,断面客流修正模型的计算过程包括:
[0067]
从实时交易数据中提取出进站交易数据,所述进站数据为在待预测断面对应的时段之前进站且在所述时段内未出站的实时交易数据。提取进站交易数据中的进站车站enterst和刷卡卡号cardid,根据刷卡卡号cardid判断产生进站交易数据的乘客是否为常乘客。
[0068]
优选的,常乘客的判断方式为:若在运营日d-m至运营日d期间内的所有历史交易数据中,刷卡卡号在进站时间的前后一小时形成的时间区间,进站次数超过m*p次,则判定该乘客为常旅客,p为预设参数,本实施例中p取值为0.6。例如cardid在运营日d+1这一天的进站时间为9点,那么统计在运营日前m天中每天的8点到10点之间cardid的出现次数,若超过m*p次则判定该乘客为常旅客。
[0069]
由此可见,常乘客是经常在一个固定时段进站乘坐地铁的人,其地铁乘坐路径通常较为固定。因此本实施例针对常乘客单独分析其通过待预测断面的概率,即获取常旅客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径的概率分布,计算常乘客通过待预测断面的第一概率,包括:
[0070]
获取在运营日d-m至运营日d期间,所述刷卡卡号在当前的进站时间前后一小时形
成的时间区间内进站后对应产生的出站交易数据,统计出站交易数据中出站车站的出现次数,根据统计结果计算常旅客的出站车站的概率分布p1
exitst
,本实施例中p1
exitst
即为每个车站的所述出现次数与出站总次数的比值。
[0071]
通过客流清分数据库找到进站车站与出站车站之间的所有乘车路径以及每条乘车路径的选择概率p
ep
。本实施例中,所述乘车路径以及对应的选择概率通过常规的地铁清分方法确定,此处不再不赘述。
[0072]
结合列车时刻表,分别判断每条乘车路径是否通过待预测断面,具体的,对于任意ep,如果ep包含断面j,则根据进站时间,查找列车时刻表中乘客可以乘坐的第一个车次,并模拟乘客的上车、换乘、出站等行为,如果在时段i,乘客刚好通过断面j,则计算第一概率为p1
exits
×
p
ep

[0073]
本实施例针对除常乘客以外的其他乘客单独分析其通过待预测断面的概率,即获取在运营日d-m至运营日d期间所有乘客的出站车站的概率分布,结合进站车站与出站车站之间的乘车路径,计算除常乘客以外其他乘客通过待预测断面的第二概率,包括:
[0074]
获取在运营日d-m至运营日d期间,所有乘客在当前的进站时间前后一小时形成的时间区间内进站后对应产生的出站交易数据,统计出站交易数据中出站车站的出现次数,根据统计结果计算常旅客的出站车站的概率分布p2
exitst
,本实施例中p1
exitst
即为每个车站的所述出现次数与出站总次数的比值。
[0075]
通过客流清分数据库找到进站车站与出站车站之间的所有乘车路径以及每条乘车路径的选择概率p
ep
。本实施例中,所述乘车路径以及对应的选择概率通过常规的地铁清分方法确定,此处不再不赘述。
[0076]
结合列车时刻表,分别判断每条乘车路径是否通过待预测断面,具体的,对于任意ep,如果ep包含断面j,则根据进站时间,查找列车时刻表中乘客可以乘坐的第一个车次,并模拟乘客的上车、换乘、出站等行为,如果在时段i,乘客刚好通过断面j,若通过则计算第二概率为p2
exitst
×
p
ep

[0077]
最后,将所有第一概率和第二概率累加,即将所有产生实时交易数据的乘客通过待预测断面(i,j)的概率全部相加,得到第二预测变量,第二预测变量表示根据实时进站情况预测运营日d+1时的断面客流c
idj+1

[0078]
本实施例根据乘客的进站在一定时间内的进站频率划分是否为常乘客,并针对常乘客单独分析其通过断面的概率,相比把所有乘客进行统一的概率分析的方式,对常乘客更具有针对性,进而达到提高预测结果准确性的效果。
[0079]
最后,将第一预测变量和第二预测变量共同输入全连接神经模型中。本实施例还提出了全连接神经模型的训练过程,具体包括:
[0080]
选择运营日在(d-[m/2],d]范围内的日期,构造样本集合x,x中的元素类型为向量其中k为日期序号,范围为(d-[m/2],d],为利用模型预测的客流数值,为利用模型计算的数值,为断面客流的历史统计数值。在训练过程中,根据和分析断面(i,j)的客流预测值,在基于损失函数分析客流预测值与
的误差,并根据误差情况调整中的参数。
[0081]
本实施例中,隐藏层神经元的数量初始值设置为5,在训练中手工调整。
[0082]
在客流预测阶段,首先通过断面客流基础模型根据根据预测运营日d+1的第一预测变量在运营日d+1当天实时采集d+1日全线网的进出站客流,并利用断面客流修正模型周期性的计算并更新第二预测变量本实施例的预设更新频率设置为5分钟。
[0083]
优选的,地铁闸机产生的进出站记录,通过tcp实时传输到线网控制中心,并保存到中间件kafka中,以便断面客流修正模型调用。
[0084]
更新后,利用周期性的计算并预测时段i、断面j的断面客流,并将预测的断面客流通过http形式对外发布。
[0085]
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
[0086]
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1