一种机场线短时客流预测方法及系统与流程

文档序号:37551887发布日期:2024-04-08 14:01阅读:16来源:国知局
一种机场线短时客流预测方法及系统与流程

本发明涉及客流预测,特别是指一种机场线短时客流预测方法及系统。


背景技术:

1、近年来,航空运输业的迅猛发展使机场网络规模不断扩大。然而,随之而来的是机场周边交通压力的显著增加,这对机场线的规划和运营提出了更高的要求。机场线不仅为乘客提供了从机场到市区的高效便捷出行方式,还有效减轻了机场周边道路的交通压力。然而,机场线客流的高度时变性和受多种因素影响的特点,使得其运营管理面临一系列挑战,其中最重要的之一就是精确预测客流。精确的客流预测可以帮助运营企业更好地掌握客流变化规律,优化列车发车间隔,避免高峰时段拥堵,提升乘客的出行体验,为机场线的高效运营和服务提供可靠支持。

2、机场线是一种专门承担特定功能的轨道交通线路,其在区位、功能、客流来源、客流特征和客流影响因素方面与一般轨道线路有着显著的差异。机场多位于城市外围,占地面积大,机场线的终点和起点都位于机场的航站楼或航空枢纽附近,以便乘客的无缝连接。机场线的主要功能是为旅客提供从城市中心到机场以及从机场到城市的快速便捷交通服务。这种单一的功能定位导致机场线的主要客流来源集中在民航旅客和机场工作人员。较一般轨道线路站点客流呈现出的“单峰型”和“双峰型”特征不同的是,机场线的客流特征不规律。机场线的高峰小时系数低于一般站点,这主要由于航班的起降时间分布在全日不集中,在航班集中度到达或离开的时间段反而会产生大量轨道客流。航班的延误、取消等突发事件可能导致乘客需要临时调整乘坐机场线的计划,从而对机场线的客流产生影响。

3、近几年,基于大数据和先进的数学方法来预测轨道站点客流量成为趋势。大数据技术的广泛应用为轨道站点客流量的精准预测提供了强有力的支持。通过收集、整合和分析大量的历史乘客进出站数据,可以揭示客流量的周期性变化、节假日影响、特定时段的高峰等规律,为预测模型的构建提供了可靠的依据。机器学习和深度学习等技术的应用不断推动着轨道站点客流量预测的精度和效果的提升。传统的时间序列模型如arima能够预测客流量的趋势,但难以捕捉非线性关系和复杂的影响因素。而机器学习模型如支持向量机长短时记忆网络(lstm)等,具备更强大的拟合能力和学习能力,能够处理大量的历史数据,提供更准确的预测结果。然而,机器学习模型在训练阶段存在过于关注训练数据中的细节和噪声,从而产生过拟合的问题。随着机器学习技术的发展,集成学习在客流量预测方面展现出了出色的性能。集成学习通过将多个基本模型的预测结果进行结合,从而提高整体预测的准确性和稳定性。在预测轨道站点客流量的场景中,集成学习能够克服单一模型的局限性,更好地适应数据的多样性和变化性。

4、城市轨道交通站点客流预测研究已经较为丰富,但是机场线的客流预测研究较少,其主要原因是,一般线路的客流影响因素在机场线适用性差,如时间特征(工作日、非工作日)对民航乘客的出行目的的关联度不高,反而航班安排、气象条件、航班延误、旅客通关等动态因素对机场线客流的影响较为显著。

5、目前,对于机场线客流预测的研究存在三点不足:1)集成学习方法在机场线短时客流预测方面的研究较为有限,其预测效果及精度有待进一步验证。2)航班信息对预测精度的影响缺乏深入研究。3)现有的预测方法仅聚焦于港内旅客的客流量预测,而缺乏对离港方向客流的准确预测。


技术实现思路

1、针对上述问题,本发明的目的在于提供一种机场线短时客流预测方法及系统,将到离港航班信息纳入机场线客流影响因素,采用基于stacking的集成学习方法对乘坐机场线出入机场的进出站双向客流进行预测,提升机场线短时客流预测精度。

2、为解决上述技术问题,本发明提供如下技术方案:

3、一方面,提供了一种机场线短时客流预测方法,该方法包括以下步骤:

4、s101、采集原始数据集,所述原始数据集包括机场线历史客流数据和到离港航班信息数据;

5、s102、构建stacking集成学习模型;所述模型包括两层:第一层为基学习器层,包括多个基学习器;第二层为元学习器层,包括一个元学习器;

6、s103、对所述原始数据集进行划分,构造第一层基学习器的训练集和测试集,并利用构造的训练集和测试集对各个基学习器进行训练和测试,得到多个预测结果;

7、s104、基于所述预测结果构造新的训练集和新的测试集,作为第二层元学习器的训练集和测试集,对元学习器进行训练和测试,得到最终机场线短时客流预测结果。

8、可选地,所述步骤s102中,第一层基学习器层包括四个基学习器,分别为:随机森林算法基学习器、梯度提升决策树基学习器、极端梯度提升算法基学习器、k近邻算法基学习器。

9、可选地,所述步骤s102中,第二层元学习器层包括一个元学习器,为逻辑回归算法元学习器。

10、可选地,所述步骤s103具体包括:

11、引入5折交叉验证方法训练各个基学习器,将原始数据集d平均划分为5个互斥子集,分别为d1,d2,…,d5;

12、分别选择其中4个子集的并集作为训练集,余下的1个子集作为测试集,构造第一层基学习器的训练集和测试集;这样每个基学习器获得5组训练集和测试集,并获得5个测试结果s1,s2,…,s5。

13、可选地,所述步骤s104具体包括:

14、第一层基学习器层包括四个基学习器,对于第n个基学习器,n=1,2,…,4,在完成5折交叉验证后,将有5个预测结果,将其按行纵向堆叠,获得该基学习器的预测集si,n,i=1,2,…,5,同时将这5个预测结果求平均,得平均值

15、在完成四个基学习器的训练之后,将每个基学习器获得的预测集与预测结果平均值按列拼接,则得到第二层元学习器的新的训练集si,n,与新的测试集

16、即第二层元学习器的输入数据集为

17、可选地,所述步骤s104还包括:

18、将基学习器初级训练得到的新的训练集与新的测试集输入第二层元学习器用于次级训练,得到最终机场线短时客流预测结果。

19、可选地,所述方法还包括以下步骤:

20、对模型输入数据进行特征重要性评价。

21、可选地,所述特征重要性评价具体包括以下步骤:

22、s201、输入训练集的所有特征数据对模型进行训练;

23、s202、选择其中一个需要分析的特征,将测试集中的该列特征数据进行随机打乱重排,并保持其他列特征数据和目标值不变;

24、s203、计算新的预测结果,如果新预测结果与旧预测结果的差异在预设范围内,则认为该特征重要性较低,如果新预测结果与旧预测结果的差异超出预设范围,则认为该特征重要性较高;

25、s204、将测试集数据还原,并重复步骤s202和步骤s203,分析其他特征的重要性。

26、可选地,对于特征重要性的评判取决于该特征被随机重排后,模型表现评分的下降程度,其数学表达式表示为:

27、

28、其中,s是模型在原始数据集上的性能评分,对于k次重复实验中的每一次迭代k,随机重排特征j,构造一个被打乱重排后的数据集,计算模型在被打乱重排的数据集上的性能评分sk,j,最后计算得到特征j的重要性分数ij。

29、另一方面,提供了一种机场线短时客流预测系统,该系统包括:

30、数据采集模块,用于采集原始数据集,所述原始数据集包括机场线历史客流数据和到离港航班信息数据;

31、模型构建模块,用于构建stacking集成学习模型;所述模型包括两层:第一层为基学习器层,包括多个基学习器;第二层为元学习器层,包括一个元学习器;

32、第一训练与预测模块,用于对所述原始数据集进行划分,构造第一层基学习器的训练集和测试集,并利用构造的训练集和测试集对各个基学习器进行训练和测试,得到多个预测结果;

33、第二训练与预测模块,用于基于所述预测结果构造新的训练集和新的测试集,作为第二层元学习器的训练集和测试集,对元学习器进行训练和测试,得到最终机场线短时客流预测结果。

34、另一方面,提供了一种电子设备,所述电子设备包括:

35、处理器;

36、存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器加载并执行时,实现如上述机场线短时客流预测方法的步骤。

37、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述机场线短时客流预测方法的步骤。

38、本发明提供的技术方案带来的有益效果至少包括:

39、本发明综合考虑机场到离港航班信息和机场线历史客流数据,提供了一种基于stacking集成学习的机场线短时客流预测方法,能够对机场线进出站双向客流进行预测,通过与informer和lstm预测结果进行对比,验证了所提方法适用于机场线短时客流预测,且预测结果具有更高的精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1