一种列车到站晚点预测方法、装置、电子设备及存储介质与流程

文档序号:22917318发布日期:2020-11-13 16:00阅读:257来源:国知局
一种列车到站晚点预测方法、装置、电子设备及存储介质与流程

本发明涉及列车到站晚点预测领域,尤其涉及一种列车到站晚点预测方法、装置、电子设备及存储介质。



背景技术:

由于铁路系统的不确定性,列车延误时有发生,导致铁路运行效率低下,服务质量差。例如,统计分析某铁路局2016年至2019年的故障报告,发现这三年共发生各类事故3493起,超过7000辆列车受到影响,导致总延误超过3万分钟。在列车晚点情况下,铁路运营部门恢复列车运营秩序时,首先需要解决的就是快速准确地预测列车的晚点时间。

学者们对列车晚点预测问题进行了大量研究,一些预测方法被广泛应用,然而,既有的一些晚点预测方法存在以下缺点:1.人工神经网络(artificialneuralnetwork,ann)用来预测列车延误,神经网络的训练花费了大量的时间,预测精度较低。2.支持向量机模型,该模型的预测精度优于人工神经网络模型,可以较好的解决ann模型的过度学习问题,但它只适用于较小的聚类样本。3.基于贝叶斯网络的列车延误预测方法,计算量大且耗时。4.深度极值学习机(deepextremelearningmachine,delm),很好地解决了预测问题的大数据特性。但是,实现这种方法需要使用复杂和先进的存储技术和设备。5.整体模型用来预测列车晚点,通过手动调整超参数进行优化,缺乏可解释性和效率。

因此,为有效应对列车晚点对铁路运行和旅客出行造成的影响,列车晚点预测研究变的尤为重要。



技术实现要素:

本发明提供了一种基于数据驱动的列车到站晚点预测方法,所述方法包括:

提取列车晚点的特征集合,基于所述特征集合构建时空关联的xgboost晚点预测模型;

定义所述xgboost晚点预测模型的超参数范围,将所述特征集合分割为训练集和测试集;

基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化;

采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果。

优选的,所述列车晚点的特征集合包括:

i列车在第j站的实际晚点时间x1;第i列车在j-1j区间的列车运行时间x2;第i列车在j-1到j区间的运行距离x3;第i列车从站1到站j的运行距离x4;第i列车从站1到站j+1的运行距离x5;第i列车在jj+1区间的图定运行时间x6;第i列车在jj+1区间的运行距离x7;站j的编码x8;第i列车在车站j+1的股道分配x9;第i列车的车次x10;列车到站的顺序x11。

优选的,基于所述特征集合构建时空关联的xgboost晚点预测模型包括:

基于所述测试集计算所述xgboost晚点预测模型的迭代函数、决策树空间和迭代预测的列车晚点时间;

建立惩罚项以限制所述决策树空间的子节点个数;

基于所述惩罚项和所述迭代函数形成所述xgboost晚点预测模型的目标函数。

优选的,所述xgboost晚点预测模型的超参数包括:

回归树的数量、回归树的最大深度、子树所需要的最小权重和、训练集的子集合比率、每棵回归树的列子样本比例、随机增长率和学习率固定值。

优选的,基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化包括:

根据定义的超参数范围构建基于列车晚点时间的超参数搜索空间和相应的平均绝对误差高斯分布模型;其中所述超参数搜索空间由多次迭代的超参数组合形成;

基于多次迭代的超参数组合和相应的平均绝对误差高斯分布模型计算联合高斯分布;

通过所述联合高斯分布计算基于多次迭代的超参数组合的平均绝对误差高斯分布模型的均值和标准差。

优选的,采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正包括:

将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数;

基于最大化的采集函数选择迭代输入的超参数组合并更新所述多次迭代的超参数组合的平均绝对误差高斯分布模型;

判断选择的迭代输入的超参数组合的迭代次数是否大于预设的迭代次数:

若大于预设的迭代次数,则输出最后的超参数组合和平均绝对误差;

若小于预设的迭代次数,返回将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数步骤。

优选的,采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果包括:

基于输出的最后的超参数组合及其平均绝对误差,采用测试集测试所述修正后的xgboost晚点预测模型;

输出修正后的列车晚点时间及其预测评价指标。

优选的,所述预测评价指标包括:修正后的列车晚点时间的平均绝对误差、均方根误差和决定系数。

基于机器学习xgboost模型和贝叶斯优化,将影响列车晚点的时间和空间因素作为输入变量,通过列车晚点历史数据不断对模型进行训练,最后得到各列车的到站晚点时间以及评价指标。

基于同样的发明构思,本发明另提供一种列车到站晚点预测装置,包括:

提取构建模块,用于提取列车晚点的特征集合,基于所述特征集合构建时空关联的xgboost晚点预测模型;

定义模块,用于定义所述xgboost晚点预测模型的超参数范围,将所述特征集合分割为训练集和测试集;

优化模块,基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化;

修正模块,用于采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

测试模块,用于采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果。

其中,提取构建模块包括:

第一计算子模块,基于所述特征集合计算所述xgboost晚点预测模型的迭代函数、决策树空间和迭代预测的列车晚点时间;

惩罚项子模块,建立惩罚项以限制所述决策树空间的子节点个数;

目标函数建立子模块,基于所述惩罚项和所述迭代函数形成所述xgboost晚点预测模型的目标函数。

优化模块包括:

高斯模型构建子模块,根据定义的超参数范围构建基于列车晚点时间的超参数搜索空间和相应的平均绝对误差高斯分布模型;其中所述超参数搜索空间由多次迭代的超参数组合形成;

联合高斯分布子模块,基于多次迭代的超参数组合和相应的平均绝对误差高斯分布模型计算联合高斯分布;

第二计算子模块,通过所述联合高斯分布计算基于多次迭代的超参数组合的平均绝对误差高斯分布模型的均值和标准差。

修正模块包括:

最大化子模块,用于将所述训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数;

选择子模块,用于基于最大化的采集函数选择迭代输入的超参数组合并更新所述多次迭代的超参数组合的平均绝对误差高斯分布模型;判断子模块,判断选择的迭代输入的超参数组合的迭代次数是否大于预设的迭代次数:

若大于预设的迭代次数,则输出最后的超参数组合和平均绝对误差;

若小于预设的迭代次数,返回将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数步骤。

测试模块包括:

测试子模块,用于基于输出的最后的超参数组合及其平均绝对误差,采用测试集测试所述修正后的xgboost晚点预测模型;

输出子模块,用于输出修正后的列车晚点时间及其预测评价指标。

本发明另提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器耦合连接的存储器;其中,

所述存储器存储有计算机程序,所述计算机程序能够被所述至少一个处理器执行,以实现上述方法。

本发明另提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序被执行时,能够实现上述任一项所述的方法。

本发明考虑到预测模型超参数搜索的复杂性,提出利用贝叶斯优化算法估计超参数,提高了超参数搜索的效率。本方法比既有的晚点预测模型预测精度更高、鲁棒性更强、计算速度更快,能够为晚点情况下列车能力评估及列车调整提供决策支持。

基于同样的发明构思,本发明还提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器耦合连接的存储器;其中,

所述存储器存储有计算机程序,所述计算机程序能够被所述至少一个处理器执行,以实现上述任一项所述的方法。

基于同样的发明构思,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序被执行时,能够实现上述任一项所述的方法。

本发明通过获取列车的计划运行图和实际运行图,从中提取列车晚点的特征集合,并建立列车晚点预测模型;通过建立训练模型,比较预测晚点时间与实际晚点时间的误差,确定最优参数的修正模型,使得预测晚点时间更为精确,并对修正后的模型进行测试,输出最终的晚点预测时间和各项评价指标,通过指标数据进一步判断该模型和预测的晚点时间是否精确。

本发明考虑到预测模型超参数标定的复杂性,提出利用贝叶斯优化算法估计超参数,提高了超参数搜索的效率。本方法比既有的晚点预测模型预测精度更高、鲁棒性更强、计算速度更快,能够为晚点情况下列车能力评估及列车调整提供决策支持。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1中列车到站晚点预测方法流程图;

图2为本发明实施例2中列车到站晚点预测方法中s1步骤流程图;

图3为本发明实施例2中列车到站晚点预测方法中s3步骤流程图;

图4为本发明实施例2中列车到站晚点预测方法中s4步骤流程图;

图5为本发明实施例2中列车到站晚点预测方法中s5步骤流程图;

图6为本发明实施例2中列车到站晚点预测装置流程图;

图7为本发明实施例2中列车到站晚点预测装置中模型构建模块10流程图;

图8为本发明实施例2中列车到站晚点预测装置中优化模块30流程图;

图9为本发明实施例2中列车到站晚点预测装置中修正模块40流程图;

图10为本发明实施例2中列车到站晚点预测装置中修正模块50流程图;

图11为本发明实施例3中xgboost模型算法结构图;

图12为本发明实施例3中贝叶斯优化流程图;

图13为本发明实施例3中超参数优化后预测模型的r2变化图;

图14为本发明实施例3中测试集上实际到达晚点和预测到达晚点的分布图;

图15为本发明实施例3中五种预测模型的性能比较图;

图16为本发明实施例3中不同模型在不同车站r2值的比较图;

图17为本发明实施例3中不同模型在不同车站mae值的比较图;

图18为本发明实施例3中不同模型在不同车站rmse值的比较图。

具体实施方式

下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当本申请称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。

实施例1本实施例提供一种列车到站晚点预测方法

如图1所示,该方法包括:

s1:通过主成分分析法提取列车晚点的特征集合,基于所述特征集合构建时空关联的xgboost晚点预测模型;

s2:定义所述xgboost晚点预测模型的超参数范围,通过5-折交叉验证将所述特征集合分割为训练集和测试集;

s3:基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化;

s4:采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

s5:采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果。

主成分分析法(principalcomponentsanalysis,pca)是一种简化数据集的技术,为线性变换,此变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。

在机器学习里,通常来说不能将数据集全部用于数据训练模型,否则将没有数据集对该模型进行验证,从而评估本申请的模型的预测效果。可以采用k-折交叉验证法,例如k取5,将所有数据集分成5份,不重复地每次取其中一份做测试集,用其他四份做训练集训练模型。

本实施例通过获取列车的计划运行图和实际运行图,从中提取列车晚点的特征集合,并建立列车晚点预测模型;通过建立训练模型,比较预测晚点时间与实际晚点时间的误差,确定最优参数的修正模型,使得预测晚点时间更为精确,并对修正后的模型进行测试,输出最终的晚点预测时间和各项评价指标,通过指标数据进一步判断该模型和预测的晚点时间是否精确。

实施例2本实施例提供一种列车到站晚点预测方法

s1:通过主成分分析法提取列车晚点的特征集合,基于所述特征集合构建时空关联的xgboost晚点预测模型;

所述列车晚点的特征集合包括:

i列车在第j站的实际晚点时间x1;第i列车在j-1j区间的列车运行时间x2;第i列车在j-1到j区间的运行距离x3;第i列车从站1到站j的运行距离x4;第i列车从站1到站j+1的运行距离x5;第i列车在jj+1区间的图定运行时间x6;第i列车在jj+1区间的运行距离x7;站j的编码x8;第i列车在车站j+1的股道分配x9;第i列车的车次x10;列车到站的顺序x11。

如图2所示,s1包括

s101:基于所述特征集合计算所述xgboost晚点预测模型的迭代函数、决策树空间和迭代预测的列车晚点时间;

s102:建立惩罚项以限制所述决策树空间的子节点个数;

s103:基于所述惩罚项和所述迭代函数形成所述xgboost晚点预测模型的目标函数。

s2:定义所述xgboost晚点预测模型的超参数范围,通过5-折交叉验证将所述特征集合分割为训练集和测试集;

s4:采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

s2中的超参数包括:

回归树的数量、回归树的最大深度、子树所需要的最小权重和、训练集的子集合比率、每棵回归树的列子样本比例、随机增长率和学习率固定值。

定义超参数范围:回归树的数量:nrounds=[10,1000];回归树的最大深度:max_depth=[1,30];子树所需要的最小权重和:min_child_weight=[1,20];训练集的子集合比率:subsample=[0.60,1.00];构建每棵回归树时,列子样本比例:colsample_bylevel=[0.80,1.00];随机增长率和学习率固定值:seed=1,eta=0.01。

s3:基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化;

如图3所示,s3包括:

s301:根据定义的超参数范围构建基于列车晚点时间的超参数搜索空间和相应的平均绝对误差高斯分布模型;其中所述超参数搜索空间由多次迭代的超参数组合形成;

s302:基于多次迭代的超参数组合和相应的平均绝对误差高斯分布模型计算联合高斯分布;

s303:通过所述联合高斯分布计算基于多次迭代的超参数组合的平均绝对误差高斯分布模型的均值和标准差。

s4:采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

如图4所示,s4包括:

s401将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数;

s402基于最大化的采集函数选择迭代输入的超参数组合并更新所述多次迭代的超参数组合的平均绝对误差高斯分布模型;

s403判断选择的迭代输入的超参数组合的迭代次数是否大于预设的迭代次数:

若大于预设的迭代次数,则输出最后的超参数组合和平均绝对误差;

若小于预设的迭代次数,返回将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数步骤。

s5:采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果。

如图5所示,s5包括:

s501基于输出的最后的超参数组合及其平均绝对误差,采用测试集测试所述修正后的xgboost晚点预测模型;

s502输出修正后的列车晚点时间及其预测评价指标。

其中预测评价指标包括:均方根误差(rootmeansquareerror,rmse)、平均绝对误差(meanabsoluteerror,mae)和决定系数(r2)。

基于机器学习xgboost模型和贝叶斯优化,将影响列车晚点的时间和空间因素作为输入变量,通过列车晚点历史数据不断对模型进行训练,最后得到各列车的到站晚点时间以及评价指标。

基于同样的发明构思,本实施例另提供一种列车到站晚点预测装置,如图6所示,所述装置包括:

提取构建模块10,用于提取列车晚点的特征集合,基于所述特征集合构建时空关联的xgboost晚点预测模型;

定义模块20,用于定义所述xgboost晚点预测模型的超参数范围,将所述特征集合分割为训练集和测试集;

优化模块30,基于所述训练集采用贝叶斯算法对所述xgboost晚点预测模型的超参数组合进行迭代优化;

修正模块40,用于采用最大化采集函数对所述优化后的xgboost晚点预测模型进行修正;

测试模块50,用于采用测试集测试所述修正后的xgboost晚点预测模型以得到最终的预测结果。

其中,如图7所示,提取构建模块10包括:

第一计算子模块101,基于所述特征集合计算所述xgboost晚点预测模型的迭代函数、决策树空间和迭代预测的列车晚点时间;

惩罚项子模块102,建立惩罚项以限制所述决策树空间的子节点个数;

目标函数建立子模块103,基于所述惩罚项和所述迭代函数形成所述xgboost晚点预测模型的目标函数。

如图8所示,优化模块30包括:

高斯模型构建子模块301,根据定义的超参数范围构建基于列车晚点时间的超参数搜索空间和相应的平均绝对误差高斯分布模型;其中所述超参数搜索空间由多次迭代的超参数组合形成;

联合高斯分布子模块302,基于多次迭代的超参数组合和相应的平均绝对误差高斯分布模型计算联合高斯分布;

第二计算子模块303,通过所述联合高斯分布计算基于多次迭代的超参数组合的平均绝对误差高斯分布模型的均值和标准差。

如图9所示,修正模块40包括:

最大化子模块401,用于将所述训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数;

选择子模块402,用于基于最大化的采集函数选择迭代输入的超参数组合并更新所述多次迭代的超参数组合的平均绝对误差高斯分布模型;

判断子模块403,判断选择的迭代输入的超参数组合的迭代次数是否大于预设的迭代次数:

若大于预设的迭代次数,则输出最后的超参数组合和平均绝对误差;

若小于预设的迭代次数,返回将训练集输入预测模型,得到模型预测的列车晚点时间,并基于所述模型预测的列车晚点时间最大化采集函数步骤。

如图10所示,测试模块50包括:

测试子模块501,用于基于输出的最后的超参数组合及其平均绝对误差,采用测试集测试所述修正后的xgboost晚点预测模型;

输出子模块502,用于输出修正后的列车晚点时间及其预测评价指标。

本实施例另提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器耦合连接的存储器;其中,

所述存储器存储有计算机程序,所述计算机程序能够被所述至少一个处理器执行,以实现上述方法。

本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序被执行时,能够实现上述任一项所述的方法。

本发明通过获取列车的计划运行图和实际运行图,从中提取列车晚点的特征集合,并建立列车晚点预测模型;通过建立训练模型,比较预测晚点时间与实际晚点时间的误差,确定最优参数的修正模型,使得预测晚点时间更为精确,并对修正后的模型进行测试,输出最终的晚点预测时间和各项评价指标,通过指标数据进一步判断该模型和预测的晚点时间是否精确。

本发明考虑到预测模型超参数搜索的复杂性,提出利用贝叶斯优化算法估计超参数,提高了超参数搜索的效率。本机器学习方法比既有的晚点预测模型预测精度更高、鲁棒性更强、计算速度更快,能够为晚点情况下列车能力评估及列车调整提供决策支持。

基于同样的发明构思,本发明还提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器耦合连接的存储器;其中,

所述存储器存储有计算机程序,所述计算机程序能够被所述至少一个处理器执行,以实现上述任一项所述的方法。

基于同样的发明构思,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序被执行时,能够实现上述任一项所述的方法。

实施例3本实施例提供一种列车到站晚点预测方法

如图1所示,步骤如下:

s1:获取如表1所示的计划运行数据与实际运行数据;

表1

s2:确定影响列车到站晚点的特征集合;

采用主成分分析法对表1中的原始数据进行处理得到影响列车到站晚点的11个因素:第i列车在第j站的实际晚点时间x1;第i列车在j-1j区间的列车运行时间x2;第i列车在j-1到j区间的运行距离x3;第i列车从站1到站j的运行距离x4;第i列车从站1到站j+1的运行距离x5;第i列车在jj+1区间的图定运行时间x6;第i列车在jj+1区间的运行距离x7;站j的编码x8;第i列车在车站j+1的股道分配x9;第i列车的车次x10;列车到站的顺序x11,特征集合如表2所示。

表2

s3:基于所述特征集合构建时空关联的xgboost模型;

构建的xgboost模型的流程如图11所示。

s31:模型输出变量的计算过程如下

式中:表示第t轮迭代的预测晚点时间;表示列车i的特征集合;表示第t轮迭代的函数;f表示决策树空间;q(x)表示将输入样本x映射到树的叶子节点;其对应的叶子节点的标号为;x表示所有列车的特征集合;表示叶子节点的所有标号。

s32:建立惩罚项来限制子节点的个数,惩罚项表达式如下所示:

式中:为惩罚力度;为参数;为叶子节点j的权重;t为叶子节点个数,叶子节点越多,惩罚力度越大。

s33:模型的最终目标函数如下:

式中:表示损失函数,当新加入函数时,损失函数相当于一个常数,对其进行二次泰勒展开对应泰勒展开式中的一阶导数,对应泰勒展开式中的二阶导数;i=1.2,3…11;t为叶子节点个数。

s4:训练xgboost模型;

s41:定义xgboost模型的参数范围;

回归树的数量:nrounds=[10,1000];回归树的最大深度:max_depth=[1,30];子树所需要的最小权重和:min_child_weight=[1,20];训练样本的子样本比率:subsample=[0.60,1.00];构建每棵回归树时,列子样本比例:colsample_bylevel=[0.80,1.00];随机增长率和学习率固定值:seed=1,eta=0.01。

s42:进行5-折交叉检验,将所述训练集1份是第二测试集和4份第二训练集;

s43:贝叶斯优化,确定预测模型的参数组合;

贝叶斯优化过程如图12所示。

s431:根据超参数范围构建平均绝对误差(mae)g和超参数搜索空间z,满足高斯分布,计算公式如下所示:

式中:表示高斯分布;表示的数学期望;为z的协方差函数;表示xgboost的预测晚点时间,zi代表第i次迭代的超参数搜索空间;表示实际列车晚点时间。

对于每个输入样本x都有一个对应的高斯分布,而对于一组z={z1,z2,...,zt},t指迭代次数,存在一个联合高斯分布,这个高斯分布满足

假设有一组已知的样本点{z1:t-1,g1:t-1},对一个新样本xt,联合高斯分布为:。使用上述式子可以计算的后验概率,本质上是为了得到的均值和方差。

式中:表示协方差函数;表示ft的后验概率;表示高斯分布,k是kt的转置矩阵;表示第t次迭代输入的参数组合;表示的均值;表示的方差。

s432:将训练集输入预测模型,得到模型预测的列车晚点时间并对模型进行修正;

s433:通过最大化采集函数来选择下一组评估点,整合数据,并且更新高斯模型:

式中:表示采集函数,一般设置为常数,表示第t次迭代输出的晚点预测时间。

s434:判断选择参数组合的次数是否大于t,若大于t次转s435,若小于t次转s432;

s435:终止算法的学习过程,输出最后的参数组合以及预测误差。

s5:输出晚点预测结果。

s51:将输出的最后的参数组合及预测误差代入预测模型输出预测的列车到站晚点时间;

s52:输出评价预测结果的指标,指标计算公式如下:

式中:表示第i列车的预测值,表示所有数据的平均值,表示第i条数据的实际值。

该方法属于构建机器学习模型,由xgboost模型和贝叶斯优化两部分组成,xgboost模型模型主要通过机器学习修改预测模型得到准确的列车晚点时间,贝叶斯优化主要用于提升模型中超参数搜索的速度,从而更快更准地预测列车晚点时间。

贝叶斯优化超参数优化的最终结果如图13所示。在超参数调整前,r2只有0.9432,经过40次迭代后,r2达到0.9876。最终建立的模型的超参数为:nrounds=620,max_depth=5,min_child_weight=2.67,subsample=0.87,colsample_bylevel=0.89,seed=1,eta=0.01。为了说明所提模型的拟合效果,计算了实际到达时延和预测到达时延在测试集中的分布,如图14所示。可以直观地观察到拟合的效果很好。

为了验证方法的预测性能,引入了随机森林(rf)、梯度提升迭代回归树(gbdt)、极限学习机(delm)和xgboost四种方法作为比较对象。这些模型在相同的训练集上进行训练,在相同的测试集上进行评估,这些模型的r2、mae和rmse的分布如图15所示。总体而言,预测效果是令人满意的。除梯度提升迭代回归树(gbdt)外,其他四个模型的预测精度都很高,r2均超过0.987。具体来说,本申请的方法的r2最高,为0.9905,说明本申请的方法的模拟效果最好。此外,本申请提出的模型具有最低的mae和rmse,分别为0.889和2.52。此外,极端梯度方法的性能仅次于本申请提出的方法(r2=0.9898,mae=0.94,rmse=2.65),说明极端梯度方法在解决列车延误预测问题方面的能力最大,且贝叶斯优化极端梯度是有效的。

计算每个模型在列车到达正点率最低的三个站的误差,在车站层面对所提模型进行评估,如图16-图18所示。从图中可以看出,除了提出的模型外,xgboost模型在三个车站的所有晚点列车中rmse和mae最小,r2最高。特别是与梯度提升迭代回归树(gbdt)模型相比,xgboost模型有了明显的改进,rmse和mae的值减少了近一半,说明该算法适合解决车站列车晚点时间问题。与xgboost模型相比,本申请的方法进一步降低了误差,提供了最佳的预测结果。本申请的方法比随机森林(rf)、梯度提升迭代回归(gbdt)、极限学习机(delm)具有更好的预测效果,说明本申请提出的模型在实际应用层面具有精准度高、鲁棒性强、计算速度快的优势。

综上所述,本发明实例提供的一种基于数据驱动的列车到站晚点预测方法及装置。该方法首先分析和识别出影响列车到站晚点的11个因素;在此基础上建立基于xgboost的列车到站晚点预测模型,模型反映了列车之间的时空关联关系;考虑到预测模型超参数搜索的复杂性,提出利用贝叶斯优化算法估计超参数,提高了超参数搜索的效率。本机器学习方法比既有的晚点预测模型预测精度更高、鲁棒性更强、计算速度更快,能够为晚点情况下列车能力评估及列车调整提供决策支持。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1