一种民航平均票价收入的预测方法、装置和电子设备与流程

文档序号:29215029发布日期:2022-03-12 10:58阅读:175来源:国知局
一种民航平均票价收入的预测方法、装置和电子设备与流程

1.本技术涉及民航技术领域,更具体地说,涉及一种民航平均票价收入的预测方法、装置和电子设备。


背景技术:

2.目前,国内民航市场确定逐步建立通过市场竞争形成价格的机制。通过广泛的市场竞争,航空企业的净利率将随着票价市场化的推进并逐步变换。航空企业使用航线、区域的平均票价进行运营分析,对未来的运力投产等方面有很强的指导意义。平均票价预估的准确性,影响航空企业与行业对标时核心指标的计算精准度,定位的判断和对航班运力的投放策略。
3.航空公司对于票价收入当前主要采用半自动化的技术手段,通过人工对比历史数据进行经验分析,实现对未来的票价收入进行预测,由于此过程中过于依赖人为经验对收入进行预测,主观性强,导致对将来民航平均票价收入的预测结果的准确性较差。


技术实现要素:

4.有鉴于此,本技术提供一种民航平均票价收入的预测方法、装置和电子设备,用于对将来民航平均票价收入进行预测,以得到较为准确的预测结果。
5.为了实现上述目的,现提出的方案如下:
6.一种民航平均票价收入的预测方法,应用于电子设备,所述预测方法包括步骤:
7.采集航空公司的跨区域或单线的票价结算数据;
8.对所述票价结算数据进行处理,得到时序序列数据;
9.将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。
10.可选的,所述采集航空公司的跨区域航线或单线航线的票价结算数据,包括步骤:
11.针对不同航空公司的不同区域,从生成数据库和结算数据库中提取所述跨区域和所述单线的相关信息数据;
12.将所述相关信息数与所述航空公司的多种航班信息进行关联处理,得到所述票价结算数据。
13.可选的,所述对所述票价结算数据进行处理,得到时序序列数据,包括步骤:
14.对所述票价结算数据进行特征工程处理,得到特定航司在特定始发、到达区域的票价收入信息;
15.对所述票价收入信息进行预处理,得到所述事项序列数据。
16.可选的,还包括步骤:
17.构建所述prophet模型,所述prophet模型如下:
18.y(t)=g(t)+s(t)+h(t)+ε
t
19.其中,g(t)为所述时间序列数据的趋势项,s(t)为所述时间序列数据的周期项,h(t)为所述时间序列数据的节假日项,ε
t
为所述时间序列数据的节误差项。
20.可选的,所述构建所述prophet模型,包括步骤:
21.准备样本数据,所述样本数据包括训练样本集和测试样本集;
22.根据所述训练样本集构建所述prophet模型,并利用所述测试样本集对所述prophet模型进行检验。
23.一种民航平均票价收入的预测装置,应用于电子设备,所述预测装置包括:
24.数据采集模块,用于采集航空公司的跨区域或单线的票价结算数据;
25.数据处理模块,用于对所述票价结算数据进行处理,得到时序序列数据;
26.预测执行模块,用于将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。
27.可选的,所述数据采集模块包括:
28.采集执行单元,用于针对不同航空公司的不同区域,从生成数据库和结算数据库中提取所述跨区域和所述单线的相关信息数据;
29.初步处理单元,用于将所述相关信息数与所述航空公司的多种航班信息进行关联处理,得到所述票价结算数据。
30.可选的,所述数据处理模块包括:
31.第一处理单元,用于对所述票价结算数据进行特征工程处理,得到特定航司在特定始发、到达区域的票价收入信息;
32.第二处理单元,用于对所述票价收入信息进行预处理,得到所述事项序列数据。
33.可选的,还包括步骤:
34.模型构建模块,用于构建所述prophet模型,所述prophet模型如下:
35.y(t)=g(t)+s(t)+h(t)+ε
t
36.其中,g(t)为所述时间序列数据的趋势项,s(t)为所述时间序列数据的周期项,h(t)为所述时间序列数据的节假日项,ε
t
为所述时间序列数据的节误差项。
37.一种电子设备,包括至少一个处理器和与所述处理器连接的存储器,其中:
38.所述存储器用于存储计算机程序或指令;
39.所述处理器用于运行所述计算机程序或指令,以使所述电子设备实现如上所述的民航平均票价收入的预测方法。
40.从上述的技术方案可以看出,本技术公开了一种民航平均票价收入的预测方法、装置和电子设备,该方法和装置具体为采集航空公司的跨区域或单线的票价结算数据;对所述票价结算数据进行处理,得到时序序列数据;将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。从该预测过程中可以看出,该过程并不需要依赖人为经验参与其中,因此避免了现有方案因主观性太强导致的预测结果的准确性较差的问题。
附图说明
41.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1为本技术实施例的一种民航平均票价收入的预测方法的流程图;
43.图2为本技术实施例的另一种民航平均票价收入的预测方法的流程图;
44.图3为本技术实施例的一种民航平均票价收入的预测方法的框图;
45.图4为本技术实施例的另一种民航平均票价收入的预测装置的框图;
46.图5为本技术实施例的一种电子设备的程图。
具体实施方式
47.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
48.实施例一
49.图1为本技术实施例的一种民航平均票价收入的预测方法的流程图。
50.如图1所示,本实施例提供的民航平均票价收入的预测方法应用于电子设备,该电子设备可以看做具有数据计算和信息处理的计算机或服务器,该预测方法用于对民航平均票价收入进行预测,具体包括如下步骤:
51.s101、采集航空公司跨区域或单线的票价结算数据。
52.首先,针对不同航空公司的不同区域,从结算公司生产数据库和结算数据库中提取相关信息数据;此处参考日是历史发生的日子,例如在预测2019年的收入时,可以采用2009至2018年的每日收入数据作为参考。
53.然后,针对多维的相关信息数据,通过关联航班号、航司代码、飞行时间和日期,出发和到达机场编码的标识,将航司代号、航班和票价收入信息以日期、星期或月份为单位进行聚合,得到上述的票价结算数据。
54.s102、对票价结算数据进行处理,得到时序序列数据。
55.即通过对票价结算数据进行特征工程处理和预处理,得到不同时间的票价收入数据,即时序序列数据,用来描述票价收入随时间变化的情况,具体来说通过如下:
56.对票价结算数据进行特征工程处理,通过引入特征工程方法,建立数据清洗法则,对收入数据进行清洗,对票价、起飞时间、起飞机场、航司等数据信息的进行筛选和识别,剔除无用信息、合并冗余信息、标识重要信息,提取出特定航司在特定始发、到达区域或机场的票价收入数据;
57.对经过特征工程处理的票价结算数据进行预处理,具体包括完成缺失值填补和异常数据处理的工作。一般可以采用上下相邻值代替的方法替换缺失值;然后,判断各时间序列点对应的实际票价收入数据是否存在异常,采用平均值的计算方法替代异常数据。
58.s103、利用prophet模型对时序序列数据进行处理,得到预测票价收入。
59.即将前述处理过程得到的时序序列数据输入预先构建的prophet模型中,得到预测票价收入。该预测票价收入可以以图形化的方式进行显示。该prophet模型如下:
60.y(t)=g(t)+s(t)+h(t)+ε
t
61.其中,g(t)为时间序列数据的趋势项,s(t)为时间序列数据的周期项,h(t)为时间序列数据的节假日项,ε
t
为时间序列数据的节误差项。
62.具体来说,通过趋势公式计算趋势项函数:其中c表示曲线的最大渐进值,k表示曲线的增长率,m表示偏移量。根据已知的收入时间序列判断收入是否呈现饱和增长:
63.若是,则趋势项函数选择使用逻辑回归函数,需提前设置好c=c(t)的取值;
64.若否,则趋势项函数使用分段线性函数
65.周期项s(t)根据季节特征一般采用傅里叶级数来模拟时间序列的周期性,若时间序列的周期为p,那么采用傅里叶级数建立的周期模型为
[0066][0067]
2n是期望在预测模型中周期的个数,n为傅里叶变换的阶数,an,bn为需要估计的参量。
[0068]
根据节假日信息,不同的节假日可看做是相互独立的模型。假设有l个节假日,那么
[0069][0070]
其中参数ki表示节假日对预测值的影响,对于第i个节假日来说,di是窗口期中包含的时间t,k=(k1,...k
l
)
t

[0071]
从上述技术方案可以看出,本实施例提供了一种民航平均票价收入的预测方法,该方法应用于电子设备,具体为采集航空公司的跨区域或单线的票价结算数据;对所述票价结算数据进行处理,得到时序序列数据;将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。从该预测过程中可以看出,该过程并不需要依赖人为经验参与其中,因此避免了现有方案因主观性太强导致的预测结果的准确性较差的问题。
[0072]
实施例二
[0073]
图2为本技术实施例的另一种民航平均票价收入的预测方法的流程图。
[0074]
如图2所示,本实施例提供的民航平均票价收入的预测方法应用于电子设备,该电子设备可以看做具有数据计算和信息处理的计算机或服务器,该预测方法用于对民航平均票价收入进行预测,具体包括如下步骤:
[0075]
s201、采集航空公司跨区域或单线的票价结算数据。
[0076]
首先,针对不同航空公司的不同区域,从结算公司生产数据库和结算数据库中提取相关信息数据;此处参考日是历史发生的日子,例如在预测2019年的收入时,可以采用2009至2018年的每日收入数据作为参考。
[0077]
然后,针对多维的相关信息数据,通过关联航班号、航司代码、飞行时间和日期,出发和到达机场编码的标识,将航司代号、航班和票价收入信息以日期、星期或月份为单位进行聚合,得到上述的票价结算数据。
[0078]
s202、对票价结算数据进行处理,得到时序序列数据。
[0079]
即通过对票价结算数据进行特征工程处理和预处理,得到不同时间的票价收入数据,即时序序列数据,用来描述票价收入随时间变化的情况,具体来说通过如下:
[0080]
对票价结算数据进行特征工程处理,通过引入特征工程方法,建立数据清洗法则,对收入数据进行清洗,对票价、起飞时间、起飞机场、航司等数据信息的进行筛选和识别,剔除无用信息、合并冗余信息、标识重要信息,提取出特定航司在特定始发、到达区域或机场的票价收入数据;
[0081]
对经过特征工程处理的票价结算数据进行预处理,具体包括完成缺失值填补和异常数据处理的工作。一般可以采用上下相邻值代替的方法替换缺失值;然后,判断各时间序列点对应的实际票价收入数据是否存在异常,采用平均值的计算方法替代异常数据。
[0082]
s203、构建prophet模型。
[0083]
具体的构建过程为,首先准备样本数据,这里的样本数据包括训练数据集和测试数据集。
[0084]
然后,对训练数据集建立预测模型,根据测试数据集对预测模型进行检验,具体的检验步骤如下:
[0085]
根据训练数据集,通过趋势公式计算趋势函数,根据票价收入趋势选择趋势函数选择逻辑回归函数还是分段线性函数;
[0086]
根据所述趋势函数,通过预设模型公式建立预设预测模型,结合网格搜索算法进行参数调整,确定最终模型的趋势函数模型、趋势灵活度、季节性和节假日信息等预测参数;
[0087]
为了衡量模型的预测效果,选择常用的评价指标:平均绝对百分比mape,公式如下:
[0088][0089]
其中yi表示第i时刻时间序列的真实值,pi表示第i时刻时间序列的预测值。
[0090]
s204、利用prophet模型对时序序列数据进行处理,得到预测票价收入。
[0091]
即将前述处理过程得到的时序序列数据输入预先构建的prophet模型中,得到预测票价收入。该预测票价收入可以以图形化的方式进行显示。该prophet模型如下:
[0092]
y(t)=g(t)+s(t)+h(t)+ε
t
[0093]
其中,g(t)为时间序列数据的趋势项,s(t)为时间序列数据的周期项,h(t)为时间序列数据的节假日项,ε
t
为时间序列数据的节误差项。
[0094]
具体来说,通过趋势公式计算趋势项函数:其中c表示曲线的最大渐进值,k表示曲线的增长率,m表示偏移量。根据已知的收入时间序列判断收入是否呈现饱和增长:
[0095]
若是,则趋势项函数选择使用逻辑回归函数,需提前设置好c=c(t)的取值;
[0096]
若否,则趋势项函数使用分段线性函数
[0097]
周期项s(t)根据季节特征一般采用傅里叶级数来模拟时间序列的周期性,若时间序列的周期为p,那么采用傅里叶级数建立的周期模型为
[0098]
[0099]
2n是期望在预测模型中周期的个数,n为傅里叶变换的阶数,an,bn为需要估计的参量。
[0100]
根据节假日信息,不同的节假日可看做是相互独立的模型。假设有l个节假日,那么
[0101][0102]
其中参数ki表示节假日对预测值的影响,对于第i个节假日来说,di是窗口期中包含的时间t,k=(k1,...k
l
)
t

[0103]
从上述技术方案可以看出,本实施例提供了一种民航平均票价收入的预测方法,该方法应用于电子设备,具体为采集航空公司的跨区域或单线的票价结算数据;对所述票价结算数据进行处理,得到时序序列数据;将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。从该预测过程中可以看出,该过程并不需要依赖人为经验参与其中,因此避免了现有方案因主观性太强导致的预测结果的准确性较差的问题。
[0104]
实施例三
[0105]
图3为本技术实施例的一种民航平均票价收入的预测装置的框图。
[0106]
如图3所示,本实施例提供的民航平均票价收入的预测装置应用于电子设备,该电子设备可以看做具有数据计算和信息处理的计算机或服务器,该预测装置用于对民航平均票价收入进行预测,具体包括数据采集模块10、数据处理模块20和预测执行模块30。
[0107]
数据采集模块用于采集航空公司跨区域或单线的票价结算数据。该模块包括采集执行单元和初步处理单元。
[0108]
采集执行单元用于针对不同航空公司的不同区域,从结算公司生产数据库和结算数据库中提取相关信息数据;此处参考日是历史发生的日子,例如在预测2019年的收入时,可以采用2009至2018年的每日收入数据作为参考。
[0109]
初步处理单元用于针对多维的相关信息数据,通过关联航班号、航司代码、飞行时间和日期,出发和到达机场编码的标识,将航司代号、航班和票价收入信息以日期、星期或月份为单位进行聚合,得到上述的票价结算数据。
[0110]
数据处理模块用于对票价结算数据进行处理,得到时序序列数据。
[0111]
即通过对票价结算数据进行特征工程处理和预处理,得到不同时间的票价收入数据,即时序序列数据,用来描述票价收入随时间变化的情况。该模块包括第一处理单元和第二处理单元。
[0112]
第一处理单元用于对票价结算数据进行特征工程处理,通过引入特征工程方法,建立数据清洗法则,对收入数据进行清洗,对票价、起飞时间、起飞机场、航司等数据信息的进行筛选和识别,剔除无用信息、合并冗余信息、标识重要信息,提取出特定航司在特定始发、到达区域或机场的票价收入数据;
[0113]
第二处理单元用于对经过特征工程处理的票价结算数据进行预处理,具体包括完成缺失值填补和异常数据处理的工作。一般可以采用上下相邻值代替的方法替换缺失值;然后,判断各时间序列点对应的实际票价收入数据是否存在异常,采用平均值的计算方法替代异常数据。
[0114]
预测执行单元用于利用prophet模型对时序序列数据进行处理,得到预测票价收

[0115]
即将前述处理过程得到的时序序列数据输入预先构建的prophet模型中,得到预测票价收入。该预测票价收入可以以图形化的方式进行显示。该prophet模型如下:
[0116]
y(t)=g(t)+s(t)+h(t)+ε
t
[0117]
其中,g(t)为时间序列数据的趋势项,s(t)为时间序列数据的周期项,h(t)为时间序列数据的节假日项,ε
t
为时间序列数据的节误差项。
[0118]
具体来说,通过趋势公式计算趋势项函数:其中c表示曲线的最大渐进值,k表示曲线的增长率,m表示偏移量。根据已知的收入时间序列判断收入是否呈现饱和增长:
[0119]
若是,则趋势项函数选择使用逻辑回归函数,需提前设置好c=c(t)的取值;
[0120]
若否,则趋势项函数使用分段线性函数
[0121]
周期项s(t)根据季节特征一般采用傅里叶级数来模拟时间序列的周期性,若时间序列的周期为p,那么采用傅里叶级数建立的周期模型为
[0122][0123]
2n是期望在预测模型中周期的个数,n为傅里叶变换的阶数,an,bn为需要估计的参量。
[0124]
根据节假日信息,不同的节假日可看做是相互独立的模型。假设有l个节假日,那么
[0125][0126]
其中参数ki表示节假日对预测值的影响,对于第i个节假日来说,di是窗口期中包含的时间t,k=(k1,...k
l
)
t

[0127]
从上述技术方案可以看出,本实施例提供了一种民航平均票价收入的预测装置,该装置应用于电子设备,具体为采集航空公司的跨区域或单线的票价结算数据;对所述票价结算数据进行处理,得到时序序列数据;将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。从该预测过程中可以看出,该过程并不需要依赖人为经验参与其中,因此避免了现有方案因主观性太强导致的预测结果的准确性较差的问题。
[0128]
另外,在本实施例的一个具体实施方式中,还包括模型构建模块40,如图4所示。
[0129]
该模型构建模块用于构建prophet模型。
[0130]
该模块的具体的构建过程为,首先准备样本数据,这里的样本数据包括训练数据集和测试数据集。然后,对训练数据集建立预测模型,根据测试数据集对预测模型进行检验,具体的检验步骤如下:
[0131]
根据训练数据集,通过趋势公式计算趋势函数,根据票价收入趋势选择趋势函数选择逻辑回归函数还是分段线性函数;
[0132]
根据所述趋势函数,通过预设模型公式建立预设预测模型,结合网格搜索算法进行参数调整,确定最终模型的趋势函数模型、趋势灵活度、季节性和节假日信息等预测参
数;
[0133]
为了衡量模型的预测效果,选择常用的评价指标:平均绝对百分比mape,公式如下:
[0134][0135]
其中yi表示第i时刻时间序列的真实值,pi表示第i时刻时间序列的预测值。
[0136]
实施例四
[0137]
图5为本技术实施例的一种电子设备的框图。
[0138]
如图5所示,本实施例提供的电子设备可以看为具有数据计算和信息处理的计算机或服务器,该电子设备包括至少一个处理器101和存储器102,两者通过数据总线103连接。该存储器用于存储计算机程序或指令,该处理器用于获取并执行相应计算机程序或指令,以使该电子设备实现如实施例一中的民航平均票价收入的预测方法。
[0139]
该预测方法应具体为采集航空公司的跨区域或单线的票价结算数据;对所述票价结算数据进行处理,得到时序序列数据;将所述时序序列数据输入预先构建的prophet模型中,得到预测票价收入。从该预测过程中可以看出,该过程并不需要依赖人为经验参与其中,因此避免了现有方案因主观性太强导致的预测结果的准确性较差的问题。
[0140]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0141]
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0142]
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0143]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0144]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0145]
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基
本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0146]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0147]
以上对本发明所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1