一种机场出租车需求预测的方法

文档序号:37822840发布日期:2024-04-30 17:32阅读:15来源:国知局
一种机场出租车需求预测的方法

本发明涉及预测方法,尤其是涉及一种机场出租车需求预测的方法。


背景技术:

1、机场出租车服务分为传统出租车和网约车两种模式,两者在服务方式上存在差异。传统出租车通常在机场设有专门的等候区域,司机遵循“先来先服务”原则在该区域排队等候接客;而网约车通过网约车平台订单系统派单接客,其等候区域远离传统出租车或其他交通方式的接送区域。这两种服务方式相互补充,同时也存在一定竞争。具体而言,网约车服务所具有的实时透明等优势,给传统出租车(以下简称出租车)出行需求带来了挑战,机场出租车候车区域等待的传统出租车司机通常需要等待3个小时左右才能接到乘客,这大大降低了服务效率并增加了营运成本。

2、现有的机场出租车需求预测的方法需要综合使用机场到港旅客乘坐出租车订单数据、机场到港航班数据、机场到港旅客乘坐地铁闸门数据、机场天气报文数据等多种来源的数据,应用不同预测模型并比较得到预测结果。

3、但是,现有的机场出租车需求预测的方法未能明确区分传统出租车和网约车这两种服务模式,忽视了机场网约车服务对传统出租车需求的影响,导致预测结果准确性不高,另外,在预测时,要求获取尽可能多而详细的自变量信息,例如旅客个人信息等,导致数据获取具有一定难度,实现难度较高。


技术实现思路

1、本发明所要解决的技术问题是提供一种预测准确度高,且数据获取难度较低,易于实现的机场出租车需求预测的方法。

2、本发明解决上述技术问题所采用的技术方案为:一种机场出租车需求预测的方法,包括以下步骤:

3、步骤1:将每天从0点开始,以5分钟为一个时段进行时段划分,向交通部门获取需要预测的机场在当前预测时段前m个时段的出租车行程数据,其中,m=m×24×12,m为大于等于30的整数,统计这m个时段的出租车行程数据中每个时段内的机场出租车出行量,再按照时段先后顺序生成机场出租车出行量时间序列;

4、步骤2:将每天从0点开始,以5分钟为一个时段进行时段划分,向交通部门获取需要预测的机场在当前预测时段前m个时段的网约车行程数据,统计这m个时段的网约车行程数据中每个时段内的机场网约车出行量,再按照时段先后顺序生成机场网约车出行量时间序列;

5、步骤3:将每天从0点开始,以5分钟为一个时段进行时段划分,通过航空公司的网站、需要预测的机场的信息显示屏或者各种航班跟踪应用和网站收集需要预测的机场在当前预测时段前m个时段中每个时段的到港航班时间、航班类型、飞机型号及其可用座位数和前m个时段的平均客座率,将这m个时段中第k个时段的飞机型号总数记为nk,第k个时段的第ik种飞机型号的机场到港航班架次记为第k个时段第ik种飞机型号的可用座位数记为k=1,2,…,m,ik=1,2,…,nk,其中nk是第k个时段的飞机型号总数,m个时段的平均客座率记为plf;先按照时段先后顺序统计这m个时段的每个时段的机场到港旅客数量,再按照时段先后顺序生成机场到港旅客数量时间序列;将需要预测的机场这m个时段的第k个时段的到港旅客数量记为apk,采用公式(1)计算得到apk:

6、

7、步骤4:采用机场出租车出行量时间序列、机场网约车出行量时间序列和机场到港旅客数量时间序列构成数据集,该数据集包括3列m行数据,其中,第1列数据对应为机场出租车出行量时间序列,第2列数据对应为机场网约车出行量时间序列,第3列数据对应为机场到港旅客数量时间序列,每行数据对应为同一时段的机场出租车出行量、机场网约车出行量和机场到港旅客数量;

8、步骤5:使用步骤4所得数据集,对var模型进行训练,具体步骤为:

9、步骤5.1:将当前数据集的每列数据分别作为一个变量,当前数据集具有三个变量,对当前数据集的每个变量分别进行平稳性检验,如果3个变量的检验结果均平稳,则认为当前数据集检验结果平稳,将当前数据集作为平稳数据集,若某个变量检验结果不平稳,则采用johansen检验方法检验当前数据集的3个变量之间是否存在协整关系,若检验结果为存在协整关系,则当前数据集也作为平稳数据集,若检验结果不存在协整关系,则继续对当前数据集的3个变量分别进行平稳化处理,得到平稳数据集;其中平稳化处理为:对当前数据集中每个变量分别进行一次差分运算,更新当前数据集中的3个变量,然后将更新后的数据集作为当前数据集,对当前数据集的每个变量分别进行平稳性检验,判断当前数据集检验结果是否平稳,若检验结果平稳,则将当前数据集作为平稳数据集,若检验结果不平稳,则对当前数据集中每个变量分别进行一次差分运算后再进行判断,以此类推,直到当前数据集检验结果平稳;

10、步骤5.2:统计当前平稳数据集中的行数,将其记为t,将每行作为一个向量,每个向量包含3个值,第w行表示第w个向量,第w个向量的第1个值称为向量w的机场出租车出行量值,第2个值称为向量w的机场网约车出行量值,第3个值称为向量w的机场到港旅客数量值;w=1,2,…,t;

11、步骤5.3:将var模型的滞后阶数分别设定为1至8,得到8个var模型,将滞后阶数为s的var模型称为var(s)模型,s=1,2,…,8;

12、使用软件eviews,基于当前平稳数据集分别计算得到var(1)模型到var(8)模型的信息准则结果表,表有8行5列数据,每一列从左到右分别表示likelihood ratio(lr准则)、finite sample size predictor elimination(fpe检验准则)、akaike informationcriterion(aic准则)、schwartz criterion(sc准则)、hannan-quinn criterion(hq准则),每一行从上到下分别表示var(1)到var(8);

13、先确定信息准则结果表的每一列中的最小值,然后确定每一行中最小值的数量,将第s行中最小值的数量作为var(s)模型的优先度,从而得到var(1)模型到var(8)模型的优先度;

14、根据var(1)模型到var(8)模型的优先度确定其优先级,其中,优先度越大,优先级越高,若两个或者两个以上var模型的优先度相同,则按照“aic准则>sc准则>lr准则>hq准则>fpe检验准则”的优先度顺序确定其优先级;

15、在确定var(1)模型到var(8)模型的优先级后,选择var(1)模型到var(8)模型中优先级最高的作为当前var模型;

16、步骤5.4:获取当前var模型的滞后阶数,将其记为p,p大于等于1且小于等于8,当前var模型为var(p)模型,根据p确定var(p)模型的数学表达式如下式(2)所示:

17、其中,t=p+1,p+2,…,t,trt表示向量t的机场出租车出行量值,rhrt表示向量t的机场网约车出行量值,apt表示向量t的机场到港旅客数量值,trt-1,…,trt-p表示向量t-1至t-p的机场出租车出行量值,rhrt-1,…,rhrt-p表示向量t-1至t-p的机场网约车出行量值,apt-1,…,apt-p表示向量t-1至t-p的机场到港旅客数量值,a1,…,ap为3×3的系数矩阵,分别表示滞后阶数为1到p的自回归系数矩阵,表示3个截距项,表示向量t的3个非自相关残差项;

18、步骤5.5:采用yt表示分别采用yt-1…yt-p表示采用c表示采用εt表示将公式(2)进行转化,得到公式(3)为:

19、yt=c+a1yt-1+…+apyt-p+εt  (3)

20、步骤5.6:使用最小二乘法,通过最小化残差平方和来确定参数,具体为:

21、步骤5.6.1:令z=yt,b=[1 yt-1 … yt-p],e=εt,对公式(3)进行转换,得到公式(4):

22、z=ba+e  (4)

23、步骤5.6.2:基于公式(4)构建最小二乘法估计的目标函数rss(a):

24、rss(a)=ete=(z-ba)t(z-ba)=ztz-2atbtz+atbtba    (5)

25、步骤5.6.3:对目标函数rss(a)求关于参数a的一阶导数,并令导数为0,得到a:

26、

27、步骤5.6.4:将公式(6)得到的代入公式(3)中,得到确定系数的var(p)的数学表达式,称之为当前var(p)模型;

28、步骤5.7:利用ar特征多项式的根对当前var(p)模型进行稳定性检验,若检验结果稳定,则当前var(p)模型是最优模型var(p*);若检验结果不稳定,则将当前平稳数据集作为当前数据集,按照步骤5.1的方法对当前数据集进行一次差分运算,得到更新后的数据集,然后将当前得到的更新后的数据集再次作为当前平稳数据集,重复步骤5.2~5.6,再次得到当前var(p)模型,然后再次利用ar特征多项式的根对当前得到的var(p)模型进行稳定性检验,若检验结果稳定,则确定当前得到的var(p)模型为最优模型var(p*),若检验结果不稳定,按照当前得到的var(1)模型到var(8)模型的优先级顺序,选择比当前var模型低一个优先级的var模型,重复步骤5.4~5.6,得到新的var(p)模型,利用ar特征多项式的根对新的var(p)模型进行检测,若检验结果稳定,则新的var(p)模型是最优模型var(p*),若检验结果不稳定,则继续选择比当前var模型低一个优先级的var模型,重复上述过程,若所有模型全部选择完毕仍然检验结果不稳定,则对当前平稳数据集中每个变量再次分别进行一次差分运算,得到更新后的平稳数据集,将当前得到的更新后的平稳数据集作为当前平稳数据集,重复步骤5.2~5.7,重复上述过程,直至确定最优模型var(p*),最优模型var(p*)如式(7)所示:

29、

30、其中,表示预测值,p*为最优模型var(p*)对应的滞后阶数;

31、步骤6:采用步骤5最后得到的平稳数据集中第t+1-p*个向量至第t个向量作为至yt-1对应代入公式(7),求解得到预测值

32、步骤7:判断t是否等于m,若t=m,则的第1个值即为当前预测时段的机场出租车需求量,否则,基于至yt-1的第1个值,对的第1个值进行m-t次反差分运算,此时得到的值为当前预测时段的机场出租车需求量。

33、与现有技术相比,本发明的优点在于通过分别获取出租车行程数据、网约车行程数据以及机场到港旅客数据,进而得到出租车出行量时间序列、网约车出行量时间序列以及机场到港旅客数量时间序列构成数据集,基于该数据集训练var模型,从而确定最优var模型,采用最优var模型进行预测,本发明在训练var模型之前,就明确区分了传统出租车和网约车两种服务模式,充分考虑了机场网约车服务对传统出租车需求的影响,摒弃获取难度大的数据,通过训练var模型,联合建模机场出租车出行量时间序列、机场网约车出行量时间序列和机场到港旅客数量时间序列这3个变量,不仅可以确立它们之间的动态关联性,还可以捕捉多个时间序列数据之间的线性依赖性和反馈效应,从而使得最优var模型预测准确度高,同时,出租车行程数据、网约车行程数据以及机场到港旅客数据均不涉及到旅客个人信息等,由此,本发明预测准确度高,且数据获取难度较低,易于实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1