一种行李到达时间预测方法及装置与流程

文档序号:20782187发布日期:2020-05-19 21:21阅读:233来源:国知局
一种行李到达时间预测方法及装置与流程

本发明涉及信息处理技术领域,特别是涉及一种应用于民航机场的行李到达时间预测方法及装置。



背景技术:

伴随着航空领域的发展,越来越多的旅客选择乘坐飞机出行。当旅客乘坐飞机时,通常会携带个人行李,登机之前会统一办理行李托运。在旅客到达目的地机场之后,旅客会先于行李到达航站楼,行李会经过统一的托运流程被运送到指定行李转盘。现有机场旅客通常智能查询到其乘坐航班对应的行李转盘位置和行李转盘号码,无法获得行李到达行李转盘的时间,因此,旅客只能长时间逗留在行李转盘附近进行等待。增加了旅客在行李提取点的滞留时间,使得旅客体验效果较差。



技术实现要素:

针对于上述问题,本发明提供一种行李到达时间预测方法及装置,减少旅客在行李提取点的滞留时间,提升了旅客体验效果。

为了实现上述目的,本发明提供了如下技术方案:

一种行李到达时间预测方法,所述方法包括

采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;

根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;

将所述预计时间信息推送给与所述目标行李相对应的目标旅客。

可选地,所述方法还包括:

获得样本信息,所述样本信息表征所有当前航班到达时间段内与行李达到时间关联的数据信息;

确定所述样本信息的每条样本的标签,所述标签为与所述每条样本相匹配的行到达到行李转盘的时间;

根据所述样本信息以及所述样本信息的每条样本的标签进行模型训练,得到时间预测模型。

可选地,所述确定所述样本信息的每条样本点的标签,包括:

通过射频识别装置采集每条样本对应的行李到达行李装盘的时间。

可选地,所述获得样本信息,包括:

获取当前航班的特征数据;

获取与所述当前航班在同一时间序列上的前序航班数据;

根据所述当前航班的特征数据和与所述当前航班对应的前序航空数据生成单条样本信息;

将若干条样本信息进行组合,得到样本信息。

可选地,所述当前航班的特征数据包括下列数据的一种或多种:

航班起飞时间特征、航班实际达到时间段、航班计划达到时间段、航班延误时长、航班飞机型号、航班飞机承运行李数量、航班达到天气特征、航班到达温度特征、航班飞机停机位编号、航班对应的行李转盘编号、航班停机位置与行李转盘距离信息。

可选地,所述根据所述样本信息以及所述样本信息的每条样本的标签进行模型训练,得到时间预测模型,包括:

对所述样本信息进行特征提取,并对提取到的特征进行特征表示,得到目标特征信息;

通过lstm模型对所述目标特征信息和所述每条样本的标签进行训练,得到时间预测模型。

一种行李到达时间预测装置,所述装置包括:

信息采集单元,用于采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;

预测单元,用于根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;

推送单元,用于将所述预计时间信息推送给与所述目标行李相对应的目标旅客。

可选地,所述装置还包括:

样本获取单元,用于获得样本信息,所述样本信息表征所有当前航班到达时间段内与行李达到时间关联的数据信息;

标签确定单元,用于确定所述样本信息的每条样本的标签,所述标签为与所述每条样本相匹配的行到达到行李转盘的时间;

模型训练单元,用于根据所述样本信息以及所述样本信息的每条样本的标签进行模型训练,得到时间预测模型。

可选地,所述标签确定单元包括:

通过射频识别装置采集每条样本对应的行李到达行李装盘的时间;

所述样本获取单元包括:

第一获取子单元,用于获取当前航班的特征数据;

第二获取子单元,用于获取与所述当前航班在同一时间序列上的前序航班数据;

生成子单元,用于根据所述当前航班的特征数据和与所述当前航班对应的前序航空数据生成单条样本信息;

组合子单元,用于将若干条样本信息进行组合,得到样本信息;

所述当前航班的特征数据包括下列数据的一种或多种:

航班起飞时间特征、航班实际达到时间段、航班计划达到时间段、航班延误时长、航班飞机型号、航班飞机承运行李数量、航班达到天气特征、航班到达温度特征、航班飞机停机位编号、航班对应的行李转盘编号、航班停机位置与行李转盘距离信息。

可选地,所述模型训练单元包括:

特征提取子单元,用于对所述样本信息进行特征提取,并对提取到的特征进行特征表示,得到目标特征信息;

训练子单元,用于通过lstm模型对所述目标特征信息和所述每条样本的标签进行训练,得到时间预测模型。

相较于现有技术,本发明提供了一种行李到达时间预测方法及装置,通过采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;将所述预计时间信息推送给与所述目标行李相对应的目标旅客。在本发明中通过多维度数据即可以根据当前航班信息和前序航班信息组合建模,得到时间预测模型,使得该时间预测模型学习的信息量更大,表征能力更强,使得时间预测结果更准确。从而减少了旅客在行李提取点的滞留时间,提升了旅客体验效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种行李到达时间预测方法的流程示意图;

图2为本发明实施例提供的一种数据切分示意图;

图3为本发明实施例提供的一种行李到达时间预测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。

在本发明实施例中提供了一种行李到达时间预测方法,该方法应用于民航机场,其中行李到达是指行李到达行李盘或者指定的行李提取点。参见图1,该方法可以包括:

s101、采集目标行李所在航班的关联信息。

所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息。在本申请实施例中采集的信息不仅包括当前目标行李所在航班的数据信息,还包括时间序列上,对当前航班行李到达时间可能造成影响的m个前序航班集合。

s102、根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息。

时间预测模型时通过样本信息预先创建的,具有预测目标行李到达目标行李转盘的时间。对应的,在本申请实施例中还提供了一种模型创建方法,该方法还包括:

获得样本信息,所述样本信息表征所有当前航班到达时间段内与行李达到时间关联的数据信息;

确定所述样本信息的每条样本的标签,所述标签为与所述每条样本相匹配的行到达到行李转盘的时间;

根据所述样本信息以及所述样本信息的每条样本的标签进行模型训练,得到时间预测模型。

具体的,可以通过射频识别装置采集每条样本对应的行李到达行李装盘的时间。获得样本信息的过程为:获取当前航班的特征数据;获取与所述当前航班在同一时间序列上的前序航班数据;根据所述当前航班的特征数据和与所述当前航班对应的前序航空数据生成单条样本信息;将若干条样本信息进行组合,得到样本信息。所述当前航班的特征数据包括下列数据的一种或多种:航班起飞时间特征、航班实际达到时间段、航班计划达到时间段、航班延误时长、航班飞机型号、航班飞机承运行李数量、航班达到天气特征、航班到达温度特征、航班飞机停机位编号、航班对应的行李转盘编号、航班停机位置与行李转盘距离信息。

具体的,训练过程中训练数据的获取,利用实时的民航服务系统,获取到全天所有航班相关信息(包括所有当前航班到达时间段内对行李到达时间相关的各项数据信息)。通过基于rfid的硬件记录当天特定航班所携带行李到达行李转盘的时间,以此时间作为模型训练过程中的结果预测数据。基于当前航班的所有前序航班数据结合当前航班对应的各维度数据构建时间预测模型。使用lstm算法,使用当前航班对行李到达时间的影响因子集合,结合当前m条前序航班的影响因子集合,作为单条训练数据,使用当前航班行李预计到达时间作为标签数据,进行模型训练。使用当前航班相关数据结合所有前序航班数据对行当前航班李到达时间进行预测。

s103、将所述预计时间信息推送给与所述目标行李相对应的目标旅客。

例如,将当前航班的行李到达时间通过电子屏幕、手机短信或app消息等多种方式提前推送给旅客。

本发明提供了一种行李到达时间预测方法,通过采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;将所述预计时间信息推送给与所述目标行李相对应的目标旅客。在本发明中通过多维度数据即可以根据当前航班信息和前序航班信息组合建模,得到时间预测模型,使得该时间预测模型学习的信息量更大,表征能力更强,使得时间预测结果更准确。从而减少了旅客在行李提取点的滞留时间,提升了旅客体验效果。

下面对本申请创建的时间预测模型进行具体说明。

首先需要确定影响行李到达时间的特征信息。其主要包括两个维度,一个是当前航班相关的各项特征数据,另一个是时间序列上,对当前航班行李到达时间可能造成影响的m个前序航班集合。

当前航班相关的特征数据包括:是否是节假日(当天)、航班实际到达时间段、计划到达时间段、航班延误时长、承运飞机型号、承运飞机行李个数、飞机到达时天气(当天)、飞机到达时温度(当前时段)、承运飞机停机位编号、行李提取点转盘编号、停机位与行李转盘间距离。

前序航班相关的特征数据包括:当天按行李转盘编号进行区分,每个行李转盘上所服务的当天所有航班信息集合、及所有航班相关数据特征集合(参见上述当前航班相关的特征数据的描述,在此不进行赘述)。

例如:航班号ca1234【是否是节假日(当天)、航班实际到达时间段、计划到达时间段、航班延误时长、承运飞机型号、承运飞机行李个数、飞机到达时天气(当天)、飞机到达时温度(当前时段)、承运飞机停机位编号、行李提取点转盘编号、停机位与行李转盘间距离】、航班号ca6181【是否是节假日、航班实际到达时间、预计到达时间、承运飞机型号、承运飞机行李个数、飞机到达时天气、飞机到达时温度、飞机停车位编号、行李提取转盘编号、停机位到行李转盘距离】。统计m条。

单条训练数据生成规则,以行李转盘为主键,获取当前行李转盘所有历史航班的相关特征数据。

假设当前行李转盘共产生了n个航班的相关行李特征记录,从第一条开始进行数据开始使用m为数据切分窗口大小,使用步长t对n个航班记录进行移动切分。参见图2,其示出了本申请实施例提供的一种数据切分示意图。使用上述方法,对所有历史数据进行切分,生成训练数据。图2中每个方格代表当前行李转盘上到达的一个航班数据(当前航班相关对行李到达时间有可能产生影响的特征数据)。

使用行李分隔牌,当前行李分割牌用于表示当前传送带所装载的航班号标识,提醒用户领取行李,同时行李分割牌内置rfid电子标签。行李转盘出口设置rfid读卡器,记录当所有行李转盘输出的特定航班的行李到达时间(到达行李转盘入口)。用于预测模型训练用的目标预测值。

构建衍生变量即可能对行李到达时间造成影响的变量因素。

是否是节假日,将全年的节假日进行预设。例如,当天使用0来代表不是节假日,使用1代表当天是节假日,可对当天节假日信息进行权重设置,比如普通周末的权重为0.4,十一的权重为0.7,月一日且为周末的权重为0.8。

航班实际到达时间段:将航班实际到达时间映射到晨间、日间和夜间三个时段。晨间(5:01-9:00)、日间(9:01-20:00)、夜间(20:01-5:00)。

航班计划到达时段,同“航班实际到达时间段”。

航班延误时长,飞机延误时长=飞机实际到达实际-飞机计划到达时间(单位:分钟)。结果为数值类型,使用数值类型进行统一处理。

承运飞机型号,使用one-hot型向量进行编码表示。

承运飞机行李个数,行李托运系统可以获取当前飞机行李数量信息。使用数值类型变量变换表示。

飞机到达时天气,通过天气预报查询接口可获得该部分数据。包括“晴”、“小雨”、“中雨”、“大雨”、“暴雨”、“小雪”、“中雪”、“大雪”、”、“台风”等描述天气字段。同“承运飞机型号”,使用one-hot型向量形式表示。

飞机到达时温度,数据来源同上,使用数值类型变量变换表示。

承运飞机停车位编号,机场数据系统可以获得,使用one-hot型向量进行编码表示。

行李提取点转盘编号,行李托运系统获得,使用one-hot型向量进行编码表示。

停机位与行李转盘间距离,行李转盘位置用机场航站楼行李车入口位置进行表示。即停机位与行李转盘位置实际使用停机位到各个航站楼货运口之间距离来表示,该部分数据在机场信息的知识图谱种可直接查询获取,数据来源为之前机场制作室内导航时候所整理、记录数据。使用数值类型变换转换。

数值类型变量变换表示,使用min-max进行归一化处理:将数值范围缩放到(0,1),并不改变数据分布;这种算法是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:

x=(x-min)/(max-min)

max:样本数据的最大值,min:为样本数据的最小值。

在本专利数值变量转换过程中使用经验常量值来替代max和min。使用历史30天同类数据,使用95%置信区间内的两侧边界值作为分别作为最大最小值。取出30天所有同类数据,求得其均值和方差,使用均值和方差和95%置信区间,可以获得数据范围。

使用one-hot型向量进行编码表示,one-hot的基本思想:将离散型特征的每一种取值都看成一种状态,若你的这一特征中有n个不相同的取值,那么我们就可以将该特征抽象成n种不同的状态,one-hot编码保证了每一个取值只会使得一种状态处于“激活态”,也就是说这n种状态中只有一个状态位值为1,其他状态位都是0。比如机场全部飞机型号共计5(d)种,包括717、737、747、757、767,可使用5(d)维度数据进行标识,比如717用[10000]表示,737用[010000]表示。

本发明实施例要预测旅客行李到达行李转盘时间,当前行李到达时间除了依赖当前航班所处环境各种特征因素影响,还会收到其前序航班的行李到达时间的影响,整个过程时间维度上顺序执行,在此过程上,预测某一个航班的行李到达时间可以理解为一个典型的基于时间序列的预测过程。模型采用lstm算法进行预测。

lstm模型结构包括1个输入层(输入维度由航班相关行李特征数据维度决定)、1全连接输出层。

损失函数(lossfunction)使用均方误差(mse),优化算法(optimizer)使用adam,批大小(batch_size)设置64,学习率设置为0.001,dropout设置为0.2,采用随机梯度下降法更新模型权值。经过超参数优化后,将模型应用于测试集上,若预测偏差值在要求范围内,保存该模型。

获取当前航班经过特征工程处理后的数据及当前航班前序m个航班的处理后数据,输入预测模型,对当前航班的行李到达行李提取点的行李转盘时间进行预测。

在本申请实施例中使用lstm深度学习框架进行时间序列预测,与传统机器学习算法比较预测的准确度更高、对噪声神经有较强的鲁棒性和容错能力,动态神经网络lstm比静态神经网络bp网络更适合预测时间序列。应用了当前航班相关的各项特征信息和前序航班的历史特征信息进行组合建模,建模过程中使用的信息量更大,模型的表征能力更强。使用lstm且步长设置为1,大大增加了训练数据样本数量。应用m个前序航班得时间窗口来制作测试数据一方面也增加了训练样本数量,另一方面提升了训练效率,避免使用一天全量数据训练,而且时间没有按天被分割,时间维度上数据表示是连续的(比如预测凌晨1点10分的航班的行李到达时间,可以使用前一天一定时间窗口内的数据进行预测)。使用监督学习,可通过使用系统上线后的真实数据不断地丰富训练数据样本库,不断地调整优化现有模型,提高模型预测能力。本申请实施例获取标签数据使用带有rfid的行李分割牌来进行提取,通过系统对该部分数据进行统一记录、识别精准、不存在遮挡问题(先对于数字牌的图像识别)、识别有效空间大、试用期间维护成本低、全程自动化完成,最小化人工干预。

下面对lstm深度学习框架进行说明。

lstm则会以非常精确的方式改变记忆,应用专门的学习机制来记住、更新、聚焦于信息。这有助于在更长的时期内跟踪信息。在循环神经网络(rnn)模型与前向反向传播算法中,由于rnn也有梯度消失的问题,因此很难处理长序列的数据,对rnn做改进,得到了rnn的特例lstm(longshort-termmemory),它可以避免常规rnn的梯度消失。lstm模型在每个序列索引位置t时刻的内部结构如下:在每个序列索引位置t时刻向前传播的除了和rnn一样的隐藏状态h(t)h(t),还多了另一个隐藏状态。这个隐藏状态我们一般称为细胞状态(cellstate),记为c(t)c(t)。除了细胞状态,lstm还有称之为门控结构(gate)。lstm在在每个序列索引位置t的门一般包括遗忘门,输入门和输出门三种。

下面对lstm的遗忘门,输入门和输出门以及细胞状态进行具体说明。

遗忘门(forgetgate)顾名思义,是控制是否遗忘的,在lstm中即以一定的概率控制是否遗忘上一层的隐藏细胞状态。遗忘门子结构输入的有上一序列的隐藏状态h(t-1)h(t-1)和本序列数据x(t)x(t),通过一个激活函数,一般是sigmoid,得到遗忘门的输出f(t)f(t)。由于sigmoid的输出f(t)f(t)在[0,1]之间,因此这里的输出f^{(t)}代表了遗忘上一层隐藏细胞状态的概率。用数学表达式即为:

f(t)=σ(wfh(t-1)+ufx(t)+bf)f(t)=σ(wfh(t-1)+ufx(t)+bf)

其中wf,uf,bfwf,uf,bf为线性关系的系数和偏倚,和rnn中的类似。σσ为sigmoid激活函数。

输入门(inputgate)负责处理当前序列位置的输入,输入门由两部分组成,第一部分使用了sigmoid激活函数,输出为i(t)i(t),第二部分使用了tanh激活函数,输出为a(t)a(t),两者的结果后面会相乘再去更新细胞状态。用数学表达式即为:

i(t)=σ(wih(t-1)+uix(t)+bi)i(t)=σ(wih(t-1)+uix(t)+bi)

a(t)=tanh(wah(t-1)+uax(t)+ba)a(t)=tanh(wah(t-1)+uax(t)+ba)

其中wi,ui,bi,wa,ua,ba,wi,ui,bi,wa,ua,ba,为线性关系的系数和偏倚,和rnn中的类似。σσ为sigmoid激活函数。

lstm之细胞状态。前面的遗忘门和输入门的结果都会作用于细胞状态c(t)c(t)。下面介绍如何从细胞状态c(t-1)c(t-1)如何得到c(t)c(t)。

细胞状态c(t)c(t)由两部分组成,第一部分是c(t-1)c(t-1)和遗忘门输出f(t)f(t)的乘积,第二部分是输入门的i(t)i(t)和a(t)a(t)的乘积,即:

c(t)=c(t-1)⊙f(t)+i(t)⊙a(t)c(t)=c(t-1)⊙f(t)+i(t)⊙a(t)其中,⊙⊙为hadamard积,在dnn中也用到过。

输出们结构如下:

隐藏状态h(t)h(t)的更新由两部分组成,第一部分是o(t)o(t),它由上一序列的隐藏状态h(t-1)h(t-1)和本序列数据x(t)x(t),以及激活函数sigmoid得到,第二部分由隐藏状态c(t)c(t)和tanh激活函数组成,即:

o(t)=σ(woh(t-1)+uox(t)+bo)o(t)=σ(woh(t-1)+uox(t)+bo)

h(t)=o(t)⊙tanh(c(t))h(t)=o(t)⊙tanh(c(t))

在本申请实施例提供了一种行李到达时间预测装置,参见图3,所述装置包括:

信息采集单元10,用于采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;

预测单元20,用于根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;

推送单元30,用于将所述预计时间信息推送给与所述目标行李相对应的目标旅客。

在上述实施例的基础上,所述装置还包括:

样本获取单元,用于获得样本信息,所述样本信息表征所有当前航班到达时间段内与行李达到时间关联的数据信息;

标签确定单元,用于确定所述样本信息的每条样本的标签,所述标签为与所述每条样本相匹配的行到达到行李转盘的时间;

模型训练单元,用于根据所述样本信息以及所述样本信息的每条样本的标签进行模型训练,得到时间预测模型。

在上述实施例的基础上,所述标签确定单元包括:

通过射频识别装置采集每条样本对应的行李到达行李装盘的时间;

所述样本获取单元包括:

第一获取子单元,用于获取当前航班的特征数据;

第二获取子单元,用于获取与所述当前航班在同一时间序列上的前序航班数据;

生成子单元,用于根据所述当前航班的特征数据和与所述当前航班对应的前序航空数据生成单条样本信息;

组合子单元,用于将若干条样本信息进行组合,得到样本信息;

所述当前航班的特征数据包括下列数据的一种或多种:

航班起飞时间特征、航班实际达到时间段、航班计划达到时间段、航班延误时长、航班飞机型号、航班飞机承运行李数量、航班达到天气特征、航班到达温度特征、航班飞机停机位编号、航班对应的行李转盘编号、航班停机位置与行李转盘距离信息。

在上述实施例的基础上,所述模型训练单元包括:

特征提取子单元,用于对所述样本信息进行特征提取,并对提取到的特征进行特征表示,得到目标特征信息;

训练子单元,用于通过lstm模型对所述目标特征信息和所述每条样本的标签进行训练,得到时间预测模型。

本发明提供了一种行李到达时间预测、装置,通过采集目标行李所在航班的关联信息,所述关联信息至少包括所述所在航班数据以及与所述所在航班对应的前序航班信息;根据所述所在航班的关联信息和预先创建的时间预测模型,预测得到所述目标行李达到目标行李转盘的预计时间信息;将所述预计时间信息推送给与所述目标行李相对应的目标旅客。在本发明中通过多维度数据即可以根据当前航班信息和前序航班信息组合建模,得到时间预测模型,使得该时间预测模型学习的信息量更大,表征能力更强,使得时间预测结果更准确。从而减少了旅客在行李提取点的滞留时间,提升了旅客体验效果。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1