旅客目的地预测方法及系统的制作方法
【技术领域】
[0001] 本发明涉及航空领域的数据处理技术,尤其涉及一种旅客目的地预测方法及系 统。
【背景技术】
[0002] 随着航空市场的飞速发展,越来越多的旅客选择乘坐飞机出行,但对于旅客出行 目的地的预测技术目前在航空领域寥寥无几,其问题主要在于如果以小规模数据进行预 测,结果的准确度不尽如人意;而使用全市场民航旅客数据,计算时间过长,所需空间过大, 这些都是不可接受的。
[0003] 为了解决旅客目的地预测在计算时间与计算空间上的技术难题,需要一种能够应 用于航空领域的旅客目的地预测技术。
【发明内容】
[0004] 为解决现有存在的技术问题,本发明实施例提供一种旅客目的地预测方法及系 统。
[0005] 为达到上述目的,本发明实施例的技术方案是这样实现的:
[0006] -种旅客目的地预测方法,所述方法包括:
[0007] 根据旅客历史出行记录的多种特征向量,判断出行类型,得到包含出行类型信息 的旅客历史出行记录;
[0008] 对所述旅客历史出行记录进行目的区域整合,得到包含目的地区域信息的旅客历 史出行记录;
[0009] 根据所述出行类型,将所述旅客历史出行记录进行分类,并计算各分类的权重;
[0010] 对指定目的地的旅客历史出行记录进行统计归纳,得到各个目的地的指定出行概 率;
[0011]使用频繁模式树FPTree算法对随机目的地的旅客历史出行记录进行关联分析,得 到各个目的地与其他所有目的地之间的随机出行概率;
[0012]根据各个目的地的指定出行概率与随机出行概率、以及各分类的权重,进行权重 整合计算,得到旅客到各个目的地的出行概率,以基于所述出现概率预测旅客到各个目的 地的概率。
[0013]其中,在对所述旅客历史出行记录进行目的区域整合之前,所述方法还包括:将所 述旅客历史出行记录中的中转地以及常驻地去除,以去除所述旅客历史出行记录的噪音。
[0014] 其中,所述对所述旅客历史出行记录进行目的区域整合,包括:
[0015] 以旅客量越大分类越细致的原则对各个目的地机场进行整合细分,得到机场三字 码与目的地区域之间的映射列表;
[0016] 对于目的地为机场三字码的旅客历史出行记录,根据所述机场三字码与目的地区 域之间的映射列表,将机场三字码转换为目的地区域信息,得到包含目的地区域信息的旅 客历史出行记录。
[0017] 其中,根据所述出行类型,将所述旅客历史出行记录进行分类,并计算各分类的权 重,包括:
[0018] 根据所述出行类型,将所述旅客历史出行记录分为两类:指定目的地和随机目的 地;
[0019] 根据旅客不同分类的出行次数,确定各个分类的权重,得到指定目的地权重和随 机目的地权重。
[0020] 其中:所述出行类型为预先配置;所述出行类型与所述旅客历史出行记录分类之 间的关系为预先配置;根据所述出行类型,将所述旅客历史出行记录分为两类,为:基于预 先配置的出行类型与所述旅客历史出行记录分类之间的关系,将将所述旅客历史出行记录 分为两类。
[0021] 其中,所述使用频繁模式树FPTree算法对随机目的地的旅客历史出行记录进行关 联分析,包括:
[0022] 扫描当前旅客的事务数据库,计算每个目的地在所有旅客历史出行记录中出现的 频数,并删除频数小于预设的最小支持度的目的地,将剩余的所有目的地按照频数递减排 序,得到频繁项集;
[0023] 基于所述频繁项集,对当前旅客的每条旅客历史出行记录中各个目的地进行重新 排序;
[0024] 将重新排序得到的旅客历史出行记录插入FPTree,所述FPTree中一个节点表示一 个目的地,一条路径对应一条旅客历史出行记录,每条路径上节点的计数值表示支持度,所 述支持度用于确定任意两个目的地间的关联程度;
[0025]从所述FPTree找出频繁项,得到每个目的地二项之间的频繁项集合,所述频繁项 集合包括每个目的地与其他各个目的地之间的支持度;
[0026] 基于所述每个目的地二项之间的频繁项集合,得到每个目的地到其它各个目的地 的随机出行概率。
[0027] 其中,一个目的地到其它任意一个目的地的随机出行概率为:该目的地与其它任 意一个目的地之间的支持度与该目的地到各个目的地的支持度之和之间的比值。
[0028] -种旅客目的地预测系统,所述系统包括:出行类型判断模块、目的地整合模块、 历史记录分类模块、统计归纳模块、关联分析模块以及权重整合模块;其中,
[0029] 出行类型判断模块,用于根据旅客历史出行记录的多种特征向量,判断出行类型, 得到包含出行类型信息的旅客历史出行记录;
[0030] 目的地整合模块,用于对所述旅客历史出行记录进行目的区域整合,得到包含目 的地区域信息的旅客历史出行记录;
[0031] 历史记录分类模块,用于根据所述出行类型,将所述旅客历史出行记录进行分类, 并计算各分类的权重;
[0032] 统计归纳模块,用于对指定目的地的旅客历史出行记录进行统计归纳,得到各个 目的地的指定出行概率;
[0033]关联分析模块,用于使用频繁模式树FPTree算法对随机目的地的旅客历史出行记 录进行关联分析,得到各个目的地与其他所有目的地之间的随机出行概率;
[0034] 权重整合模块,用于根据各个目的地的指定出行概率与随机出行概率、以及各分 类的权重,进行权重整合计算,得到旅客到各个目的地的出行概率,以基于所述出现概率预 测旅客到各个目的地的概率。
[0035] 其中,所述系统还包括:历史记录筛选模块,用于在所述目的地整合模块对所述旅 客历史出行记录进行目的区域整合之前,将所述旅客历史出行记录中的中转地以及常驻地 去除,以去除所述旅客历史出行记录的噪音。
[0036] 其中,所述目的地整合模块,具体用于:以旅客量越大分类越细致的原则对各个目 的地机场进行整合细分,得到机场三字码与目的地区域之间的映射列表;对于目的地为机 场三字码的旅客历史出行记录,根据所述机场三字码与目的地区域之间的映射列表,将机 场三字码转换为目的地区域信息,得到包含目的地区域信息的旅客历史出行记录。
[0037] 其中,所述历史记录分类模块,具体用于:根据所述出行类型,将所述旅客历史出 行记录分为两类:指定目的地和随机目的地;根据旅客不同分类的出行次数,确定各个分类 的权重,得到指定目的地权重和随机目的地权重。
[0038] 其中,所述出行类型为预先配置;所述出行类型与所述旅客历史出行记录分类之 间的关系为预先配置;所述历史记录分类模块具体用于基于预先配置的出行类型与所述旅 客历史出行记录分类之间的关系,将将所述旅客历史出行记录分为两类。
[0039] 其中,所述关联分析模块具体用于:扫描当前旅客的事务数据库,计算每个目的地 在当前旅客所有旅客历史出行记录中出现的频数,并删除频数小于预设的最小支持度的目 的地,将剩余的所有目的地按照频数递减排序,得到频繁项集;基于所述频繁项集,对当前 旅客的每条旅客历史出行记录中各个目的地进行重新排序;将重新排序得到的旅客历史出 行记录插入FPTree,所述FPTree中一个节点表示一个目的地,一条路径对应一条旅客历史 出行记录,每条路径上节点的计数值表示支持度,所述支持度用于确定任意两个目的地间 的关联程度;从所述FPTree找出频繁项,得到每个目的地二项之间的频繁项集合,所述频繁 项集合包括每个目的地与其他各个目的地之间的支持度;基于所述每个目的地二项之间的 频繁项集合,得到每个目的地到其它各个目的地的随机出行概率。
[0040] 其中,一个目的地到其它任意一个目的地的随机出行概率为:该目的地与其它任 意一个目的地之间的支持度与该目的地到各个目的地的支持度之和之间的比值。
[0041] 本发明实施例将关联分析算法频繁模式树(FPTree,Frequent Pattern tree)与 旅客历史出行记录相结合,结合旅客出行目的划分,使用关联分析与统计归纳预测旅客出 行目的地,使得计算时间大幅减少,解决了旅客目的地预测在计算时间与计算空间上的技 术难题,为旅客级数据增加了新的元素。
[0042]本发明实施例具有以下优点:使用FPTree算法进行数据关联分析,大幅减少计算 时间。由于旅客级别数据在数据融合方面也有着得天独厚的条件,所有旅客级数据均可以 以旅客身份唯一标识进行数据融合,从而得到多维度的旅客个体信息,大而全的旅客数据 集保证了本发明实施例预测结果的准确性与实用性。
【附图说明】
[0043]在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相 似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而 非限制的方式大体示出了本文中所讨论的各个实施例。
[0044] 图1为本发明实施例旅客目的地预测方法的流程示意图;
[0045] 图2为本发明实施例旅客目的地预测方法具体实现过程的流程示意图;
[0046] 图3为本发明实施例旅客目的地预测系统的组成结构示意图;
[0047]图4~7为本发明实施例一示例中生成FP-Tree的示意图。
【具体实施方式】
[0048] 实施例一
[0049] 本发明实施例提供了一种旅客目的地预测方法,如图1所示,主要可以包括如下步 骤:
[0050] 步骤101:根据旅客历史出行记录的多种特征向量,判断出行类型,得到包含出行 类型信息的旅客历史出行记录;
[0051] 步骤102:对所述旅客历史出行记录进行目的区域整合,得到包含目的地区域信息 的旅客历史出行记录;
[0052] 步骤103:根据所述出行类型,将所述旅客历史出行记录进行