本发明涉及一种民航旅客画像方法,特别是一种融合离散选择模型与知识图谱的民航旅客画像方法。
背景技术:
1、随着经济的高速发展,人们对民航机场的服务需求趋于多元化,过去旅客对机场服务需求只限于简单的乘机和候机手续,而现在航站楼旅客需求还包括购物、餐饮、娱乐等非航服务,如何实现对旅客需求的多维感知是现在民航业的普遍难点,而需求多维感知的关键在于全面提取旅客的异质性需求特征,旅客画像作为一种刻画旅客特征的常用工具,能将旅客信息抽象为各类标签,并利用标签将旅客形象具体化,从而提供针对性服务。
2、现有的旅客画像研究主要通过离散选择模型推理旅客行为概率,并基于推理结果刻画民航旅客群体画像,该模型应用广泛,在旅客行为决策方面具有较强的解释性,但其基于最大效用理论,假设旅客的选择是完全理性的,忽略了民航旅客个体的异质性,难以切实聚焦到每位旅客的个性化需求,也很难支撑大规模旅客需求数据的存储要求。
3、基于上述问题,亟需找到一类新的方法,能够在融合离散选择模型强解释性的前提下,感知旅客在变动机场环境下的多维需求,在保证对大规模数据的强大存储能力的同时,能够链接环境和旅客,进一步感知旅客画像。
技术实现思路
1、发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种融合离散选择模型与知识图谱的民航旅客画像方法。
2、为了解决上述技术问题,本发明公开了一种融合离散选择模型与知识图谱的民航旅客画像方法,具体步骤包括:
3、步骤1,确定民航旅客画像领域的实体和关系,通过自顶而下的方式构建民航旅客画像图谱的知识本体;
4、步骤2,设计一类航站楼虚拟候机实验系统,在模拟虚拟航站楼地理环境和候机情境的同时,采集旅客基础属性信息、历史出行信息、出行偏好信息和机场内的活动轨迹信息;
5、步骤3,基于离散选择模型对民航旅客需求进行参数标定和分析,并形成初步的选择概率标注;
6、步骤4,处理步骤2中采集得到的旅客基础属性信息、历史出行信息、出行偏好信息和机场内的活动轨迹信息,并构建可视化民航旅客画像知识图谱;
7、步骤5,使用查询语言对步骤4中构建的民航旅客画像知识图谱进行查询和分析,并基于知识图谱技术刻画并分析民航旅客的个体画像及群体画像。
8、进一步的,步骤1中所述通过自顶而下的方式构建民航旅客画像图谱的知识本体,具体包括:
9、设计一级本体框架,包括:旅客基础属性、情境和机场环境;
10、设计二级本体,包括:
11、旅客基础属性的二级本体,包括:社会人口统计特征、出行特征、出行偏好特征和活动链信息,基于旅客基础属性的二级本体往下细分属性实体,至少包括:年龄、性别、职业、收入、职位、饮食偏好和购物偏好;
12、机场环境的二级本体,包括:栅格和活动点,基于机场环境的二级本体往下细分属性实体,至少包括:栅格坐标、栅格间距、活动点属性、店铺品牌和店铺类型;
13、情境的二级本体,包括:随行人员属性、航班类型、航班起飞时刻、出行目的、候机时长和托运行李数。
14、进一步的,步骤2中所述设计一类航站楼虚拟候机实验系统,具体包括:
15、设计意向调研问卷,用于记录旅客的基础属性信息、历史出行信息和历史偏好信息;
16、设计虚拟航站楼旅客候机实验,包括虚拟机场环境设计和随机情境实验设计;基于行为调研的虚拟候机实验,给旅客随机分配虚拟情境信息和机场环境,采集变动机场环境下旅客的活动轨迹信息。
17、进一步的,步骤3中所述基于离散选择模型对民航旅客需求进行参数标定和具体分析,并形成初步的选择概率标注,具体包括:
18、假设旅客n面对的机场内店铺类型的可选择集合为j(i∈j),旅客n选择店铺类型i的效用函数表示为:
19、
20、其中,uin表示旅客n选择机场店铺类型i的效用;vin表示旅客n选择店铺类型i的可观测效用;εin表示旅客n选择店铺类型i的随机效用;
21、旅客n选择店铺类型i的概率pin表示为:
22、pin=prob(uin>ujn;i≠j,j∈j)
23、其中,prob表示旅客行为选择的概率函数,uin表示旅客n选择机场店铺类型i的效用,ujn表示旅客n选择机场店铺类型j的效用,j表示店铺类型且:
24、0≤pin≤1
25、即得到:
26、
27、其中,φ()表示标准正态分布的累积分布函数,σ表示方差值,εjn表示旅客n选择店铺类型j的随机效用,vjn表示旅客n选择店铺类型j的可观测效用,将得到的概率pin作为选择概率对旅客进行标注。
28、进一步的,步骤4中所述的构建可视化民航旅客画像知识图谱,具体包括:
29、步骤4-1,分段标注步骤2中采集到的旅客的机场内的活动轨迹信息;
30、步骤4-2,将步骤2中采集到的旅客基础属性信息、历史出行信息、出行偏好信息和机场内的活动轨迹信息,构建为<实体,关系,实体>或<实体,属性,属性值>的三元组形式;
31、步骤4-3,将上述三元组形式的数据集导入存储,并使用可视化工具构建可视化民航旅客画像知识图谱。
32、进一步的,步骤5中所述的基于知识图谱技术刻画并分析民航旅客的个体画像及群体画像,具体包括:
33、步骤5-1,为每位旅客在知识图谱中创建一个节点,包含该旅客的基础属性特征、历史出行特征、出行偏好特征和机场内的活动轨迹特征;
34、步骤5-2,定义实体间的关系类型,并为每种关系指定属性;
35、步骤5-3,通过数据挖掘技术,分析旅客群体的共同特征和行为趋势,并识别旅客群体中的关键影响因素;
36、步骤5-4,利用高级查询语言,进行数据查询和模式识别,并分析旅客行为和偏好之间的关联,以及对旅行决策的影响;
37、步骤5-5,使用图形可视化工具提取旅客个体和群体的画像标签。
38、进一步的,步骤5-5中所述使用图形可视化工具提取旅客个体和群体的画像标签,具体包括:
39、从同一旅客在不同机场环境下的选择行为提取旅客个体画像标签,并对旅客个体画像进行可视化分析;
40、从具有相似属性的旅客在同一机场环境下的选择行为提取旅客个体画像标签,并对旅客个体画像进行可视化分析;
41、从不同类型的店铺角度分析群体旅客的分布态势,提取民航旅客的群体画像标签,并可视化分析旅客群体画像;
42、从旅客偏好角度分析群体旅客的分布态势,提取民航旅客的群体画像标签,并可视化分析旅客群体画像。
43、进一步的,步骤2中所述的采集旅客的基础属性信息、历史出行信息、出行偏好信息和机场内的活动轨迹信息,具体包括:
44、旅客的基础属性信息采集,至少包括:性别、年龄、年可支配收入、单位类型、职务和受教育水平;
45、旅客的历史出行数据采集,至少包括:旅客类型、民航出行次数、出行费用占比、机票舱位等级和是否需要民航特殊服务;
46、旅客的出行偏好数据采集,至少包括:购物偏好、用餐偏好、饮品偏好和办公区域偏好;其中,上述偏好即为不同的店铺类型;
47、旅客的机场内的活动轨迹数据采集,至少包括:活动点、活动路线和活动时长;
48、进一步的,步骤2中,
49、所述意向调研问卷设计,具体包括:旅客的基本属性信息采集、旅客的历史出行数据采集和旅客的历史偏好数据采集;
50、所述虚拟机场环境设计,具体包括:
51、按照值机柜台布设规则设计虚拟机场环境下的值机柜台,具体包括:确定值机岛的占地面积,包含值机岛本身大小和周边的排队区宽度;确定值机岛的布设位置,即确定值机柜台前后流通区宽度;确定值机岛的布设方式,包括值机岛的布设方式可分为集中布设和分散布设;
52、按照自助值机布设规则设计虚拟环境下的自助值机具体包括:确定自助值机的占地面积,包含自助值机本身大小和周边的排队区宽度;确定自助值机的布设位置,即确定自助值机柜台前后流通区宽度;确定自助值机的布设方式,包括自助值机的布设方式可分为集中布设和分散布设;按照安检口布设规则分别按照集中布设/分散布设分别设计安检口的位置和布局;按照国内外大型枢纽机场商业业态配比和现有大型机场店铺数量,按照集中布设/分散布设分别设计非功能区的布局;
53、基于栅格标号法设计虚拟航站楼地图的底图规则,通过为所述地图的每一个单元栅格赋序列值,以此来使所有单元栅格序列化,具体包括:
54、假设全局二维环境水平方向的长度xmax,水平竖直方向上的长度为ymax,每个单元栅格的边长为a,不满一个单元栅格时按一个单元栅格进行处理,由此将二维地理环境划分为一系列的单元栅格,得到二维栅格环境模型,单元栅格的总数可表示为:
55、
56、其中,nx为单元栅格列数,ny为单元栅格行数,ceil为向上取整运算;
57、对每一个单元栅格进行赋值,若第i个单元栅格为障碍栅格,则对障碍栅格ni赋值为1;若第j个单元栅格为自由栅格,则对自由栅格nj赋值为0;
58、在二维栅格环境模型上创建直角坐标系,以该二维栅格环境模型的左上角为坐标原点o,以环境模型的水平方向为x轴,以环境模型的竖直方向为y轴,并令两坐标轴的单元长度均与单元栅格的边长成整倍数关系假设序列集为:c={1,2,3,…,u,u∈n},若m代表序列号,m∈c,然后对每一个栅格从上到下从左到右依次赋序列值m;在直角坐标系中,直角坐标法与序号法相互对应,直角坐标法中每个单元栅格的坐标位置(xm,ym),均由序列号m来确定,具体如下:
59、xm=(m-1)modnx+1
60、
61、其中,mod为求余运算,int为向下取整运算,xm为m时的横坐标,ym为序号为m时的纵坐标;
62、在标定地图上的栅格后,依据布设规则,设置每个设施的占用栅格编号;对栅格属性进行编辑,至少包括占用时间、颜色、突变和是否可点击;
63、使用绘制工具为地图绘制路网;
64、所述随机情境实验设计,具体包括:
65、选定候机情境因素,至少包括:航班类型、出行目的、候机时长、托运行李数量、随行人员和航班时刻,并为其标定相应水平。
66、进一步的,步骤4-1中所述分段标注采集到的旅客的机场内的活动轨迹信息,具体包括:
67、步骤4-1-1,将旅客活动轨迹按时间顺序分段,每段代表机场旅客的不同活动阶段;将旅客活动轨迹按活动点分段,并标注每段的活动序列、活动路程和活动类型;
68、步骤4-1-2,将采集到的旅客的基础属性信息、历史出行信息、出行偏好信息和机场内的活动轨迹信息处理为三元组形式,具体包括:
69、根据步骤3中标注的选择概率,作为旅客选择的概率属性,处理为<旅客,选择概率,概率值>的三元组形式;
70、将机场环境内活动点的距离、类型和物品价格,作为活动点属性,处理为<活动点,属性,属性值>的三元组形式;
71、链接活动点和店铺类型的关系,处理为<活动点,属于,店铺类型>的三元组形式;将旅客的活动轨迹分段处理为<旅客,选择,活动点>的三元组形式;将旅客的基础属性、出行偏好信息标注为旅客的个人属性,处理为<旅客,属性类型,属性水平>的三元组形式。
72、有益效果:
73、本发明通过提出一种基于知识图谱的民航旅客画像刻画方法,在存储大规模民航旅客画像数据的同时,融合了离散选择模型和知识图谱技术,在具备对民航旅客行为决策的强解释性的同时能够链接机场环境和旅客个体,精准感知民航旅客需求,并全面刻画民航旅客的个体画像和群体画像。
74、该方法相比于传统的民航旅客画像刻画方法,在同样具备强解释性的基础上,还具备丰富的实体和关系,如旅客、机场、航班、时间等,以及它们之间的复杂关系,有助于从多维度观察民航旅客需求画像,识别更多的信息,更精准全面刻画旅客特征。
75、该方法可以存储和处理大规模的数据,包括结构化数据、半结构化数据和非结构化数据,能够更全面采集和处理民航旅客画像的多维信息。
76、该方法支持使用查询语言进行查询和分析,也支持可视化分析和探索,在直观展示民航旅客画像信息的同时能够灵活方便地查询和分析民航旅客画像。