本发明属于数据分析技术领域,涉及一种基于游客画像及lbs数据的出游方案推荐算法。
背景技术:
手机的功能越来越强大,游客通过手机浏览旅游景点相关信息,查询其他游客的旅游经验和攻略,或者依靠商家推送的信息进行旅游的方式已经成为当前旅游的主要方式。
然而,这种旅游方式存在一些不足以及不够人性化的地方,比如:用户主动浏览旅游景点相关信息比较费时费力;其他游客的旅游经验和攻略由于行程、喜好不同,游客难以直接套用;推送的信息缺乏地位位置关联,即使游客感兴趣,也可能由于距离过远、路径不熟而放弃目标行程;营销信息主要是泛滥式地统一向用户推送,并没有很好的针对性,长期漫无目的地进行营销信息推送,会给针对性弱的用户造成浏览及消费疲劳,甚至会造成用户的流失。
技术实现要素:
本算法目的在于克服现有技术的不足,提供一种基于游客画像及lbs数据的出游方案推荐算法,通过游客特征建模,利用大数据分析对游客层次特征进行提取,实现在游客还没有产生较多行为的情况下,用相似游客群的行为偏好代替该游客行为偏好,进而将原来无法匹配到游客的消息,通过相似游客群匹配推送给该游客,有效地解决漫无目的地泛滥式地推送旅游信息的方式。
为解决上述技术问题,本算法采用如下的技术方案:一种基于游客画像及lbs数据的出游方案推荐算法,该算法包括依次进行的以下步骤:
s1:游客特征建模
游客特征建模步骤是构建包含游客特征的描述模型,游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征。
s2:基于大数据分析的游客特征提取
利用大数据分析技术对不同层次的游客特征进行提取,通过针对游客特征的计算机操作标注方式对其旅游中提供的旅游商品或旅游服务进行标注定义;利用爬虫网络方法在与旅游相关联的网站或者手机app的互联网消费记录和使用记录中搜索提取获得用户的游客特征,并与已标注定义的旅游商品或旅游服务相匹配。
s3:相似游客群建模
根据游客的基本属性特征,聚类出不同的相似游客群i,具有相同基本属性特征类的游客归属于同一相似游客群i;根据游客的基本消费行为特征聚类出不同的相似游客群j,具有相同基本消费行为特征类的游客归属于同一相似游客群j。
s4:游客与相似游客群之间的相似度计算
把游客和相似游客群i的基本属性特征采用计算机操作标注方式进行标注定义,获得游客x的基本属性特征与其相似游客群i的基本属性特征对应的向量,游客的特征向量与相似游客群的特征向量的维数相同。
采用以下公式计算游客x的基本属性特征与其相似游客群i的基本属性特征之间的相似度a:
s5:推送消息;
推送消息包括依次进行的以下步骤:
s5.1,消息和相似游客群的相似度计算
在已由多条消息构成的消息库中寻找包含与基本特征的关键词组相同词组的消息,将找到的消息中的词组进行标注定义,然后逐一将找到的消息与相似游客群的游客特征进行匹配并计算出相似度;
s5.2,推送相似度大于设定阈值的消息给对应的相似游客群
把相似度大于设定阈值的消息结合lbs优先推送方式推送给对应的相似游客群。
进一步地,在步骤s5中,所述结合lbs优先推送方式是:通过基于位置服务(locationbasedservice)方式,根据游客距离商家的相对位置关系选择距离近的商家优先推送。
进一步地,在步骤s5中,所述的游客特征包括基本特征和个性消费行为特征,个性消费行为特征是从基本特征中提取获得。
进一步地,在步骤s5中,游客对所述推送的消息响应后,系统将找到该消息中与个性消费行为特征相匹配的个性行为关键词,搜索消息库中具有该个性行为关键词的其他消息向对应的游客推送。
本发明与现有技术相比具有以下的有益效果:
本算法方案针对无目的的泛滥式的推送旅游信息的方式,通过游客特征建模,利用大数据分析对游客层次特征进行提取,实现在游客还没有产生较多行为的情况下,用相似游客群的行为偏好代替该游客行为偏好,进而将原来无法匹配到游客的消息,通过相似游客群匹配推送给该游客,有效地解决漫无目的地泛滥式地推送旅游信息的方式。
附图说明
图1是基于游客画像及lbs数据的出游方案推荐算法的算法流程图。
具体实施方式
下面结合附图及具体实施例对本发明进行更加详细与完整的说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。
参照图1,本发明的一种基于游客画像及lbs数据的出游方案推荐算法,该算法包括依次进行的以下步骤:
s1:游客特征建模
游客特征建模步骤是构建包含游客特征的描述模型,游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征,基本属性特征包括性别、年龄、职业、教育和收入,例如性别分为男女,年龄分为低龄人、青年、中年人和老龄人等;基本消费行为特征包括吃、住、行、游、购、娱六大类,例如:“吃”所涵盖的口味、环境、交通、服务、价格各自分类。
s2:基于大数据分析的游客特征提取
具体步骤:
⑴通过针对游客特征的计算机操作标注方式对其旅游中提供的旅游商品或旅游服务进行标注定义;
⑵利用爬虫网络方法在与旅游相关联的网站或者手机app的互联网消费记录和使用记录中搜索提取获得用户的游客特征,并与已标注定义的旅游商品或旅游服务相匹配。如根据其所有就餐过的餐厅的整体属性对其就餐偏好位置指数、环境指数、服务档次进行标记,根据其所点过的菜品属性,确定其基本的口味偏好特征,并进行标记;统计其所点菜品的频次,确定其个性偏好特征,并进行记录。
s3:相似游客群建模
根据游客的基本属性特征,聚类出不同的相似游客群i,具有相同基本属性特征类的游客归属于同一相似游客群i;例如分为青年人的相似游客群i和老年人的相似游客群i。所述不同的相似游客群i,包含所有游客基本属性性别、年龄、职业等的组合,即任何一个具有以上基本属性特征或部分属性特征的游客都可以找到所属的一个或多个相似游客群i。根据游客的基本消费行为特征聚类出不同的相似游客群j,具有相同基本消费行为特征类的游客归属于同一相似游客群j;例如分为吃辣的相似游客群i和吃咸的相似游客群i。所述不同的相似游客群j,包含所有游客基本消费行为特征的不同组合,即任何一个具有以上基本消费行为特征或部分基本消费行为特征的游客都可以找到所属的一个或多个相似游客群j。
s4:游客与相似游客群之间的相似度计算
把游客和相似游客群i的基本属性特征采用计算机操作标注方式进行标注定义,获得游客x的基本属性特征与其相似游客群i的基本属性特征对应的向量,游客的特征向量与相似游客群的特征向量的维数相同,具体采用以下表示:
[x1,x2,…,xm]
[y1,y2,…,ym]
其中,x1,x2,…xm分别表示游客的性别、年龄、…、收入,y1,y2,…,ym分别表示相似游客群i的性别、年龄、…、收入。由于得到用户的游客特征可能是部分的,不完整的,而相似游客群的游客特征是完整的,相似游客群具有的游客特征而游客没有的游客特征在上述进行标注定义的时候可用0代替。再采用以下公式计算游客x的基本属性特征与其相似游客群i的基本属性特征之间的相似度a:
当计算得到的相似度a等于1时,游客和该相似游客群i的基本属性特征完全相同;当计算得到的相似度a接近于1时,游客和该相似游客群i的基本属性特征相似。
s5:推送消息
推送消息包括依次进行的以下步骤:
1)消息和相似游客群的相似度计算
在已由多条消息构成的消息库中寻找包含与基本特征的关键词组相同词组的消息,将找到的消息中的词组进行标注定义,然后逐一将找到的消息与相似游客群的游客特征进行匹配并计算出相似度;
2)推送相似度大于设定阈值的消息给对应的相似游客群
把相似度大于设定阈值的消息结合lbs优先推送方式推送给对应的相似游客群。
所述结合lbs优先推送方式是:通过基于位置服务(locationbasedservice)方式,根据游客距离商家的相对位置关系选择距离近的商家优先推送。
所述的游客特征包括基本特征和个性消费行为特征,个性消费行为特征是从基本特征中提取获得。
游客对所述步骤⑵推送的消息响应后,系统将找到该消息中与个性消费行为特征相匹配的个性行为关键词,搜索消息库中具有该个性行为关键词的其他消息向对应的游客推送。
个性消费行为特征例如:对于游客所吃菜品的选点频率、菜品数量;对住的酒店楼层高度、朝向、房间类型(单人间、标准间、套房等)、房间条件(是否有电视机、wifi、电脑、浴缸/淋浴)等。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。