基于LightGBM算法的城市旅游路线推荐方法及系统与流程

文档序号:31854692发布日期:2022-10-19 02:23阅读:388来源:国知局
基于LightGBM算法的城市旅游路线推荐方法及系统与流程
基于lightgbm算法的城市旅游路线推荐方法及系统
技术领域
1.本发明属于路线推荐技术领域,尤其涉及一种基于lightgbm算法的城市旅游路线推荐方法及系统。


背景技术:

2.目前基于记忆的推荐算法主要是用户历史数据读入内存,通过计算用户之间或物品之间的相似度进行推荐,但是对于大量的多源异构数据,此种方式存在需要对内容进行预处理、特征难以提取与推荐内容太多单一等问题。
3.发明人发现,在城市旅游路线推荐领域,基于网络模型的推荐方式还存在以下问题,由于数据数量增加、用户偏好和数据来源复杂化,传统推荐方法存在数据稀疏性、特征难提取与冷启动等常见问题,同时在数据学习方面,浅层模型的学习能力远不及深度学习强大;由于数据的敏感性,将城市数据与用户数据上传至云端进行集中式深度学习,在数据传输与汇总时具有隐私泄露的风险。


技术实现要素:

4.本发明为了解决上述问题,提出了一种基于lightgbm(light gradient boosting machine)算法的城市旅游路线推荐方法及系统,本发明基于深度学习算法lightgbm构建城市旅游路线推荐模型,可以在处理文本数据、图像数据等多源异构数据时学习其深层表征,有更好的性能提升;同时,应用联邦学习框架,在不上传数据的情况下进行多节点的联合训练,保障了数据的安全。
5.为了实现上述目的,本发明是通过如下的技术方案来实现:
6.第一方面,本发明提供了一种基于lightgbm算法的城市旅游路线推荐方法,包括:
7.获取城市数据及用户数据;
8.依据获取的城市数据及用户数据,以及预设的旅游路线推荐模型;得到旅游路线推荐结果;
9.其中,所述旅游路线推荐模型是基于lightgbm算法构建的;同时经过联邦学习框架进行全局模型的聚合,在不上传数据的情况下进行多节点的联合训练。
10.进一步的,基于lightgbm算法构建所述旅游路线推荐模型的过程为:获取待训练的城市数据及用户数据;将获取待训练的城市数据及用户数据转化为模型的训练数据;基于训练数据和lightgbm算法构建所述旅游路线推荐模型。
11.进一步的,所述城市数据至少包括城市地图数据和景点热度,所述用户数据至少包括用户旅游预算、人数、旅游时间和兴趣偏好。
12.进一步的,将获取待训练的城市数据及用户数据转化为模型的训练数据,包括:
13.采用z-score进行数据标准化处理,并进行缺失值填充;
14.采用embedded法进行特征选择,使用带惩罚项的基模型,得到各个特征的权值系数,根据系数从大到小选择特征;
15.进行数据降维。
16.进一步的,基于lightgbm构建模型,包括:
17.划分训练集与测试集,并采用k-折叠交叉验证划分训练;
18.确定学习率和估计器及其数目;
19.对决策树参数调参;
20.正则化参数;
21.降低学习率训练。
22.进一步的,经过联邦学习框架进行全局模型的聚合,包括:
23.子节点采用同态加密算法将模型参数加密上传;
24.基于联邦平均算法进行全局模型聚合。
25.进一步的,所述旅游路线推荐模型,基于多层感知机、自动编码器、卷积神经网络或循环神经网络构建。
26.第二方面,本发明还提供了一种基于lightgbm算法的城市旅游路线推荐系统,包括:
27.数据采集模块,被配置为:获取城市数据及用户数据;
28.路线推荐模块,被配置为:依据获取的城市数据及用户数据,以及预设的旅游路线推荐模型;得到旅游路线推荐结果;
29.其中,所述旅游路线推荐模型是基于lightgbm算法构建的;同时经过联邦学习框架进行全局模型的聚合,在不上传数据的情况下进行多节点的联合训练。
30.第三方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了第一方面所述的基于lightgbm算法的城市旅游路线推荐方法的步骤。
31.第四方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了第一方面所述的基于lightgbm算法的城市旅游路线推荐方法的步骤。
32.与现有技术相比,本发明的有益效果为:
33.本发明基于深度学习算法lightgbm构建城市旅游路线推荐模型,可以在处理文本数据、图像数据等多源异构数据时学习其深层表征,有更好的性能提升;同时,应用联邦学习框架,在不上传数据的情况下进行多节点的联合训练,保障了数据的安全。
附图说明
34.构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解,本实施例的示意性实施例及其说明用于解释本实施例,并不构成对本实施例的不当限定。
35.图1为本发明实施例1的流程图。
具体实施方式:
36.下面结合附图与实施例对本发明作进一步说明。
37.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常
理解的相同含义。
38.实施例1:
39.如图1所示,本实施例提供了一种基于lightgbm算法的城市旅游路线推荐方法,包括:
40.s1、通过多种出行、旅游app等数据源获取城市数据及用户数据,本实施例中,所述城市数据至少包括城市地图数据和景点热度,所述用户数据至少包括用户旅游预算、人数、旅游时间和兴趣偏好;
41.s2、通过特征工程将原始数据转化为模型的训练数据;
42.s3、各推荐服务器基于lightgbm算法构建本地旅游路线推荐模型;
43.s4、基于联邦学习框架进行全局模型的聚合;
44.s5、应用联邦学习全局模型进行旅游路线推荐。
45.lightgbm是一个梯度boosting框架,使用基于决策树的学习算法,其相对xgboost(extreme gradient boosting)具有训练速度快、内存占用低的特点。为了在不损害准确率的条件下加快gbdt模型的训练速度,lightgbm在传统的gbdt(gradient boosting decision tree)算法上进行了如下优化:基于histogram的决策树算法、单边梯度采样(减少大量只具有小梯度的数据实例以节省很多时间和空间开销)、互斥特征捆绑(将许多互斥的特征绑定为一个特征以实现降维)、带深度限制的leaf-wise的叶子生长策略(每次从当前所有叶子中找到分裂增益最大的一个叶子进行分裂,如此循环,以降低误差、得到更好的精度)等等。
46.联邦学习是一种分布式机器学习技术,可以参与方在不共享数据的情况下进行协作建模机器学习模型,能够在保护数据隐私的同时解决数据孤岛问题。其过程为:联邦学习的参与方初始化相同的模型,使用自己的数据进行模型训练;训练完成后,参与方上传其模型参数至中心节点,并在中心节点完成模型参数的聚合与更新;中心节点下发更新的模型至各参与方,进行多次迭代直至整个训练过程收敛。
47.本实施例中,应用深度学习技术,经过特征工程后基于lightgbm构建了城市旅游路线推荐模型,利用其非线性转换、深层特征学习的优势提升了城市旅游路线的推荐效果;同时,用户数据与城市数据具有一定的隐私性,在进行数据传输与集中式学习的过程中存在隐私泄露的风险,因此本实施例中,应用联邦学习框架,在不上传数据的情况下进行多节点的联合训练,在提升推荐模型训练效果的同时保障数据的安全。
48.本实施例步骤s2中,通过特征工程将原始数据转化为模型的训练数据,主要包括:
49.s2.1、采用z-score进行数据标准化处理,并进行k最邻近分类算法(k-nearestneighbor,knn)缺失值填充;
50.s2.2、采用embedded法进行特征选择,使用带惩罚项的基模型,得到各个特征的权值系数,根据系数从大到小选择特征;
51.s2.3、采用pca(principal component analysis)方法进行数据降维。
52.本实施例步骤s3中,基于lightgbm构建本地模型,主要包括:
53.s3.1、划分训练集与测试集,并采用k-折叠交叉验证划分训练;
54.s3.2、确定学习率和估计器及其数目;
55.s3.3、对决策树基本参数(max_depth、num_leaves、min_data_in_leaf、min_sum_
hessian_in_leaf、feature_fraction和bagging_fraction)调参;
56.s3.4、正则化参数;
57.s3.5、降低学习率训练以提高模型准确率。
58.本实施例步骤s4中,基于联邦学习框架进行全局模型的聚合,主要包括:
59.s4.1、子节点采用同态加密算法将模型参数加密上传至中央服务器;
60.s4.2、中央服务器基于联邦平均算法进行全局模型聚合;
61.s4.3、中央服务器下发全局模型。
62.本实施例中,由于采用深度学习技术对旅游路线推荐模型进行了构建,因此相较于传统的推荐算法可以学习到数据的深层特征,在处理文本数据、图像数据等多源异构数据时有更好的性能提升;同时,整体模型的训练采用联邦学习框架,在不共享城市数据与用户数据的条件下可以做到联合训练推荐模型,解决了该场景下的数据孤岛问题,有利于提升模型的训练效果。
63.在其他实施例中,还可以基于多层感知机、自动编码器、卷积神经网络与循环神经网络等等深度学习技术进行推荐模型的构建,并结合用户/物品相似度矩阵进行旅游路线的综合推荐;基于多层感知机、自动编码器、卷积神经网络与循环神经网络等等深度学习技术进行推荐模型的构建时,采用常规的模型训练方式,在此不再详述。
64.实施例2:
65.本实施例提供了一种基于lightgbm算法的城市旅游路线推荐系统,包括:
66.数据采集模块,被配置为:获取城市数据及用户数据;
67.路线推荐模块,被配置为:依据获取的城市数据及用户数据,以及预设的旅游路线推荐模型;得到旅游路线推荐结果;
68.其中,所述旅游路线推荐模型是基于lightgbm算法构建的;同时经过联邦学习框架进行全局模型的聚合,在不上传数据的情况下进行多节点的联合训练。
69.所述系统的工作方法与实施例1的基于lightgbm算法的城市旅游路线推荐方法相同,这里不再赘述。
70.实施例3:
71.本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了实施例1所述的基于lightgbm算法的城市旅游路线推荐方法的步骤。
72.实施例4:
73.本实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了实施例1所述的基于lightgbm算法的城市旅游路线推荐方法的步骤。
74.以上所述仅为本实施例的优选实施例而已,并不用于限制本实施例,对于本领域的技术人员来说,本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1