本公开涉及计算机,尤其涉及用于行为稀疏场景的推荐模型训练方法、推荐方法及装置。
背景技术:
1、在当前线上购房、租房的渗透率逐渐升高的背景下,关于购房/租房的推广应用(application,简称“app”)也越来越多。对于一款新上线的推广app而言,新用户的占比较高,需要制定有效的冷启动策略;其次,在一些用户线上行为稀疏的场景下,由于用户线上行为稀疏,样本量不足,推荐效果往往难以达到预期。
2、为解决上述技术问题,现有的技术方案中的推荐算法模型大多都依赖于用户画像和商品属性,这对于存在大量离散特征的数据集有较好的表现。但是,由于人们对于隐私的保护意识越来越强,用户画像的获取越来越困难,这使得目前的推荐算法模型的推荐效果难以达到预期。此外,在用户线上行为稀疏的场景下,商品属性随时间的变化较大,而现有的推荐算法模型大多对计算能力的要求较高,模型复杂,这就导致了模型的训练阶段容易发生过拟合,且若训练集与线上数据集的时间差别大,模型的准确率衰减速度快。
3、可见,针对用户线上行为稀疏的场景,现有的推荐算法模型的推荐效果难达预期,且对算力要求较高,模型复杂,模型容易在训练阶段发生过拟合,同时模型的准确率衰减速度快。
技术实现思路
1、有鉴于此,本公开实施例提供了用于线上行为稀疏场景下的推荐模型训练方法和推荐方法,以解决针对用户线上行为稀疏的场景,现有的推荐算法模型的推荐效果难达预期,且对算力要求较高,模型复杂,模型容易在训练阶段发生过拟合,同时模型的准确率衰减速度快的问题。
2、本公开实施例的第一方面,提供了一种用于行为稀疏场景的推荐模型训练方法,包括:
3、确定目标推荐商品;
4、通过线上推荐应用向用户推荐目标推荐商品,并采集用户使用线上推荐应用时产生的与目标推荐商品关联的用户行为数据集;
5、按照预设的数据集划分策略,将用户行为数据集划分为训练数据集、验证数据集和测试数据集;
6、对训练数据集中的训练样本数据进行样本筛选和特征工程处理,得到目标训练数据集;
7、使用目标训练数据集对初始推荐模型进行训练,直至达到预设的迭代停止条件,获得目标推荐模型。
8、本公开实施例的第二方面,提供了一种用于行为稀疏场景的推荐方法,包括:
9、获取用户历史行为数据;
10、将用户历史行为数据输入目标推荐模型中,输出商品推荐结果,商品推荐结果包括推荐商品及其对应的用户意愿强度评分,目标推荐模型是由第一方面的推荐模型训练方法训练得到的。
11、本公开实施例的第三方面,提供了一种用于行为稀疏场景的推荐模型训练装置,包括:
12、确定模块,被配置为确定目标推荐商品;
13、采集模块,被配置为通过线上推荐应用向用户推荐目标推荐商品,并采集用户使用线上推荐应用时产生的与目标推荐商品关联的用户行为数据集;
14、划分模块,被配置为按照预设的数据集划分策略,将用户行为数据集划分为训练数据集、验证数据集和测试数据集;
15、处理模块,被配置为对训练数据集中的训练样本数据进行样本筛选和特征工程处理,得到目标训练数据集;
16、训练模块,被配置为使用目标训练数据集对初始推荐模型进行训练,直至达到预设的迭代停止条件,获得目标推荐模型。
17、本公开实施例的第四方面,提供了一种用于行为稀疏场景的推荐装置,包括:
18、获取模块,被配置为获取用户历史行为数据;
19、推荐模块,被配置为将用户历史行为数据输入目标推荐模型中,输出商品推荐结果,商品推荐结果包括推荐商品及其对应的用户意愿强度评分,目标推荐模型是由第一方面的推荐模型训练方法训练得到的。
20、本公开实施例的第五方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述第一方面的方法的步骤,或者实现上述第二方面的方法的步骤。
21、本公开实施例的第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面的方法的步骤,或者实现上述第二方面的方法的步骤。
22、本公开实施例与现有技术相比,其有益效果至少包括:通过确定目标推荐商品;通过线上推荐应用向用户推荐目标推荐商品,并采集用户使用线上推荐应用时产生的与目标推荐商品关联的用户行为数据集;按照预设的数据集划分策略,将用户行为数据集划分为训练数据集、验证数据集和测试数据集;对训练数据集中的训练样本数据进行样本筛选和特征工程处理,得到目标训练数据集;使用目标训练数据集对初始推荐模型进行训练,直至达到预设的迭代停止条件,获得目标推荐模型。通过上述方式可有效解决模型在训练阶段容易发生过拟合及模型衰减速度快的问题,同时获得的目标推荐模型的在用户线上行为稀疏的场景下推荐效果较好,且对算力要求较低,模型简单。
1.一种用于行为稀疏场景的推荐模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定目标推荐商品,包括:
3.根据权利要求1所述的方法,其特征在于,按照预设的数据集划分策略,将所述用户行为数据集划分为训练数据集、验证数据集和测试数据集,包括:
4.根据权利要求1所述的方法,其特征在于,对所述训练数据集中的训练样本数据进行样本筛选和特征工程处理,得到目标训练数据集,包括:
5.根据权利要求4所述的方法,其特征在于,所述过滤训练数据集包括多条样本数据,每一条样本数据包括商品特征数据、用户特征数据、用户商品特征数据和转化特征数据,所述用户商品特征数据包括多个特征项;
6.根据权利要求1所述的方法,其特征在于,使用所述目标训练数据集对初始推荐模型进行训练,直至达到预设的迭代停止条件,获得目标推荐模型,包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种用于行为稀疏场景的推荐方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
10.一种用于行为稀疏场景的推荐模型训练装置,其特征在于,包括:
11.一种用于行为稀疏场景的推荐装置,其特征在于,包括:
12.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤,或者实现如权利要求8至9中任一项所述方法的步骤。
13.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤,或者实现如权利要求8至9中任一项所述方法的步骤。