模型训练方法、产品点击率预测方法、系统、设备及介质与流程

文档序号:31088695发布日期:2022-08-09 23:23阅读:79来源:国知局
模型训练方法、产品点击率预测方法、系统、设备及介质与流程

1.本发明涉及深度模型的排序方法,特别涉及一种模型训练方法、产品点击率的预测方法、系统、设备及介质。


背景技术:

2.排序算法被广泛的应用于搜索、推荐和广告场景,不但可以增强用户的个性化体验,还可以增加供应商的收入。利用排序算法对搜索、推荐和广告场景的产品进行排序,将排序结果直接呈现给用户,该结果将决定用户的体验度和供应商的收益。
3.将召回的候选产品进行筛选,在对筛选后的目标产品进行排序的过程中,需要结合大量的用户特征和产品特征,预测用户对每个目标产品存在交互行为(点击/曝光)的概率值,根据该概率值对用户可能存在交互行为的目标产品进行排序。
4.目前,深度模型的预测效果主要依赖于应用场景和开发团队的能力,且停留在挖掘特征交叉和用户行为序列的阶段。由于模型对影响与产品点击/曝光强相关特征的学习效果差,造成预测准确性低。


技术实现要素:

5.本发明要解决的技术问题是为了克服现有技术中由于模型对与产品点击/曝光强相关特征的学习效果差,造成预测准确性低的缺陷,提供一种模型训练方法、产品点击率的预测方法、系统、设备及介质。
6.本发明是通过下述技术方案来解决上述技术问题:
7.第一方面,本发明提供一种模型训练方法,所述方法包括:
8.获取待训练数据;所述待训练数据包括训练用户的特征数据、训练产品的特征数据、所述训练用户的请求特征数据和所述训练用户对所述训练产品的点击交互数据;
9.从所述训练用户的特征数据、所述训练产品的特征数据和所述训练用户的请求特征数据中筛选出先验特征数据和非先验特征数据;
10.将所述先验特征数据、所述非先验特征数据和所述点击交互数据输入第一模型进行训练,以得到产品预测模型;所述第一模型包括第一神经网络层和加强先验特征的第二神经网络层,所述产品预测模型用于计算每个产品在未来时间段的未来订单中被用户点击的概率值。
11.较佳地,所述加强先验特征的第二神经网络层包括第一全连接网络单元、第二全连接网络单元、softmax激活函数处理网络单元和处理网络单元;所述softmax激活函数处理网络单元位于所述第一全连接网络单元和所述处理网络单元之间;
12.所述softmax激活函数处理网络单元的输入包括所述第一全连接网络单元的输出,所述softmax激活函数处理网络单元的输出包括所述第二全连接网络单元的输出各个特征表达的加强系数;
13.所述处理网络单元的输入包括所述softmax激活函数处理网络单元的输出和所述
第二全连接网络单元的输出,且所述softmax激活函数处理网络单元的输出的特征表达和所述第二全连接网络单元的输出的特征表达的维度相同。
14.较佳地,所述将所述先验特征数据、所述非先验特征数据和所述点击交互数据输入第一模型进行训练,以得到产品预测模型的步骤,包括:
15.分别将所述非先验特征数据输入所述第一神经网络层和将所述先验特征数据输入所述第二神经网络层后,基于所述点击交互数据对所述第一模型进行训练。
16.较佳地,所述非先验特征数据包括离散特征数据和连续特征数据,所述先验特征数据包括先验离散特征数据和先验连续特征数据;
17.所述分别将所述非先验特征数据输入所述第一神经网络层和所述先验特征数据输入所述第二神经网络层后,基于所述点击交互数据对所述第一模型进行训练的步骤,包括:
18.利用embedding技术对所述离散特征数据和所述先验离散特征数据进行预处理;
19.将经过处理后的所述离散特征数据和所述连续特征数据分别经过至少两层包括连接层和全连接层的处理,得到第一组合特征表达;
20.将经过处理后的所述先验离散特征数据和所述先验连续特征数据分别经过至少二层包括连接层和加强先验特征的处理层的处理,得到第二组合特征表达;
21.将所述第一组合特征表达和所述第二组合特征表达拼接,并依次经过至少三层包括连接层、全连接层和激活处理层的处理,得到所述训练用户对所述训练产品的预测点击概率;
22.根据所述预测点击概率和所述训练用户对所述训练产品的点击交互数据对二分类交叉熵损失函数进行拟合,生成所述产品预测模型。
23.较佳地,所述离散特征数据包括文章类型、文章id、用户性别、用户职业和天气状态中的至少一种,所述连续特征数据包括文章热度、用户年龄和用户每日浏览文章数中的至少一种,所述先验离散特征数据包括文章付费情况和用户是否充值中的至少一种,所述先验连续特征数据包括文章评论数、文章点击数和用户评论文章次数中至少一种。
24.第二方面,本发明还提供一种模型训练系统,包括:
25.第一获取模块,用于获取待训练数据;所述待训练数据包括训练用户的特征数据、训练产品的特征数据、所述训练用户的请求特征数据和所述训练用户对所述训练产品的点击交互数据;
26.筛选模块,用于从所述训练用户的特征数据、所述训练产品的特征数据和所述训练用户的请求特征数据中筛选出先验特征数据和非先验特征数据;
27.训练模块,用于将所述先验特征数据、所述非先验特征数据和所述点击交互数据输入第一模型进行训练,以得到产品预测模型;所述第一模型包括第一神经网络层和加强先验特征的第二神经网络层,所述产品预测模型用于计算每个产品在未来时间段的未来订单中被用户点击的概率值。
28.较佳地,所述加强先验特征的第二神经网络层包括第一全连接网络单元、第二全连接网络单元、softmax激活函数处理网络单元和处理网络单元;所述softmax激活函数处理网络单元位于所述第一全连接网络单元和所述处理网络单元之间;
29.所述softmax激活函数处理网络单元的输入包括所述第一全连接网络单元的输
出,所述softmax激活函数处理网络单元的输出包括所述第二全连接网络单元的输出各个特征表达的加强系数;
30.所述处理网络单元的输入包括所述softmax激活函数处理网络单元的输出和所述第二全连接网络单元的输出,且所述softmax激活函数处理网络单元的输出的特征表达和所述第二全连接网络单元的输出的特征表达的维度相同。
31.较佳地,所述训练模块包括:
32.训练单元,用于分别将所述非先验特征数据输入所述第一神经网络层和将所述先验特征数据输入所述第二神经网络层后,基于所述点击交互数据对所述第一模型进行训练。
33.较佳地,所述非先验特征数据包括离散特征数据和连续特征数据,所述先验特征数据包括先验离散特征数据和先验连续特征数据;
34.所述训练单元具体用于:
35.利用embedding技术对所述离散特征数据和所述先验离散特征数据进行预处理;
36.将经过处理后的所述离散特征数据和所述连续特征数据分别经过至少两层包括连接层和全连接层的处理,得到第一组合特征表达;
37.将经过处理后的所述先验离散特征数据和所述先验连续特征数据分别经过至少二层包括连接层和加强先验特征的处理层的处理,得到第二组合特征表达;
38.将所述第一组合特征表达和所述第二组合特征表达拼接,并依次经过至少三层包括连接层、全连接层和激活处理层的处理,得到所述训练用户对所述训练产品的预测点击概率;
39.根据所述预测点击概率和所述训练用户对所述训练产品的点击交互数据对二分类交叉熵损失函数进行拟合,生成所述产品预测模型。
40.较佳地,所述离散特征数据包括文章类型、文章id、用户性别、用户职业和天气状态中的至少一种,所述连续特征数据包括文章热度、用户年龄和用户每日浏览文章数中的至少一种,所述先验离散特征数据包括文章付费情况和用户是否充值中的至少一种,所述先验连续特征数据包括文章评论数、文章点击数和用户评论文章次数中至少一种。
41.第三方面,本发明提供一种产品点击率的预测方法,所述预测方法包括:
42.利用第一方面任一项所述的模型训练方法训练出的产品预测模型;
43.响应于目标用户的订单请求,获取所述目标用户的用户特征信息、所述目标用户的请求特征信息和备选产品的产品特征信息;
44.将所述用户特征信息、所述请求特征信息和所述产品特征信息输入所述产品预测模型中,预测得到每个所述备选产品对应的点击概率值。
45.较佳地,所述预测方法还包括:
46.将所述备选产品按照所述点击概率值进行排序。
47.第四方面,本发明提供一种产品点击率的预测系统,所述预测系统包括:
48.第二方面中任一项所述的模型训练系统,用于训练产品预测模型;
49.第二获取模块,用于响应于目标用户的订单请求,获取所述目标用户的用户特征信息、所述目标用户的请求特征信息和备选产品的产品特征信息;
50.预测模块,用于将所述用户特征信息、所述请求特征信息和所述产品特征信息输
入所述产品预测模型中,预测得到每个所述备选产品对应的点击概率值。
51.较佳地,所述预测系统还包括:
52.处理模块,用于将所述备选产品按照所述点击概率值进行排序。
53.第五方面,本发明还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面的任一项所述的模型训练方法,或者执行如第三方面的任一项所述的产品点击率的预测方法。
54.第六方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面的任一项所述的模型训练方法,或者执行如第三方面的任一项所述的产品点击率的预测方法的步骤。
55.本发明的积极进步效果在于:提供一种模型训练方法、产品点击率预测方法、系统、设备及介质,该模型训练方法通过获取待训练数据;从训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据中筛选出先验特征数据和非先验特征数据;将先验特征数据、非先验特征数据和点击交互数据输入第一模型进行训练,以得到产品预测模型。本发明通过加入加强先验特征的第二神经网络层,有效的帮助模型更好的学习到先验特征,解决了先验强相关的特征在产品预测模型中学习效果不明显的问题,增强了模型的预测效果,有效的提高了产品被用户点击的概率值的预测准确性。
附图说明
56.图1为本发明实施例1的模型训练方法的流程图。
57.图2为本发明实施例1的模型训练方法的第一模型结构示意图。
58.图3为本发明实施例1的模型训练方法的第二模型结构示意图。
59.图4为本发明实施例2的模型训练系统的模块示意图。
60.图5为本发明实施例3的产品点击率的预测方法的流程图。
61.图6为本发明实施例4的产品点击率的预测系统的模块示意图。
62.图7为本发明实施例5的电子设备的硬件结构示意图。
具体实施方式
63.下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
64.实施例1
65.本实施例提供一种模型训练方法,参照图1,该方法包括以下步骤:
66.s1、获取待训练数据;待训练数据包括训练用户的特征数据、训练产品的特征数据、训练用户的请求特征数据和训练用户对训练产品的点击交互数据。
67.s2、从训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据中筛选出先验特征数据和非先验特征数据。
68.s3、将先验特征数据、非先验特征数据和点击交互数据输入第一模型进行训练,以得到产品预测模型;第一模型包括第一神经网络层和加强先验特征的第二神经网络层,产品预测模型用于计算每个产品在未来时间段的未来订单中被用户点击的概率值。
69.针对上述步骤s1,采集待训练数据的数据可以达到百万级以上,采集的训练数据的条数越多,训练出的产品预测模型越准确。可以通过网站或者应用(application;app)进行埋点,获取用户的历史展现点击、行为数据,进而挖掘出训练数据。采集的各条待训练数据中包括训练用户的至少两个特征数据、训练产品的至少两个特征数据、训练用户的至少两个请求特征数据和训练用户的对训练产品的至少两条点击交互数据。
70.在不同的应用场景下,获取训练用户的特征数据可以包括用户的行为信息、用户的兴趣标签和用户的人口属性(例如,年龄、性别、学历和工作性质)等。训练产品的特征信息可以包括产品的标识、产品的分类和产品的价格等、该产品的标识用于唯一标识该产品,且可以采用数字、英文字母和标点符号中的至少一种或者至少两种的组合,训练用户的请求特征数据可以包括当前的请求时间和天气情况。训练用户对训练产品的点击交互数据可以包括用户点击了该训练产品,或者用户未点击该训练产品。
71.需要说明的是,本实施例的模型训练方法的执行主体为一电子实体,或者也可以为软件集成的应用,使用时将该应用运行在大型计算机设备上,采用本实施例的技术方法,实现对该产品预测模型进行训练。
72.针对上述步骤s2,先验特征数据表征能够影响模型预测准确度的强相关的特征,非先验特征数据表征对影响模型预测准确度较弱的非强相关的特征。例如,训练用户的先验特征数据包括用户是否是会员、用户是否充值和用户评论文章次数;训练产品的先验特征数据包括文章作者是否免费、文章评论数据和文章点击数。需要说明的是,本实施例中产品可以为商品,还可以为广告等其他信息。
73.针对上述步骤s3,在对第一模型进行训练之前,需要随机初始化第一模型中的神经网络层的参数,基于随机初始化后的参数开始训练第一模型。参照图2,在对第一模型进行训练的过程中,需要先基于训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据分别对用户、产品和请求上下文进行嵌入(embedding)处理,得到相应的组合特征表达,本实施例中特征表达具体可以采用向量的形式,称之为向量表达。
74.在一种可能实现的方案中,步骤s3包括:
75.s31、分别将非先验特征数据输入第一神经网络层和将先验特征数据输入第二神经网络层后,基于点击交互数据对第一模型进行训练。
76.针对上述步骤s31,将非先验特征数据输入多个常规的第一神经网络层中,将先验特征数据输入加强先验特征网络结构(enhance prior unit,以下简称epu)的第二神经网络层。基于训练用户的组合特征表达、训练产品的组合特征表达和训练用户的请求特征数据的组合特征表达的拼接后得到非先验特征数据对应的第一组合特征表达和先验特征数据对应的第二组合特征表达。基于点击交互数据、第一组合特征表达、第二组合特征表达和预先设定的损失函数,对第一模型进行迭达,并不断的调整第一模型的参数,从而生成产品预测模型。
77.在一种可能实现的方案中,非先验特征数据包括离散特征数据和连续特征数据,先验特征数据包括先验离散特征数据和先验连续特征数据,步骤s31具体包括:
78.利用embedding技术对离散特征数据和先验离散特征数据进行预处理。
79.将经过处理后的离散特征数据和连续特征数据分别经过至少两层包括连接层和全连接层的处理,得到第一组合特征表达。
80.将经过处理后的先验离散特征数据和先验连续特征数据分别经过至少二层包括连接层和加强先验特征的处理层的处理,得到第二组合特征表达。
81.将第一组合特征表达和第二组合特征表达拼接,并依次经过至少三层包括连接层、全连接层和激活处理层的处理,得到训练用户对训练产品的预测点击概率。
82.根据预测点击概率和训练用户对训练产品的点击交互数据对二分类交叉熵损失函数进行拟合,生成产品预测模型。
83.其中,离散特征数据包括文章类型、文章id、用户性别、用户职业和天气状态中的至少一种,连续特征数据包括文章热度、用户年龄和用户每日浏览文章数中的至少一种,先验离散特征数据包括文章付费情况和用户是否充值中的至少一种,先验连续特征数据包括文章评论数、文章点击数和用户评论文章次数中至少一种。
84.具体地,参见图3,利用embedding技术在嵌入层对离散特征数据进行预处理,同时利用embedding技术在嵌入层对先验离散特征数据进行预处理。将预处理后的离散特征数据和连续特征数据输入第一神经网络层的连接层(concat层)和全连接层(dense层),输出第一组合特征表达。将预处理后的先验离散特征数据和先验连续特征数据输入加强先验特征的第二神经网络层,输出第二组合特征表达。将第一组合特征表达和第二组合特征表达拼接后,依次经过连接层(concat层)、全连接层(dense层)和激活处理层(sigmoid层)的处理,生成产品预测模型。
85.在一种可能实现的方案中,加强先验特征的第二神经网络层包括第一全连接网络单元、第二全连接网络单元、softmax激活函数处理网络单元和处理网络单元;softmax激活函数处理网络单元位于第一全连接网络单元和处理网络单元之间;
86.softmax激活函数处理网络单元的输入包括第一全连接网络单元的输出,softmax激活函数处理网络单元的输出包括第二全连接网络单元的输出各个特征表达的加强系数;
87.处理网络单元的输入包括softmax激活函数处理网络单元的输出和第二全连接网络单元的输出,且softmax激活函数处理网络单元的输出的特征表达和第二全连接网络单元的输出的特征表达的维度相同。
88.具体地,图2是完整的加强先验特征的第二神经网络层的结构示意图,也即,加强先验特征网络单元的结构示意图。先验离散特征数据经过embedding处理后拼接先验连续特征数据后输入至epu,全部特征数据输入至右侧的x3层(dense层),同时全部特征数据输入至左侧的x1层(dense层),两层均输出n维向量。在x1层之后加入softmax激活函数输出数值总和为1的n维向量,并在输出结果上逐元素数值加1,使得最终x2层输出n维向量的元素数值位于1和2之间。将x2层的输出向量和x3层的输出向量进行哈达玛积运算,使得最终的输出结果在x3层的输出结果上加权了先验特征数据,并且将加强系数设置于[1,2]之间。
[0089]
若训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据的数量较多时,可以设置更多层次的连接层(concat层)或者全连接层(dense层),具体的连接层和全连接层的层数可以根据待训练数据的数量来确定,以使得特征数据混合更加均匀,最终以使得产品预测模型的预测的准确率提升。
[0090]
本实施例中,本发明通过加入加强先验特征的第二神经网络层,有效的帮助模型更好的学习到先验特征,解决了先验强相关的特征在产品预测模型中效果不明显的问题,增强了模型的预测效果,有效的提高了产品被用户点击的概率值的预测准确性。
[0091]
实施例2
[0092]
本实施例提供一种模型训练系统,参照图4,具体包括:第一获取模块110、筛选模块120和训练模块130。
[0093]
其中,第一获取模块110,用于获取待训练数据;待训练数据包括训练用户的特征数据、训练产品的特征数据、训练用户的请求特征数据和训练用户对所述训练产品的点击交互数据。
[0094]
筛选模块120,用于训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据中筛选出先验特征数据和非先验特征数据。
[0095]
训练模块130,用于将先验特征数据和非先验特征数据输入第一模型进行训练,以得到产品预测模型;第一模型包括第一神经网络层和加强先验特征的第二神经网络层,产品预测模型用于计算每个产品在未来时间段的未来订单中被用户点击的概率值。
[0096]
采集待训练数据的数据可以达到百万级以上,采集的训练数据的条数越多,训练出的产品预测模型越准确。可以通过网站或者应用(application;app)进行埋点,获取用户的历史展现点击、行为数据,进而挖掘出训练数据。第一获取模块110采集的各条待训练数据中包括训练用户的至少两个特征数据、训练产品的至少两个特征数据、训练用户的至少两个请求特征数据和训练用户的对训练产品的至少两条点击交互数据。
[0097]
在不同的应用场景下,获取训练用户的特征数据可以包括用户的行为信息、用户的兴趣标签和用户的人口属性(例如,年龄、性别、学历和工作性质)等。训练产品的特征信息可以包括产品的标识、产品的分类和产品的价格等、该产品的标识用于唯一标识该产品,且可以采用数字、英文字母和标点符号中的至少一种或者至少两种的组合,训练用户的请求特征数据可以包括当前的请求时间和天气情况。训练用户对训练产品的点击交互数据可以包括用户点击了该训练产品,或者用户未点击该训练产品。
[0098]
需要说明的是,本实施例的模型训练方法的执行主体为一电子实体,或者也可以为软件集成的应用,使用时将该应用运行在大型计算机设备上,采用本实施例的技术方法,实现对该产品预测模型进行训练。
[0099]
先验特征数据表征能够影响模型预测准确度的强相关的特征,非先验特征数据表征对影响模型预测准确度较弱的非强相关的特征。例如,训练用户的先验特征数据包括用户是否是会员、用户是否充值和用户评论文章次数;训练产品的先验特征数据包括文章作者是否免费、文章评论数据和文章点击数。需要说明的是,本实施例中产品可以为商品,还可以为广告等其他信息。
[0100]
在对第一模型进行训练之前,需要随机初始化第一模型中的神经网络层的参数,基于随机初始化后的参数开始训练第一模型。训练模块130在对第一模型进行训练的过程中,需要先基于训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据分别对用户、产品和请求上下文进行嵌入(embedding)处理,得到相应的组合特征表达,本实施例中特征表达具体可以采用向量的形式,称之为向量表达。
[0101]
在一种可能实现的方案中,参照图4,训练模块130包括训练单元131。
[0102]
训练单元131,用于分别将非先验特征数据输入第一神经网络层和将先验特征数据输入第二神经网络层后,基于点击交互数据对第一模型进行训练。
[0103]
将非先验特征数据输入多个常规的第一神经网络层中,将先验特征数据输入加强
先验特征网络结构(epu)的第二神经网络层。基于训练用户的组合特征表达、训练产品的组合特征表达和训练用户的请求特征数据的组合特征表达的拼接后得到非先验特征数据对应的第一组合特征表达和先验特征数据对应的第二组合特征表达。训练单元131基于点击交互数据、第一组合特征表达、第二组合特征表达和预先设定的损失函数,对第一模型进行迭达,并不断的调整第一模型的参数,从而生成产品预测模型。
[0104]
在一种可能实现的方案中,非先验特征数据包括离散特征数据和连续特征数据,先验特征数据包括先验离散特征数据和先验连续特征数据,训练单元131具体用于:
[0105]
利用embedding技术对离散特征数据和先验离散特征数据进行预处理。
[0106]
将经过处理后的离散特征数据和连续特征数据分别经过至少两层包括连接层和全连接层的处理,得到第一组合特征表达。
[0107]
将经过处理后的先验离散特征数据和先验连续特征数据分别经过至少二层包括连接层和加强先验特征的处理层的处理,得到第二组合特征表达。
[0108]
将第一组合特征表达和第二组合特征表达拼接,并依次经过至少三层包括连接层、全连接层和激活处理层的处理,得到训练用户对训练产品的预测点击概率。
[0109]
根据预测点击概率和训练用户对训练产品的点击交互数据对二分类交叉熵损失函数进行拟合,生成产品预测模型。
[0110]
其中,离散特征数据包括文章类型、文章id、用户性别、用户职业和天气状态中的至少一种,连续特征数据包括文章热度、用户年龄和用户每日浏览文章数中的至少一种,先验离散特征数据包括文章付费情况和用户是否充值中的至少一种,先验连续特征数据包括文章评论数、文章点击数和用户评论文章次数中至少一种。
[0111]
具体地,利用embedding技术在嵌入层对离散特征数据进行预处理,同时利用embedding技术在嵌入层对先验离散特征数据进行预处理。将预处理后的离散特征数据和连续特征数据输入第一神经网络层的连接层(concat层)和全连接层(dense层),输出第一组合特征表达。将预处理后的先验离散特征数据和先验连续特征数据输入加强先验特征的第二神经网络层,输出第二组合特征表达。将第一组合特征表达和第二组合特征表达拼接后,依次经过连接层(concat层)、全连接层(dense层)和激活处理层(sigmoid层)的处理,生成产品预测模型。
[0112]
在一种可能实现的方案中,加强先验特征的第二神经网络层包括第一全连接网络单元、第二全连接网络单元、softmax激活函数处理网络单元和处理网络单元;softmax激活函数处理网络单元位于第一全连接网络单元和处理网络单元之间;
[0113]
softmax激活函数处理网络单元的输入包括第一全连接网络单元的输出,softmax激活函数处理网络单元的输出包括第二全连接网络单元的输出各个特征表达的加强系数;
[0114]
处理网络单元的输入包括softmax激活函数处理网络单元的输出和第二全连接网络单元的输出,且softmax激活函数处理网络单元的输出的特征表达和第二全连接网络单元的输出的特征表达的维度相同。
[0115]
具体地,图2是完整的加强先验特征的第二神经网络层的结构示意图,也即,加强先验特征网络单元(enhance prior unit,以下简称epu)的结构示意图。先验离散特征数据经过embedding处理后拼接先验连续特征数据后输入至epu,全部特征数据输入至右侧的x3层(dense层),同时全部特征数据输入至左侧的x1层(dense层),两层均输出n维向量。在x1
层之后加入softmax输出数值总和为1的n维向量,并在输出结果上逐元素数值加1,使得最终x2层输出n维向量的元素数值位于1和2之间。将x2层的输出向量和x3层的输出向量做哈达玛积运算,使得最终的输出结果在x3层的输出结果上加权了先验特征数据,并且将加强系数设置于[1,2]之间。
[0116]
若训练用户的特征数据、训练产品的特征数据和训练用户的请求特征数据的数量较多时,可以设置更多层次的连接层(concat层)或者全连接层(dense层),具体地连接层和全连接层的层数可以根据待训练数据的数量来确定,以使得特征数据混合更加均匀,最终以使得产品预测模型的预测的准确率提升。
[0117]
本实施例的模型训练系统,通过采用上述模块实现模型训练的实现原理以及技术效果与上述相关方法实施例的实现相同,在此不再赘述。
[0118]
本实施例中,本发明通过训练模块利用加入加强先验特征的第二神经网络层构建的第一模型结合先验特征数据训练生成产品预测模型。有效的帮助模型更好的学习到先验特征,解决了先验强相关的特征在产品预测模型中学习效果不明显的问题,增强了模型的预测效果,有效的提高了产品被用户点击的概率值的预测准确性。
[0119]
实施例3
[0120]
本实施例提供一种产品点击率的预测方法,参照图5,该预测方法包括:
[0121]
s21、利用如实施例1的模型训练方法训练出的产品预测模型。
[0122]
s22、响应于目标用户的订单请求,获取目标用户的用户特征信息、目标用户的请求特征信息和备选产品的产品特征信息。
[0123]
s23、将用户特征信息、请求特征信息和产品特征信息输入产品预测模型中,预测得到每个备选产品对应的点击概率值。
[0124]
s24、将备选产品按照点击概率值进行排序。
[0125]
具体地,当接收到一个目标用户请求时,获取符合要求的召回物品的特征,从召回物品的特征中确定备选产品的产品特征信息。利用训练完成的产品预测模型对每个备选产品目标用户所点击的可能性进行预判,生成每个备选产品对应的点击概率值。例如,用户特征信息包括用户姓名、联系方式、年龄、性别和所在地等信息,请求特征信息包括当前目标用户的请求日期和天气状态等信息,产品特征信息包括酒店名称、酒店地址和酒店型号等信息。
[0126]
需要说明的是,点击概率值越大,表示该目标用户对该备选产品的兴趣越高,点击该备选产品的概率越大;反之,若点击概率值越小,表示目标用户对该备选产品的兴趣越低,点击该备选产品的概率越小。基于产品预测模型输出备选产品对应的点击概率值对产品进行推荐时,能够有效地提高推荐地准确性。
[0127]
本实施例提供一种产品点击率的预测方法,通过利用训练好的产品预测模型对备选产品的点击概率值进行预测,有效的提高了产品被用户点击的概率值的预测准确性。
[0128]
实施例4
[0129]
本实施例提供一种产品点击率的预测系统,参照图6,该预测系统包括:上述实施例3的模型训练系统、第二获取模块210、预测模块220和处理模块230。
[0130]
上述实施例3的模型训练系统,用于训练产品预测模型。
[0131]
其中,第二获取模块210,用于响应于目标用户的订单请求,获取目标用户的用户
特征信息、目标用户的请求特征信息和备选产品的产品特征信息。
[0132]
预测模块220,用于将用户特征信息、请求特征信息和产品特征信息输入产品预测模型中,预测得到每个备选产品对应的点击概率值。
[0133]
处理模块230,用于将备选产品按照点击概率值进行排序。
[0134]
具体地,当接收到一个目标用户请求时,获取符合要求的召回物品的特征,从召回物品的特征中确定备选产品的产品特征信息。利用训练完成的产品预测模型对每个备选产品目标用户所点击的可能性进行预判,生成每个备选产品对应的点击概率值。例如,用户特征信息包括用户姓名、联系方式、年龄、性别和所在地等信息,请求特征信息包括当前目标用户的请求日期和天气状态等信息,产品特征信息包括酒店名称、酒店地址和酒店型号等信息。
[0135]
需要说明的是,点击概率值越大,表示该目标用户对该备选产品的兴趣越高,点击该备选产品的概率越大;反之,若点击概率值越小,表示目标用户对该备选产品的兴趣越低,点击该备选产品的概率越小。基于产品预测模型输出备选产品对应的点击概率值对产品进行推荐时,能够有效地提高推荐地准确性。
[0136]
本实施例提供一种产品点击率的预测系统,通过利用训练好的产品预测模型对备选产品的点击概率值进行预测,有效的提高了产品被用户点击的概率值的预测准确性。
[0137]
实施例5
[0138]
图7为本实施例提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1的模型训练方法或实施例3的产品点击率的预测方法,图7显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0139]
电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
[0140]
总线33包括数据总线、地址总线和控制总线。
[0141]
存储器32可以包括易失性存储器,例如随机存取存储器(ram)321和/或高速缓存存储器322,还可以进一步包括只读存储器(rom)323。
[0142]
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0143]
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1的模型训练方法或实施例3的产品点击率的预测方法。
[0144]
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
[0145]
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
[0146]
实施例6
[0147]
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1的模型训练方法的步骤或实施例3的产品点击率的预测方法的步骤。
[0148]
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
[0149]
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1的模型训练方法的步骤或实施例3的产品点击率的预测方法的步骤。
[0150]
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
[0151]
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1