物品推荐模型的训练方法、存储介质及相关设备与流程

文档序号:33458769发布日期:2023-03-15 03:10阅读:22来源:国知局
物品推荐模型的训练方法、存储介质及相关设备与流程

1.本技术涉及人工智能技术领域,尤其涉及一种物品推荐模型的训练方法、存储介质及相关设备。


背景技术:

2.随着人工智能技术的发展以及网络技术的发展,为了便于人们的生活,可以通过网络向用户推荐物品。
3.现有技术中,可以采用完整空间多任务模型(entire space multi-task model,简称esmm)对样本物品(包括了用户所点击过的物品、用户所收藏过的物品)和目标物品进行多目标的训练,在训练过程中基于esmm模型中的转化率(conversion rate,简称cvr)模型对样本物品进行训练得到转化率,并基于esmm模型中的点击通过率(click-through-rate,简称cvr)模型对样本物品进行训练得到点击通过率,然后基于转化率和点击通过率得到目标物品的预测购买概率;基于预测购买概率调整esmm模型的参数。进而得到一个用于识别物品的购买概率的esmm模型。
4.然而现有技术中,在对esmm模型进行训练的过程中,采用同样的数据(即,样本物品)对esmm模型中的转化率模型进行训练、对esmm模型中的点击通过率模型进行训练,造成cvr训练过程、ctr训练过程两者数据相关性较弱,进而所得到的用于识别物品的购买概率的esmm模型,在识别物品的购买概率的时候,识别准确率较低。


技术实现要素:

5.本技术实施例提供了一种基于摄像头的图像处理方法、存储介质及相关设备,可以解决显示的图像的角度、位置是有偏差的,进而导致不便于用户观看终端设备显示出的图像,不便于用户观看终端设备所采集的图像所对应的物品的真实信息的问题。所述技术方案如下:
6.第一方面,本技术实施例提供了一种物品推荐模型的训练方法,所述物品推荐模型中配置有转化率模型和点击通过率模型;所述方法包括:
7.获取待训练数据,并重复以下各步骤,直至达到预设条件:
8.对所述待训练数据进行多次训练,得到多个输出数据;其中,所述待训练数据中包括待训练的物品点击序列和目标物品;所述待训练的物品点击序列中包括与用户对应的至少一个样本物品;
9.基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据;
10.基于所述转化率模型对所述第一训练数据进行训练,并基于所述点击通过率模型对所述第一训练数据进行训练,以得到所述目标物品的预测购买概率;
11.根据所述目标物品的预测购买概率、所述目标物品的真实购买概率,调整所述物
品推荐模型中的各个参数。
12.在可行一种实施方式中,所述物品推荐模型中配置有第一门控模型;基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据,包括:
13.采用第一门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重;
14.将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;
15.根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到所述第一训练数据。
16.在可行一种实施方式中,所述物品推荐模型中还配置有第二门控模型;基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据,包括:
17.采用第二门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重;
18.将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;
19.根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到所述第二训练数据;
20.其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。
21.在可行一种实施方式中,所述物品推荐模型中配置有多个训练模型;对所述待训练数据进行多次训练,得到多个输出数据,包括:
22.采用所述多个训练模型对所述待训练数据进行训练,得到多个输出数据;其中,不同的训练模型所采用的训练参数不同。
23.在可行一种实施方式中,所述待训练数据中还包括用户特征,所述用户特征中包括用户偏好特征;所述获取待训练数据,包括:
24.获取所述待训练的物品点击序列、所述目标物品、以及用户的用户历史数据;
25.将所述用户历史数据与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据;
26.根据与物品标签匹配的用户历史数据,确定用户偏好特征。
27.在可行一种实施方式中,所述用户历史数据包括至少一个历史触发物品、至少一个搜索词。
28.在可行一种实施方式中,将所述用户历史数据与标签组合进行匹配,得到与物品标签匹配的用户历史数据,包括:
29.将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;
30.对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;
31.其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
32.在可行一种实施方式中,所述待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;
33.其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;
34.所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;
35.所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
36.在可行一种实施方式中,在对所述待训练数据进行多次训练,得到多个输出数据之前,还包括:
37.基于注意力调整机制确定所述待训练数据中的每一样本物品与目标物品之间的相似度,得到所述待训练数据中的每一样本物品的分数权重;
38.根据所述待训练数据中的每一样本物品的分数权重对所述待训练数据中的每一样本物品进行参数调整,得到调整后的待训练数据。
39.在可行一种实施方式中,基于所述转化率模型对所述第一训练数据进行训练,并基于所述点击通过率模型对所述第一训练数据进行训练,以得到所述目标物品的预测购买概率,包括:
40.基于所述转化率模型对所述第一训练数据进行训练,得到所述目标物品的转化率信息,并基于所述点击通过率模型对所述第一训练数据进行训练,得到所述目标物品的点击通过率信息;
41.根据所述目标物品的转化率信息、所述目标物品的点击通过率信息以及所述目标物品的预设价格信息,得到所述目标物品的预测购买概率。
42.在可行一种实施方式中,根据所述目标物品的预测购买概率、所述目标物品的真实购买概率,调整所述物品推荐模型中的各个参数,包括:
43.若确定所述目标物品的预测购买概率与所述目标物品的真实购买概率之间的差值,大于预设阈值,则调整所述物品推荐模型中的各个参数。
44.第二方面,本技术实施例提供了一种基于多目标行为的物品推荐方法,所述方法包括:
45.重复以下步骤,直至识别完至少一个待推荐物品:获取待识别数据;其中,所述待识别数据中包括待分析的物品点击序列和待推荐物品;所述待分析的物品点击序列中包括与用户对应的至少一个样本物品;采用物品推荐模型对所述待识别数据进行处理,得到所述待推荐物品的预测购买概率;其中,所述物品推荐模型为采用第一方面提供的方法所得到的模型;
46.根据各所述待推荐物品的预测购买概率,向用户推荐各所述待推荐物品。
47.在可行一种实施方式中,所述物品推荐模型中配置有转化率模型和点击通过率模
型;采用物品推荐模型对所述待识别数据进行处理,得到所述待推荐物品的预测购买概率,包括:
48.对所述待识别数据进行多次处理,得到多个分析数据;
49.基于预设的与每一分析数据对应的第一分析权重,对所述多个分析数据进行调整,得到第一分析数据;并基于预设的与每一分析数据对应的第二分析权重,对所述多个分析数据进行调整,得到第二分析数据;
50.基于所述转化率模型对所述第一分析数据进行识别,并基于所述点击通过率模型对所述第二分析数据进行识别,以得到所述待推荐物品的预测购买概率。
51.在可行一种实施方式中,所述物品推荐模型中配置有第一门控模型;基于预设的与每一分析数据对应的第一分析权重,对所述多个分析数据进行调整,得到第一分析数据,包括:
52.采用第一门控模型对所述待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第一分析权重;
53.将每一分析数据、与每一分析数据对应的第一分析权重两者进行相乘处理,得到每一分析数据所对应的第一调整信息;
54.根据对各分析数据所对应的第一调整信息进行向量加权求和处理,得到所述第一分析数据。
55.在可行一种实施方式中,所述物品推荐模型中还配置有第二门控模型;基于预设的与每一分析数据对应的第二分析权重,对所述多个分析数据进行调整,得到第二分析数据,包括:
56.采用第二门控模型对所述待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第二分析权重;
57.将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息;
58.根据对各分析数据所对应的第二调整信息进行向量加权求和处理,得到所述第二分析数据;
59.其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。
60.在可行一种实施方式中,所述物品推荐模型中配置有多个识别模型;对所述待识别数据进行多次处理,得到多个分析数据,包括:
61.采用所述多个识别模型对所述待识别数据进行处理,得到多个分析数据;其中,不同的识别模型所采用的训练参数不同。
62.在可行一种实施方式中,所述待识别数据中还包括用户信息,所述用户信息中包括用户偏好信息;所述获取待识别数据,包括:
63.获取所述待分析的物品点击序列、所述至少一个待推荐物品、以及用户的用户历史信息;
64.将所述用户历史信息与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史信息;
65.根据与物品标签匹配的用户历史信息,确定用户偏好信息。
66.在可行一种实施方式中,所述用户历史信息包括至少一个历史触发物品、至少一
个搜索词。
67.在可行一种实施方式中,将所述用户历史信息与标签组合进行匹配,得到与物品标签匹配的用户历史信息,包括:
68.将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;
69.对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;
70.其中,与物品标签匹配的用户历史信息包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
71.在可行一种实施方式中,所述待识别数据中的待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;
72.其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;
73.所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;
74.所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
75.在可行一种实施方式中,在对所述待识别数据进行多次处理,得到多个分析数据之前,还包括:
76.基于注意力调整机制确定所述待识别数据中的每一样本物品与待推荐物品之间的相似度,得到所述待识别数据中的每一样本物品的分数权重;
77.根据所述待识别数据中的每一样本物品的分数权重对所述待识别数据中的每一样本物品进行参数调整,得到调整后的待识别数据。
78.在可行一种实施方式中,基于所述转化率模型对所述第一分析数据进行识别,并基于所述点击通过率模型对所述第二分析数据进行识别,以得到所述待推荐物品的预测购买概率,包括:
79.基于所述转化率模型对所述第一分析数据进行识别,得到所述待推荐物品的转化率信息,并基于所述点击通过率模型对所述第二分析数据进行识别,得到所述待推荐物品的点击通过率信息;
80.根据所述待推荐物品的转化率信息、所述待推荐物品的点击通过率信息以及所述待推荐物品的预设价格信息,得到所述待推荐物品的预测购买概率。
81.第三方面,本技术实施例提供了一种物品推荐模型的训练装置,所述物品推荐模型中配置有转化率模型和点击通过率模型;所述装置包括:
82.获取单元,用于获取待训练数据;
83.执行单元,用于重复以下各单元,直至达到预设条件;
84.第一训练单元,用于对所述待训练数据进行多次训练,得到多个输出数据;其中,
所述待训练数据中包括待训练的物品点击序列和目标物品;所述待训练的物品点击序列中包括与用户对应的至少一个样本物品;
85.第一调整单元,用于基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据;
86.第二调整单元,用于基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据;
87.第二训练单元,用于基于所述转化率模型对所述第一训练数据进行训练,并基于所述点击通过率模型对所述第一训练数据进行训练,以得到所述目标物品的预测购买概率;
88.处理单元,用于根据所述目标物品的预测购买概率、所述目标物品的真实购买概率,调整所述物品推荐模型中的各个参数。
89.在可行一种实施方式中,所述物品推荐模型中配置有第一门控模型;所述第一调整单元,包括:
90.第一处理模块,用于采用第一门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重;
91.第二处理模块,用于将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;
92.第三处理模块,用于根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到所述第一训练数据。
93.在可行一种实施方式中,所述第二调整单元,包括:
94.第四处理模块,用于采用第二门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重;
95.第五处理模块,用于将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;
96.第六处理模块,用于根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到所述第二训练数据;
97.其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。
98.在可行一种实施方式中,所述物品推荐模型中配置有多个训练模型;所述第一训练单元,具体用于:
99.采用所述多个训练模型对所述待训练数据进行训练,得到多个输出数据;其中,不同的训练模型所采用的训练参数不同。
100.在可行一种实施方式中,所述待训练数据中还包括用户特征,所述用户特征中包括用户偏好特征;所述获取单元,包括:
101.获取模块,用于获取所述待训练的物品点击序列、所述目标物品、以及用户的用户历史数据;
102.匹配模块,用于将所述用户历史数据与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据;
103.确定模块,用于根据与物品标签匹配的用户历史数据,确定用户偏好特征。
104.在可行一种实施方式中,所述用户历史数据包括至少一个历史触发物品、至少一
个搜索词。
105.在可行一种实施方式中,所述匹配模块,具体用于:
106.将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;
107.对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;
108.其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
109.在可行一种实施方式中,所述待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;
110.其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;
111.所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;
112.所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
113.在可行一种实施方式中,所述装置,还包括:
114.第三调整单元,用在所述第一训练单元对所述待训练数据进行多次训练,得到多个输出数据之前,基于注意力调整机制确定所述待训练数据中的每一样本物品与目标物品之间的相似度,得到所述待训练数据中的每一样本物品的分数权重;根据所述待训练数据中的每一样本物品的分数权重对所述待训练数据中的每一样本物品进行参数调整,得到调整后的待训练数据。
115.在可行一种实施方式中,所述第二训练单元,具体用于:
116.基于所述转化率模型对所述第一训练数据进行训练,得到所述目标物品的转化率信息,并基于所述点击通过率模型对所述第一训练数据进行训练,得到所述目标物品的点击通过率信息;
117.根据所述目标物品的转化率信息、所述目标物品的点击通过率信息以及所述目标物品的预设价格信息,得到所述目标物品的预测购买概率。
118.在可行一种实施方式中,所述处理单元,具体用于:
119.若确定所述目标物品的预测购买概率与所述目标物品的真实购买概率之间的差值,大于预设阈值,则调整所述物品推荐模型中的各个参数。
120.第四方面,本技术实施例提供了一种基于多目标行为的物品推荐装置,所述装置包括:
121.执行单元,用于重复获取单元和预测单元的过程,直至识别完至少一个待推荐物品;
122.获取单元,用于获取待识别数据;其中,所述待识别数据中包括待分析的物品点击
序列和待推荐物品;所述待分析的物品点击序列中包括与用户对应的至少一个样本物品;
123.预测单元,用于采用物品推荐模型对所述待识别数据进行处理,得到所述待推荐物品的预测购买概率;其中,所述物品推荐模型为采用第三方面提供的装置所得到的模型;
124.推荐单元,用于根据各所述待推荐物品的预测购买概率,向用户推荐各所述待推荐物品。
125.在可行一种实施方式中,所述物品推荐模型中配置有转化率模型和点击通过率模型;所述预测单元,包括:
126.处理模块,用于对所述待识别数据进行多次处理,得到多个分析数据;
127.第一调整模块,用于基于预设的与每一分析数据对应的第一分析权重,对所述多个分析数据进行调整,得到第一分析数据;
128.第二调整模块,用于基于预设的与每一分析数据对应的第二分析权重,对所述多个分析数据进行调整,得到第二分析数据;
129.预测模块,用于基于所述转化率模型对所述第一分析数据进行识别,并基于所述点击通过率模型对所述第二分析数据进行识别,以得到所述待推荐物品的预测购买概率。
130.在可行一种实施方式中,所述物品推荐模型中配置有第一门控模型;所述第一调整模块,包括:
131.第一处理子模块,用于采用第一门控模型对所述待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第一分析权重;
132.第二处理子模块,用于将每一分析数据、与每一分析数据对应的第一分析权重两者进行相乘处理,得到每一分析数据所对应的第一调整信息;
133.第三处理子模块,用于根据对各分析数据所对应的第一调整信息进行向量加权求和处理,得到所述第一分析数据。
134.在可行一种实施方式中,所述物品推荐模型中还配置有第二门控模型;所述第二调整模块,包括:
135.第四处理子模块,用于采用第二门控模型对所述待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第二分析权重;
136.第五处理子模块,用于将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息;
137.第六处理子模块,用于根据对各分析数据所对应的第二调整信息进行向量加权求和处理,得到所述第二分析数据;
138.其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。
139.在可行一种实施方式中,所述物品推荐模型中配置有多个识别模型;所述处理模块,具体用于:
140.采用所述多个识别模型对所述待识别数据进行处理,得到多个分析数据;其中,不同的识别模型所采用的训练参数不同。
141.在可行一种实施方式中,所述待识别数据中还包括用户信息,所述用户信息中包括用户偏好信息;所述获取单元,包括:
142.获取模块,用于获取所述待分析的物品点击序列、所述至少一个待推荐物品、以及用户的用户历史信息;
143.匹配模块,用于将所述用户历史信息与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史信息;
144.确定模块,用于根据与物品标签匹配的用户历史信息,确定用户偏好信息。
145.在可行一种实施方式中,所述用户历史信息包括至少一个历史触发物品、至少一个搜索词。
146.在可行一种实施方式中,所述匹配模块,具体用于:
147.将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;
148.对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;
149.其中,与物品标签匹配的用户历史信息包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
150.在可行一种实施方式中,所述待识别数据中的待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;
151.其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;
152.所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;
153.所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
154.在可行一种实施方式中,所述预测单元,还包括:
155.第三调整模块,用于在所述处理模块对所述待识别数据进行多次处理,得到多个分析数据之前,基于注意力调整机制确定所述待识别数据中的每一样本物品与待推荐物品之间的相似度,得到所述待识别数据中的每一样本物品的分数权重;根据所述待识别数据中的每一样本物品的分数权重对所述待识别数据中的每一样本物品进行参数调整,得到调整后的待识别数据。
156.在可行一种实施方式中,所述预测模块,具体用于:
157.基于所述转化率模型对所述第一分析数据进行识别,得到所述待推荐物品的转化率信息,并基于所述点击通过率模型对所述第二分析数据进行识别,得到所述待推荐物品的点击通过率信息;
158.根据所述待推荐物品的转化率信息、所述待推荐物品的点击通过率信息以及所述待推荐物品的预设价格信息,得到所述待推荐物品的预测购买概率。
159.第五方面,本技术实施例提供了一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行第一方面提供的方法,或者,所述计算机程序适于由所述处理器加载并执行第二方面提供的方法。
160.第六方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储
介质存储有多条指令,所述指令适于由处理器加载并执行第一方面提供的方法,或者,所述指令适于由处理器加载并执行第二方面提供的方法。
161.第七方面,本技术实施例提供一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面提供的方法,或者,所述至少一个处理器执行所述计算机程序使得电子设备执行第二方面提供的方法。
162.在本技术实施例中,获取待训练数据,并重复以下各步骤,直至达到预设条件。对待训练数据进行多次训练,得到多个输出数据;其中,待训练数据中的待训练的物品点击序列中包括与用户对应的至少一个样本物品;待训练的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品;从而可以基于多目标对模型进行训练,以得到物品推荐模型;并且,待训练的物品点击序列中的样本物品,包括未被点击的物品、点击未转化的物品、以及点击且转化的物品,从而基于各个情况下的物品对模型进行训练,所得到物品推荐模型可以对用户未点击过的物品进行预测、对用户点击过的物品进行预测。然后,基于预设的与每一输出数据对应的第一训练权重,对多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对多个输出数据进行调整,得到第二训练数据;使得第一训练数据与第二训练数据不同,第一训练数据需要输入至转化率模型(即,cvr模型),第二训练数据需要输入至点击通过率模型(即,ctr模型),进而进入到转化率模型(即,cvr模型)、点击通过率模型(即,ctr模型)的数据是不同的,弱化cvr训练任务和ctr训练任务的较低数据相关性所带来的训练问题,使得转化率模型(即,cvr模型)更好的表征出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的学习过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。然后,基于转化率模型对第一训练数据进行训练,并基于点击通过率模型对第一训练数据进行训练,以得到目标物品的预测购买概率;基于目标物品的预测购买概率、目标物品的真实购买概率,调整物品推荐模型中的各个参数。重复以上过程,达到预设条件时所得到的物品推荐模型,可以用于识别待推荐物品的购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。基于上述分析过程可知,所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型;本技术中的esmm模型不同于现有技术中的esmm模型),在识别物品的购买概率的时候,识别准确率较高;即,提升了物品的购买概率的识别准确率。
附图说明
163.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
164.图1为本技术实施例提供的一种物品推荐模型的训练方法的流程图;
165.图2为本技术实施例提供的另一种物品推荐模型的训练方法的流程图;
166.图3为本技术实施例提供的物品推荐模型的结构示意图;
167.图4为本技术实施例提供的一种基于多目标行为的物品推荐方法的流程图;
168.图5为本技术实施例提供的另一种基于多目标行为的物品推荐方法的流程图;
169.图6为本技术实施例提供的又一种基于多目标行为的物品推荐方法的流程图;
170.图7为本技术实施例提供的物品推荐模型的预测过程示意图;
171.图8为本技术实施例提供的一种物品推荐模型的训练装置的结构示意图;
172.图9为本技术实施例提供的另一种物品推荐模型的训练装置的结构示意图;
173.图10为本技术实施例提供的一种基于多目标行为的物品推荐装置的结构示意图;
174.图11为本技术实施例提供的另一种基于多目标行为的物品推荐装置的结构示意图;
175.图12为本技术实施例提供的一种电子设备的结构示意图;
176.图13为本技术实施例提供了另一种电子设备的结构示意图。
具体实施方式
177.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施例方式作进一步地详细描述。
178.应当明确,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
179.下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
180.在本技术的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。此外,在本技术的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
181.本技术所涉及的电子设备设置有usb接口、存储器、处理器以及按键,处理器分别与usb接口、存储器和按键连接。usb接口的属性为usb device,用于与显示设备相连。电子设备通过usb接口与显示设备(例如笔记本电脑)连接。电子设备可以与usb线材结合成一根定制的特殊usb线材,也可以是一个带电子设备的usb dongle加标准usb线材的结合的方式存在。电子设备可直接通过显示设备的usb接口获得供电。存储器的用途之一为用于存放进行图像处理需要用到的特定程序或特定程序的下载器。处理器的用途之一为用于加载存储器存储的特定程序或特定程序的下载器后进行控制。按键用于触发处理器产生相关的控制指令,例如按键被点击操作后,处理器将接收到按键发送的操作数据,并根据该操作数据对应生成响应的指令。
182.随着人工智能技术的发展以及网络技术的发展,为了便于人们的生活,可以通过网络向用户推荐物品。例如,在需要向用户推荐物品的场景下,需要对用户的行为进行分
析,进而向用户推荐物品。
183.可以训练得到一个模型,基于该模型确定出向用户推荐的物品。在训练模型的时候,所采用的参数主要为用户对物品的点击率。
184.一个示例中,可以获取用户点击过的物品的物品信息;基于用户点击过的物品的物品信息,对初始模型进行训练,进而得到物品推荐模型。可以采用该物品推荐模型对待分析物品进行识别,得到待分析物品的预测购买概率;基于各个待分析物品的预测购买概率,向用户推荐物品。
185.但是上述方式中,只能基于“用户点击过的物品的物品信息”这一行为(即,这一维度)去训练模型,得到物品推荐模型;基于该物品推荐模型所得到的预测购买概率并不准确,导致向用户推荐的物品并不是用户所满意的。例如,向用户推荐的物品的实际物品与标题不匹配,或者,向用户推荐的物品的实际物品与图片不匹配。
186.另一个示例中,可以获取用户的多种行为,即获取用户的点击行为、分享行为、收藏行为、点赞行为、购买行为等等;进而,获取到多种信息,例如,例如获取用户点击的物品的物品信息、用户分享的物品的物品信息、用户收藏的物品的物品信息、用户点赞的物品的物品信息、用户购买的物品的物品信息、等等。基于多种信息(即,基于多目标)进行模型的训练。
187.在基于多目标进行模型的训练的时候,可以采用以下几种方式:通过样本权重进行多目标优化得到物品推荐模型、多模型分数融合得到物品推荐模型、排序学习得到物品推荐模型、多任务学习得到物品推荐模型。
188.例如,可以采用esmm对样本物品(包括了用户所点击过的物品、用户所收藏过的物品)和目标物品进行多目标的训练,在训练过程中基于esmm模型中的转化率(即,cvr)模型对样本物品进行训练得到转化率,并基于esmm模型中的点击通过率(即,cvr)模型对样本物品进行训练得到点击通过率,然后基于转化率和点击通过率得到目标物品的预测购买概率;基于预测购买概率调整esmm模型的参数。进而得到一个用于识别物品的购买概率的esmm模型。
189.但是上述方式中,在对esmm模型进行训练的过程中,采用同样的数据(样本物品和目标物品)对esmm模型中的转化率模型进行训练、对esmm模型中的点击通过率模型进行训练,造成cvr训练过程、ctr训练过程两者数据相关性较弱;进而导致影响了整个模型训练过程,所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型),在识别物品的购买概率的时候,识别准确率较低。
190.并且,在上述对esmm模型进行训练的过程中,将“用户点击未转化”(即,用户点击但未购买)的物品作为负样本,将“用户点击且转化”(即,用户点击且购买)的物品作为正样本,将这样的这负样本和正样本输入到初始模型中进行训练。但是在得到了物品推荐模型之后,该物品推荐模型需要用于预估出所有物品的购买概率(例如,用户点击过的物品的购买概率、用户未点击过的物品的购买概率),但是该物品推荐模型只能识别出用户点击过的物品的购买概率,而无法识别出用户未点击过的物品的购买概率。从而所得到的物品推荐模型的适用场景太小,不能向用户更好的推荐物品。
191.上述方式中,在对esmm模型进行训练的过程中,基于转化率模型输出了目标物品的转化率信息,基于点击通过率模型输出了目标物品的点击通过率信息;在物品推荐模型
中会基于目标物品的转化率信息和目标物品的点击通过率信息进行乘积计算,输出目标物品的ctcvr信息。通过物品推荐模型可以直接获取到目标物品的点击通过率信息、以及目标物品的ctcvr信息,但是不能直接获取到目标物品的转化率信息。从而需要通过目标物品的点击通过率信息、以及目标物品的ctcvr(click-through&conversion rate)信息,进行计算得到目标物品的转化率信息。ctr任务的正样本是曝光且点击,负样本是曝光未点击;ctcvr任务的正样本是曝光、点击且转化,负样本是曝光未转化。“转化”指的是购买。但是,在实际场景中,“曝光、点击且转化”这样的正样本是较少的;从而导致ctr任务和ctcvr任务的数据相关性降低,具有严重的数据稀疏性,导致模型的底层的学习能力较差。
192.并且,根据发明人的分析,可知,在上述对esmm模型进行训练的过程中,转化率模型的cvr训练数据中的点击样本量,远大于点击通过率模型的ctr训练数据中的点击且转化的样本量,具有严重的数据稀疏性(data sparsity,简称ds)问题。即,所采用的样本中的“点击且购买”的样本量太少。进一步的导致所得到的物品推荐模型,不能准确的识别出物品的购买概率。
193.本技术提供一种物品推荐模型的训练方法、存储介质及相关设备,以解决上述问题。下面进行介绍。
194.需要注意的是,由于篇幅所限,本技术说明书没有穷举所有可选的实施方式,本领域技术人员在阅读本技术说明书后,应该能够想到,只要技术特征不互相矛盾,那么技术特征的任意组合均可以构成可选的实施方式。下面对各实施例进行详细说明。
195.图1为本技术实施例提供的一种物品推荐模型的训练方法的流程图,如图1所示,本实施例提供的方法包括以下步骤:
196.s101、获取待训练数据,并重复以下各步骤s102-s105,直至达到预设条件。其中,待训练数据中包括待训练的物品点击序列和目标物品;待训练的物品点击序列中包括与用户对应的至少一个样本物品。
197.示例性地,本实施例的执行主体为电子设备、或者终端设备、或者服务器、或者物品推荐模型的训练装置或设备、或者其他可以执行本实施例方案的装置或设备,不做限制。
198.需要获取到待训练数据;例如,从服务器中获取待训练数据;或者,从存储介质中获取待训练数据。待训练数据中包括待训练的物品点击序列,该待训练的物品点击序列中包括多个样本物品。待训练的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品。并且,待训练的物品点击序列中的样本物品,包括:未被点击的物品、点击未转化的物品、点击且转化的物品。其中,未被点击的物品,指的是,未被当前的用户点击的物品。点击未转化的物品,指的是,被当前的用户点击过、但是未被当前的用户购买的物品。点击且转化的物品,指的是,被当前的用户点击过、且被当前的用户购买的物品。
199.并且,待训练数据中还包括一个目标物品。
200.每一样本物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
201.目标物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
202.s102、对待训练数据进行多次训练,得到多个输出数据。
203.示例性地,重复执行步骤s102-s105,直至达到预设条件。
204.首先,对获取到的待训练数据基于训练模型进行多次训练,得到多个输出数据。
205.一个示例中,基于一个训练模型对获取到的待训练数据进行多次训练,每一次训练调整一次训练模型的参数,进而得到多个输出数据(每一输出数据为一个向量)。
206.另一个示例中,采用多个训练模型对获取到的待训练数据分别进行训练,得到多个输出数据(每一输出数据为一个向量);其中,不同的训练模型采用的参数不同。
207.上述训练模型为初始的物品推荐模型的一部分结构。
208.s103、基于预设的与每一输出数据对应的第一训练权重,对多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对多个输出数据进行调整,得到第二训练数据。
209.示例性地,预先针对输入至转化率模型的训练数据配置有第一训练权重,每一第一训练权重与上述每一输出数据之间一一对应,即,每一输出数据具有第一训练权重。例如,每一输出数据的第一训练权重相同;或者,每一输出数据的第一训练权重不同;或者,部分输出数据的第一训练权重相同,其余输出数据的第一训练权重不同。
210.并且,预先针对输入至点击通过率模型的训练数据配置有第二训练权重,每一第二训练权重与上述每一输出数据之间一一对应,即,每一输出数据具有第二训练权重。例如,每一输出数据的第二训练权重相同;或者,每一输出数据的第二训练权重不同;或者,部分输出数据的第二训练权重相同,其余输出数据的第二训练权重不同。
211.从而,基于与每一输出数据对应的第一训练权重,对每一个输出数据进行调整,得到每一调整后的输出数据;此时的各调整后的输出数据,构成了第一训练数据。此时,每一调整后的输出数据为一个向量;从而,第一训练数据是由多个向量构成矩阵,或者,第一训练数据是多个向量所构成的长向量。
212.基于与每一输出数据对应的第二训练权重,对每一个输出数据进行调整,得到每一调整后的输出数据;此时的各调整后的输出数据,构成了第二训练数据。此时,每一调整后的输出数据为一个向量;从而,第二训练数据是由多个向量构成矩阵,或者,第二训练数据是多个向量所构成的长向量。
213.s104、物品推荐模型中配置有转化率模型和点击通过率模型;基于转化率模型对第一训练数据进行训练,并基于点击通过率模型对第一训练数据进行训练,以得到目标物品的预测购买概率。
214.示例性地,物品推荐模型中包括了转化率模型(即,cvr模型)和点击通过率模型(即,ctr模型)。将上述步骤s103所得到的第一训练数据输入至转化率模型中,基于转化率模型对第一训练数据进行训练,输出目标物品的转化率信息。将上述步骤s103所得到的第二训练数据输入至点击通过率模型中,基于点击通过率模型对第二训练数据进行训练,输出目标物品的点击通过率信息。
215.基于转化率信息和点击通过率信息,通过数学计算得到目标物品的预测购买概率。
216.s105、根据目标物品的预测购买概率、目标物品的真实购买概率,调整物品推荐模型中的各个参数。
217.示例性地,由于目标物品具有真实购买概率,进而将步骤s104所得到的预设购买
概率与真实购买概率进行比较;若预设购买概率与真实购买概率之间的差值的绝对值,大于预设阈值,则调整物品推荐模型中的各个参数。
218.例如,若预设购买概率与真实购买概率之间的差值的绝对值,大于预设阈值,则将物品推荐模型中的各个参数增大或减小。
219.然后,重复执行步骤s102-s105的过程,直至达到预设条件。在达到预设条件时所得到的物品推荐模型,可以被用于识别待推荐物品的购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。
220.其中,预设条件为以下的任意一种:重复执行次数大于预设次数;预设购买概率与真实购买概率之间的差值的绝对值,小于预设阈值。
221.本实施例中,获取待训练数据,并重复以下各步骤,直至达到预设条件。对待训练数据进行多次训练,得到多个输出数据;其中,待训练数据中的待训练的物品点击序列中包括与用户对应的至少一个样本物品;待训练的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品;从而可以基于多目标对模型进行训练,以得到物品推荐模型;并且,待训练的物品点击序列中的样本物品,包括未被点击的物品、点击未转化的物品、以及点击且转化的物品,从而基于各个情况下的物品对模型进行训练,所得到物品推荐模型可以对用户未点击过的物品进行预测、对用户点击过的物品进行预测。然后,基于预设的与每一输出数据对应的第一训练权重,对多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对多个输出数据进行调整,得到第二训练数据;使得第一训练数据与第二训练数据不同,第一训练数据需要输入至转化率模型(即,cvr模型),第二训练数据需要输入至点击通过率模型(即,ctr模型),进而进入到转化率模型(即,cvr模型)、点击通过率模型(即,ctr模型)的数据是不同的,弱化cvr训练任务和ctr训练任务的较低数据相关性所带来的训练问题,使得转化率模型(即,cvr模型)更好的表征出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的学习过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。然后,基于转化率模型对第一训练数据进行训练,并基于点击通过率模型对第一训练数据进行训练,以得到目标物品的预测购买概率;基于目标物品的预测购买概率、目标物品的真实购买概率,调整物品推荐模型中的各个参数。重复以上过程,达到预设条件时所得到的物品推荐模型,可以用于识别待推荐物品的购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。基于上述分析过程可知,所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型;本技术中的esmm模型不同于现有技术中的esmm模型),在识别物品的购买概率的时候,识别准确率较高;即,提升了物品的购买概率的识别准确率。
222.图2为本技术实施例提供的另一种物品推荐模型的训练方法的流程图,如图2所示,本实施例提供的方法包括以下步骤:
223.s201、获取待训练数据,并重复以下各步骤s202-s210,直至达到预设条件。其中,待训练数据中包括待训练的物品点击序列和目标物品;待训练的物品点击序列中包括与用户对应的至少一个样本物品。
224.一个示例中,待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;其中,第一正样本集合中的样本物品为第一状态;第一状态为以
下的任意一种或多种:物品被点击、物品被分享、物品被收藏。
225.第二正样本集合包括第一子集合和第二子集合,第一子集合中的样本物品为第二状态,第二子集合中的样本物品为第三状态;第二状态为物品被点击且被购买;第三状态为物品被点击且具有购买链接、但物品未被购买;其中,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
226.负样本集合中的样本物品为第四状态;第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
227.示例性地,本实施例的执行主体为电子设备、或者终端设备、或者服务器、或者物品推荐模型的训练装置或设备、或者其他可以执行本实施例方案的装置或设备,不做限制。
228.需要获取到待训练数据;例如,从服务器中获取待训练数据;或者,从存储介质中获取待训练数据。待训练数据中包括待训练的物品点击序列,该待训练的物品点击序列中包括多个样本物品。待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合。
229.其中,第一正样本集合中的样本物品为第一状态。第一状态,包括但不限于:物品被点击、物品被分享、物品被收藏。
230.第二正样本集合包括第一子集合和第二子集合。第一子集合中的样本物品为第二状态,第二状态为物品被点击且被购买(即,点击且转化)。第二子集合中的样本物品为第三状态,第三状态为物品被点击且具有购买链接、但物品未被购买。本实施例中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本。并且,为第一子集合中的样本物品、第二子集合中的样本物品均配置了参考权重;但是,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
231.在本实施例中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本,从而构造“假”的正样本,即“假”的ctcvr(click-through&conversion rate)正样本,可以缓解“点击且转化”的样本较少而带来的问题,进而缓解数据稀疏的问题。
232.为第一子集合中的样本物品、第二子集合中的样本物品均配置了参考权重;但是,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。从而采用不同的参考权重区分出“被点击且被购买”的正样本、以及“被点击且具有购买链接、但物品未被购买”的正样本,促进模型的学习。并且,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重,去为被点击且被购买”的正样本赋予更好的权重,可以避免“被点击且具有购买链接、但物品未被购买”的正样本与“被点击且被购买”的正样本,两者权重相同所导致的错误;有助于模型更好地学习用户的行为,得到可以准确识别物品的预测购买概率的模型。
233.负样本集合中的样本物品为第四状态。其中,第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。可知,负样本集合中的样本物品为当前的用户所未看过的。
234.上述各个样本中的样本物品的个数、以及参考权重,根据实验所得到。
235.并且,待训练数据中还包括一个目标物品。
236.每一样本物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
237.目标物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
238.一个示例中,待训练数据中还包括用户特征,用户特征中包括用户偏好特征。步骤s201包括以下过程:
239.获取待训练的物品点击序列、目标物品、以及用户的用户历史数据;将用户历史数据与标签组合进行匹配,其中,标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据;根据与物品标签匹配的用户历史数据,确定用户偏好特征。
240.一个示例中,用户历史数据包括至少一个历史触发物品、至少一个搜索词。
241.一个示例中,“将用户历史数据与标签组合进行匹配,得到与物品标签匹配的用户历史数据”,包括以下过程:将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;对至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字。其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
242.示例性地,待训练数据中还包括用户特征,用户特征中包括用户偏好特征。
243.首先,获取待训练的物品点击序列、目标物品、以及用户的用户历史数据。物品点击序列、目标物品的介绍,可以参见前面的介绍。
244.预先配置了一个标签组合,该标签组合中包括至少一个物品标签。物品标签,例如是,物品的种类、物品的特性、物品的名称、等等。
245.将用户历史数据与标签组合中的各物品标签进行匹配,得到与物品标签匹配的用户历史数据。该过程,可以包括以下步骤:预先获取的用户历史数据中包括至少一个历史触发物品、以及至少一个搜索词,即,获取了用户的历史触发物品(例如,用户点击过的物品、用户收藏过的物品、用户分享过程的物品、用户购买过的物品、等等)、以及用户之前的搜索词。然后,将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品。并且,基于语义分析算法或者tf-idf(term frequency

inverse document frequency)技术,提取搜索词中的关键字,得到至少一个搜索关键字;再将搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字。从而得到了:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
246.然后,根据与物品标签匹配的用户历史数据(与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字),确定用户偏好特征。例如,将出现次数大于预设阈值的历史触发物品,做为用户偏好特征;将出现次数大于预设阈值的搜索关键字,做为用户偏好特征。再例如,采用字符编辑距离,确定出与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字中的用户偏好特征。
247.举例来说,在课程推荐的场景中(即,物品为课程),基于用户点击过的课程,得到最新点击过的n个课程,将n个课程组成历史触发物品的序列;n为大于等于1的正整数。在历史触发物品的序列中,依据点击时间的降序将n个课程进行排序,从而,将点击时间最新的排在前面;其中,点击时间可以反映出用户的偏好。获取用户的搜索词;采用tf-idf技术对搜索词进行分析,得到搜索关键字。预先设置了标签组合,标签组合中包括多个课程标签(即,物品标签),课程标签可以是课程类别、课程名称、等等。将n个课程与标签组合中的课
程标签进行匹配,得到与课程标签匹配的课程;并且将搜索关键字与标签组合中的课程标签进行匹配,得到与课程标签匹配的搜索关键字。此时,与课程标签匹配的课程、与课程标签匹配的搜索关键字,其实都是课程标签;进而得到一个标签序列(该标签序列中包括与课程标签匹配的课程、与课程标签匹配的搜索关键字),统计该标签序列中数据(数据,指的是与课程标签匹配的课程、与课程标签匹配的搜索关键字)的出现频率;依据出现频率计算出标签序列中数据的权重值;然后,将权重值大于预设权重值的数据,作为用户偏好特征,进而得到用户的课程偏好特征。
248.图3为本技术实施例提供的物品推荐模型的结构示意图,如图3所示,待训练数据中包括待训练的物品点击序列、目标物品、以及用户特征;其中,用户特征中包括用户偏好特征。将待训练数据输入到物品推荐模型的嵌入层(embedding layer)中进行初始计算,进而输出一个长向量,该长向量表征待训练数据。
249.本实施例中,将包含有用户偏好特征的用户特征也放入到待训练数据中,进行模型的训练。使得物品推荐模型所识别的物品的预测购买概率,更加贴合用户的需求;即用户偏好高的物品的预测购买概率会更高。并且,用户偏好特征是高阶特征,结合用户偏好特征和物品点击序列对模型进行训练,可以增强模型的学习能力。
250.s202、基于注意力调整机制确定待训练数据中的每一样本物品与目标物品之间的相似度,得到待训练数据中的每一样本物品的分数权重;根据待训练数据中的每一样本物品的分数权重对待训练数据中的每一样本物品进行参数调整,得到调整后的待训练数据。
251.示例性地,重复执行步骤s202-s210,直至达到预设条件。
252.需要采用注意力调整机制调整待训练数据中每一样本物品的分数权重。如图3所示,首先,基于注意力调整机制确定待训练数据中的每一样本物品与目标物品之间的相似度,此时可以将待训练数据输入到物品推荐模型的注意力单元(attention unit)中,就可以输出待训练数据中的每一样本物品的分数权重。其中,注意力单元由输入层、外积运算(outer product)层、函数(concat)计算层、prelu/dice层、线性(linear)处理层;将每一样本物品、目标物品输入到函数计算层,通过外积运算层向函数计算层输入计算参数;结合计算参数对每一样本物品、目标物品进行处理,可以依次通过函数计算层、prelu/dice层、线性处理层进行计算处理,进而输出每一样本物品的分数权重。
253.如图3所示,依据每一样本物品的分数权重,对待训练数据中的每一样本物品进行参数调整(例如,每一样本物品的分数权重与每一样本物品进行乘积计算),得到调整后的每一样本物品;基于物品推荐模型的sum pooling层对各调整后的样本物品进行计算处理,得到向量;再将各调整后的样本物品、目标物品、以及用户特征输入到物品推荐模型的函数(concat)计算层,将数据进行合并,得到一个长向量,该长向量表征出了调整后的待训练数据。可知,各调整后的样本物品、目标物品、以及用户特征,构成调整后的待训练数据。
254.通过步骤s202,计算每一样本物品与目标物品之间的相似度,得到每一样本物品的分数权重;根据待训练数据中的每一样本物品的分数权重对待训练数据中的每一样本物品进行参数调整,得到调整后的每一样本物品;可以提升模型整体的学习能力。
255.后续步骤所处理的待训练数据,均为调整后的待训练数据。
256.s203、物品推荐模型中配置有多个训练模型;采用多个训练模型对待训练数据进行训练,得到多个输出数据;其中,不同的训练模型所采用的训练参数不同。
257.示例性地,采用多个训练模型对调整后的待训练数据分别进行训练,得到多个输出数据(每一输出数据为一个向量);其中,不同的训练模型采用的参数不同。
258.上述训练模型为初始的物品推荐模型的一部分结构。训练模型可以采用深度神经网络(deep neural networks,简称dnn)模型。例如,训练模型的个数为3个。
259.s204、物品推荐模型中配置有第一门控模型;采用第一门控模型对待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重。
260.示例性地,物品推荐模型中配置有第一门控(gate)模型和第二门控模型。其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。第一门控模型、第二门控模型和上述多个训练模型,构成了物品推荐模型的moe(mixture of experts)层,如图3所示。
261.在moe层中已经通过多个训练模型分别对调整后的待训练数据分别进行训练,得到多个输出数据;其中,不同的训练模型采用的参数不同。
262.并且,如图3所示,在moe层中,将调整后的待训练数据输入到第一门控模型中,进而基于第一门控模型对调整后的待训练数据依次进行维度转换处理、内积处理,输出与每一输出数据对应的第一训练权重。例如,每一输出数据的第一训练权重相同;或者,每一输出数据的第一训练权重不同;或者,部分输出数据的第一训练权重相同,其余输出数据的第一训练权重不同。
263.s205、将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到第一训练数据。
264.示例性地,每一训练模型输出了每一输出数据,第一门控模型输出了与每一输出数据对应的第一训练权重;将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息。进而得到各输出数据所对应的第一中间信息。
265.再将各输出数据所对应的第一中间信息进行向量加权求和的计算处理,输出第一训练数据。第一训练数据用于输入到物品推荐模型的点击率模型中进行训练处理。如图3所示,将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;将各第一中间信息进行向量加权求和的计算处理,输出第一训练数据。
266.s206、物品推荐模型中还配置有第二门控模型;采用第二门控模型对待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重。其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。
267.示例性地,如图3所示,在moe层中,将调整后的待训练数据输入到第二门控模型中,进而基于第二门控模型对调整后的待训练数据依次进行维度转换处理、内积处理,输出与每一输出数据对应的第二训练权重。例如,每一输出数据的第二训练权重相同;或者,每一输出数据的第二训练权重不同;或者,部分输出数据的第二训练权重相同,其余输出数据的第二训练权重不同。
268.s207、将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到第二训练数据。
269.示例性地,每一训练模型输出了每一输出数据,第二门控模型输出了与每一输出数据对应的第二训练权重;将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息。进而得到各输出数据所对应的第二中间信息。
270.再将各输出数据所对应的第二中间信息进行向量加权求和的计算处理,输出第二训练数据。第二训练数据用于输入到物品推荐模型的点击通过率模型中进行训练处理。如图3所示,将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;将各第二中间信息进行向量加权求和的计算处理,输出第二训练数据。
271.通过步骤s203-s207的处理过程,在物品推荐模型中加入了一个moe层(moe层中包括了第一门控模型、第二门控模型和上述多个训练模型),基于第一门控模型输出第一训练权重,并基于第二门控模型输出第二训练权重,由于第一门控模型所采用的参数与第二门控模型所采用的参数不同,从而第一训练权重不同于第二训练权重。基于第一训练权重对输出数据进行调整得到第一训练数据,基于第二训练权重对输出数据进行调整得到第二训练数据,从而所得到的第一训练数据与第二训练数据不同,进而区分开输入到转化率模型、点击通过率模型中的训练数据。从而,弱化cvr训练任务和ctr训练任务的较低数据相关性所带来的训练问题,使得转化率模型(即,cvr模型)更好的表征出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的学习过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。并且,基于moe层可以进一步的减少“点击且转化”样本较少所带来的数据冲突。
272.s208、物品推荐模型中配置有转化率模型和点击通过率模型;基于转化率模型对第一训练数据进行训练,得到目标物品的转化率信息,并基于点击通过率模型对第一训练数据进行训练,得到目标物品的点击通过率信息。
273.示例性地,物品推荐模型中还配置了转化率模型(即,cvr模型)和点击通过率模型(即,ctr模型)。
274.将第一训练数据输入至转化率模型中,基于转化率模型对第一训练数据进行训练,输出目标物品的转化率信息。将第二训练数据输入至点击通过率模型中,基于点击通过率模型对第二训练数据进行训练,输出目标物品的点击通过率信息。
275.s209、根据目标物品的转化率信息、目标物品的点击通过率信息以及目标物品的预设价格信息,得到目标物品的预测购买概率。
276.示例性地,由于目标物品具有预设价格信息,从而可以对目标物品的转化率信息、目标物品的点击通过率信息以及目标物品的预设价格信息三者进行计算处理,输出目标物品的预测购买概率。
277.一个示例中,基于转化率模型输出了目标物品的转化率信息,基于点击通过率模型输出了目标物品的点击通过率信息;在物品推荐模型中会基于目标物品的转化率信息和目标物品的点击通过率信息进行乘积计算,输出目标物品的ctcvr信息。通过物品推荐模型可以直接获取到目标物品的点击通过率信息、以及目标物品的ctcvr信息,但是不能直接获取到目标物品的转化率信息。从而需要通过目标物品的点击通过率信息、以及目标物品的ctcvr信息,进行计算得到目标物品的转化率信息;例如,将目标物品的ctcvr信息除以目标
物品的点击通过率信息,得到目标物品的转化率信息。然后,对目标物品的转化率信息、目标物品的点击通过率信息以及目标物品的预设价格信息三者进行计算处理,输出目标物品的预测购买概率。
278.举例来说,通过物品推荐模型可以直接获取到目标物品的点击通过率信息p_ctr、以及目标物品的ctcvr信息p_ctcvr,但是不能直接获取到目标物品的转化率信息p_cvr。从而需要通过目标物品的点击通过率信息p_ctr、以及目标物品的ctcvr信息p_ctcvr,进行计算得到目标物品的转化率信息p_cvr;将目标物品的ctcvr信息p_ctcvr除以目标物品的点击通过率信息p_ctr,得到目标物品的转化率信息p_cvr。然后,通过公式p_ctr*p_cvr*pirce,得到目标物品的预测购买概率;其中,pirce为目标物品的预设价格信息。
279.s210、若确定目标物品的预测购买概率与目标物品的真实购买概率之间的差值,大于预设阈值,则调整物品推荐模型中的各个参数。
280.示例性地,由于目标物品具有真实购买概率,进而将预设购买概率与真实购买概率进行比较;若预设购买概率与真实购买概率之间的差值的绝对值,大于预设阈值,则调整物品推荐模型中的各个参数。
281.例如,若预设购买概率与真实购买概率之间的差值的绝对值,大于预设阈值,则将物品推荐模型中的各个参数增大或减小。
282.然后,重复执行步骤s202-s210的过程,直至达到预设条件。在达到预设条件时所得到的物品推荐模型,可以被用于识别待推荐物品的购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。
283.其中,预设条件为以下的任意一种:重复执行次数大于预设次数;预设购买概率与真实购买概率之间的差值的绝对值,小于预设阈值。
284.本实施例,在上述实施例的基础上,待训练数据中包括待训练的物品点击序列,该待训练的物品点击序列中包括多个样本物品;待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;其中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本,从而构造“假”的正样本,即“假”的ctcvr正样本,可以缓解“点击且转化”的样本较少而带来的问题,进而缓解数据稀疏的问题;并且采用不同的参考权重区分出“被点击且被购买”的正样本、以及“被点击且具有购买链接、但物品未被购买”的正样本,促进模型的学习。并且,将包含有用户偏好特征的用户特征也放入到待训练数据中,进行模型的训练。使得物品推荐模型所识别的物品的预测购买概率,更加贴合用户的需求。然后,计算每一样本物品与目标物品之间的相似度,得到每一样本物品的分数权重;根据待训练数据中的每一样本物品的分数权重对待训练数据中的每一样本物品进行参数调整,得到调整后的每一样本物品;可以提升模型整体的学习能力。在物品推荐模型中加入了一个moe层(moe层中包括了第一门控模型、第二门控模型和上述多个训练模型),基于第一门控模型输出第一训练权重,并基于第二门控模型输出第二训练权重,由于第一门控模型所采用的参数与第二门控模型所采用的参数不同,从而第一训练权重不同于第二训练权重。基于第一训练权重对输出数据进行调整得到第一训练数据,基于第二训练权重对输出数据进行调整得到第二训练数据,从而所得到的第一训练数据与第二训练数据不同,进而区分开输入到转化率模型、点击通过率模型中的训练数据。从而,弱化cvr训练任务和ctr训练任务的较低数据相关性所带来的训练问题,使得转化率模型(即,cvr模型)更好的表征
出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的学习过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。并且,基于moe层可以进一步的减少“点击且转化”样本较少所带来的数据冲突。基于转化率模型对第一训练数据进行训练,并基于点击通过率模型对第一训练数据进行训练,以得到目标物品的预测购买概率;基于目标物品的预测购买概率、目标物品的真实购买概率,调整物品推荐模型中的各个参数。重复以上过程,达到预设条件时所得到的物品推荐模型,可以用于识别待推荐物品的购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型;本技术中的esmm模型不同于现有技术中的esmm模型),在识别物品的购买概率的时候,识别准确率较高;即,提升了物品的购买概率的识别准确率。
285.图4为本技术实施例提供的一种基于多目标行为的物品推荐方法的流程图,如图4所示,本实施例提供的方法包括以下步骤:
286.s301、重复本步骤s301,直至识别完至少一个待推荐物品:获取待识别数据;其中,待识别数据中包括待分析的物品点击序列和待推荐物品;待分析的物品点击序列中包括与用户对应的至少一个样本物品;采用物品推荐模型对待识别数据进行处理,得到待推荐物品的预测购买概率;其中,物品推荐模型为采用上述实施例的物品推荐模型的训练方法所得到的模型。
287.示例性地,本实施例的执行主体为电子设备、或者终端设备、或者服务器、或者基于多目标行为的物品推荐装置或设备、或者其他可以执行本实施例方案的装置或设备,不做限制。
288.采用上述实施例的物品推荐模型的训练方法,可以得到物品推荐模型。本实施中,可以采用物品推荐模型对每一待推荐物品进行识别,输出每一待推荐物品的预测购买概率。
289.获取待识别数据,例如,从服务器中获取待识别数据;或者,从存储介质中获取待识别数据。待识别数据中包括待分析的物品点击序列,该待分析的物品点击序列中包括多个样本物品。待分析的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品。并且,待分析的物品点击序列中的样本物品,包括:未被点击的物品、点击未转化的物品、点击且转化的物品。其中,未被点击的物品,指的是,未被当前的用户点击的物品。点击未转化的物品,指的是,被当前的用户点击过、但是未被当前的用户购买的物品。点击且转化的物品,指的是,被当前的用户点击过、且被当前的用户购买的物品。
290.并且,待识别数据中还包括一个待推荐物品。
291.每一样本物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
292.待推荐物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
293.采用上述实施例的物品推荐模型的训练方法所得到的物品推荐模型,对待识别数据进行处理,可以输出待推荐物品的预测购买概率。
294.重复步骤s301,可以得到每一待推荐物品的预测购买概率。
295.s302、根据各待推荐物品的预测购买概率,向用户推荐各待推荐物品。
296.示例性地,根据各待推荐物品的预测购买概率的降序,对各待推荐物品进行排序,得到排序后的各待推荐物品。然后将排序后的各待推荐物品,显示给用户,进而向用户推荐各待推荐物品。
297.本实施例中,获取待识别数据;采用上述实施例的物品推荐模型的训练方法所得到的物品推荐模型,对待识别数据进行处理,得到待推荐物品的预测购买概率;进而得到每一待推荐物品的预测购买概率;基于各待推荐物品的预测购买概率的降序,向用户推荐各待推荐物品。采用上述实施例的物品推荐模型的训练方法所得到的物品推荐模型,可以准确的识别待推荐物品的预测购买概率,准确的向用户推荐与用户匹配的物品。
298.图5为本技术实施例提供的另一种基于多目标行为的物品推荐方法的流程图,如图5所示,本实施例提供的方法包括以下步骤:
299.s401、重复以下步骤s402-s405,直至识别完至少一个待推荐物品。
300.其中,物品推荐模型为采用上述实施例的物品推荐模型的训练方法所得到的模型。
301.示例性地,本实施例的执行主体为电子设备、或者终端设备、或者服务器、或者基于多目标行为的物品推荐装置或设备、或者其他可以执行本实施例方案的装置或设备,不做限制。
302.采用上述实施例的物品推荐模型的训练方法,可以得到物品推荐模型。本实施中,可以采用物品推荐模型对每一待推荐物品进行识别,执行一次步骤s402-s405,可以得到一个待推荐物品的预测购买概率。重复执行步骤s402-s405,得到多个待推荐物品中每一待推荐物品的预测购买概率。
303.s402、获取待识别数据;其中,待识别数据中包括待分析的物品点击序列和待推荐物品;待分析的物品点击序列中包括与用户对应的至少一个样本物品。
304.示例性地,获取待识别数据,例如,从服务器中获取待识别数据;或者,从存储介质中获取待识别数据。待识别数据中包括待分析的物品点击序列,该待分析的物品点击序列中包括多个样本物品。待分析的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品。并且,待分析的物品点击序列中的样本物品,包括:未被点击的物品、点击未转化的物品、点击且转化的物品。其中,未被点击的物品,指的是,未被当前的用户点击的物品。点击未转化的物品,指的是,被当前的用户点击过、但是未被当前的用户购买的物品。点击且转化的物品,指的是,被当前的用户点击过、且被当前的用户购买的物品。
305.并且,待识别数据中还包括一个待推荐物品。
306.每一样本物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
307.待推荐物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
308.s403、对待识别数据进行多次处理,得到多个分析数据。
309.示例性地,首先,对获取到的待识别数据基于识别模型进行多次处理,得到多个分析数据。
310.一个示例中,基于一个识别模型对获取到的待识别数据进行多次处理,每一次处理调整一次识别模型的参数,进而得到多个分析数据(每一分析数据为一个向量)。
311.另一个示例中,采用多个识别模型对获取到的待识别数据分别进行处理,得到多个分析数据(每一分析数据为一个向量);其中,不同的识别模型采用的参数不同。
312.上述识别模型为物品推荐模型的一部分结构。
313.s404、基于预设的与每一分析数据对应的第一分析权重,对多个分析数据进行调整,得到第一分析数据;并基于预设的与每一分析数据对应的第二分析权重,对多个分析数据进行调整,得到第二分析数据。
314.示例性地,预先针对输入至转化率模型的识别数据配置有第一分析权重,每一第一分析权重与上述每一分析数据之间一一对应,即,每一分析数据具有第一分析权重。例如,每一分析数据的第一分析权重相同;或者,每一分析数据的第一分析权重不同;或者,部分分析数据的第一分析权重相同,其余分析数据的第一分析权重不同。
315.并且,预先针对输入至点击通过率模型的识别数据配置有第二分析权重,每一第二分析权重与上述每一分析数据之间一一对应,即,每一分析数据具有第二分析权重。例如,每一分析数据的第二分析权重相同;或者,每一分析数据的第二分析权重不同;或者,部分分析数据的第二分析权重相同,其余分析数据的第二分析权重不同。
316.从而,基于与每一分析数据对应的第一分析权重,对每一个分析数据进行调整,得到每一调整后的分析数据;此时的各调整后的分析数据,构成了第一分析数据。此时,每一调整后的分析数据为一个向量;从而,第一分析数据是由多个向量构成矩阵,或者,第一分析数据是多个向量所构成的长向量。
317.基于与每一分析数据对应的第二分析权重,对每一个分析数据进行调整,得到每一调整后的分析数据;此时的各调整后的分析数据,构成了第二分析数据。此时,每一调整后的分析数据为一个向量;从而,第二分析数据是由多个向量构成矩阵,或者,第二分析数据是多个向量所构成的长向量。
318.s405、物品推荐模型中配置有转化率模型和点击通过率模型。基于转化率模型对第一分析数据进行识别,并基于点击通过率模型对第二分析数据进行识别,以得到待推荐物品的预测购买概率。
319.示例性地,物品推荐模型中包括了转化率模型(即,cvr模型)和点击通过率模型(即,ctr模型)。将第一分析数据输入至转化率模型中,基于转化率模型对第一分析数据进行识别,输出待推荐物品的转化率信息。将第二分析数据输入至点击通过率模型中,基于点击通过率模型对第二分析数据进行识别,输出待推荐物品的点击通过率信息。
320.基于转化率信息和点击通过率信息,通过数学计算得到待推荐物品的预测购买概率。
321.s406、根据各待推荐物品的预测购买概率,向用户推荐各待推荐物品。
322.示例性地,根据各待推荐物品的预测购买概率的降序,对各待推荐物品进行排序,得到排序后的各待推荐物品。然后将排序后的各待推荐物品,显示给用户,进而向用户推荐各待推荐物品。
323.本实施例中,在上述实施例的基础上,对待识别数据进行多次处理,得到多个输出数据;其中,待识别数据中的待分析的物品点击序列中包括与用户对应的至少一个样本物
品;待分析的物品点击序列中的样本物品,包括但不限于:用户点击的物品、用户分享的物品、用户收藏的物品、用户点赞的物品、用户购买的物品;从而可以基于多目标对待推荐物品进行识别,使得最终向用户推荐的待推荐物品贴合用户本身的需求;并且,待分析的物品点击序列中的样本物品,包括未被点击的物品、点击未转化的物品、以及点击且转化的物品,从而基于各个情况下的物品对待推荐物品进行识别,可以对用户未点击过的待推荐物品进行预测、对用户点击过的待推荐物品进行预测。然后,基于预设的与每一分析数据对应的第一分析权重,对多个分析数据进行调整,得到第一分析数据;并基于预设的与每一分析数据对应的第二分析权重,对多个分析数据进行调整,得到第二分析数据;使得第一分析数据与第二分析数据不同,第一分析数据需要输入至转化率模型(即,cvr模型),第二分析数据需要输入至点击通过率模型(即,ctr模型),进而进入到转化率模型(即,cvr模型)、点击通过率模型(即,ctr模型)的数据是不同的,弱化cvr识别任务和ctr识别任务的较低数据相关性所带来的问题,使得转化率模型(即,cvr模型)更好的表征出转化率的识别过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的识别过程,即,使得转化率模型、点击通过率模型更好地表征出各目标(各目标,指的是,转化率信息、点击通过率信息)。然后,基于转化率模型对第一分析数据进行识别,并基于点击通过率模型对第二分析数据进行识别,以得到待推荐物品的预测购买概率。进而基于各个待推荐物品的购买概率,向用户推荐物品。基于上述分析过程可知,所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型;本技术中的esmm模型不同于现有技术中的esmm模型),在识别物品的购买概率的时候,识别准确率较高;即,提升了物品的购买概率的识别准确率。从而采用上述实施例的物品推荐模型的训练方法所得到的物品推荐模型,可以准确的识别待推荐物品的预测购买概率,准确的向用户推荐与用户匹配的物品。
324.图6为本技术实施例提供的又一种基于多目标行为的物品推荐方法的流程图,如图6所示,本实施例提供的方法包括以下步骤:
325.s501、重复以下步骤s502-s510,直至识别完至少一个待推荐物品。
326.其中,物品推荐模型为采用上述实施例的物品推荐模型的训练方法所得到的模型。
327.示例性地,本实施例的执行主体为电子设备、或者终端设备、或者服务器、或者基于多目标行为的物品推荐装置或设备、或者其他可以执行本实施例方案的装置或设备,不做限制。
328.采用上述实施例的物品推荐模型的训练方法,可以得到物品推荐模型。本实施中,可以采用物品推荐模型对每一待推荐物品进行识别,执行一次步骤s502-s510,可以得到一个待推荐物品的预测购买概率。重复执行步骤s502-s510,得到多个待推荐物品中每一待推荐物品的预测购买概率。
329.s502、获取待识别数据;其中,待识别数据中包括待分析的物品点击序列和待推荐物品;待分析的物品点击序列中包括与用户对应的至少一个样本物品。
330.一个示例中,待识别数据中的待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;其中,第一正样本集合中的样本物品为第一状态;第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏。
331.第二正样本集合包括第一子集合和第二子集合,第一子集合中的样本物品为第二
状态,第二子集合中的样本物品为第三状态;第二状态为物品被点击且被购买;第三状态为物品被点击且具有购买链接、但物品未被购买;其中,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
332.负样本集合中的样本物品为第四状态;第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
333.示例性地,需要获取到待识别数据;例如,从服务器中获取待识别数据;或者,从存储介质中获取待识别数据。待识别数据中包括待分析的物品点击序列,该待分析的物品点击序列中包括多个样本物品。待识别数据中的待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合。
334.其中,第一正样本集合中的样本物品为第一状态。第一状态,包括但不限于:物品被点击、物品被分享、物品被收藏。
335.第二正样本集合包括第一子集合和第二子集合。第一子集合中的样本物品为第二状态,第二状态为物品被点击且被购买(即,点击且转化)。第二子集合中的样本物品为第三状态,第三状态为物品被点击且具有购买链接、但物品未被购买。本实施例中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本。并且,为第一子集合中的样本物品、第二子集合中的样本物品均配置了参考权重;但是,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
336.在本实施例中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本,从而构造“假”的正样本,即“假”的ctcvr正样本,可以缓解“点击且转化”的样本较少而带来的问题,进而缓解数据稀疏的问题。
337.为第一子集合中的样本物品、第二子集合中的样本物品均配置了参考权重;但是,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。从而采用不同的参考权重区分出“被点击且被购买”的正样本、以及“被点击且具有购买链接、但物品未被购买”的正样本,促进模型的学习。并且,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重,去为被点击且被购买”的正样本赋予更好的权重,可以避免“被点击且具有购买链接、但物品未被购买”的正样本与“被点击且被购买”的正样本,两者权重相同所导致的错误;有助于模型更好地学习和识别用户的行为,得到可以准确识别物品的预测购买概率的模型。
338.负样本集合中的样本物品为第四状态。其中,第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。可知,负样本集合中的样本物品为当前的用户所未看过的。
339.上述各个样本中的样本物品的个数、以及参考权重,根据实验所得到。
340.并且,待识别数据中还包括一个目标物品。
341.每一样本物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
342.待推荐物品具有物品信息,物品信息包括但不限于:物品图片、物品文字介绍、物品的视频信息、物品图片上的文字信息、与物品相关的链接。
343.一个示例中,待识别数据中还包括用户信息,用户信息中包括用户偏好信息。步骤s502包括以下过程:
344.获取待分析的物品点击序列、至少一个待推荐物品、以及用户的用户历史信息;将用户历史信息与标签组合进行匹配,其中,标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史信息;根据与物品标签匹配的用户历史信息,确定用户偏好信息。
345.一个示例中,用户历史信息包括至少一个历史触发物品、至少一个搜索词。
346.一个示例中,“将用户历史信息与标签组合进行匹配,得到与物品标签匹配的用户历史信息”,包括以下过程:将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;对至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;其中,与物品标签匹配的用户历史信息包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
347.示例性地,待识别数据中还包括用户信息,用户信息中包括用户偏好信息。
348.首先,获取待分析的物品点击序列、待推荐物品、以及用户的用户历史信息。物品点击序列、待推荐物品的介绍,可以参见前面的介绍。
349.预先配置了一个标签组合,该标签组合中包括至少一个物品标签。物品标签,例如是,物品的种类、物品的特性、物品的名称、等等。
350.将用户历史信息与标签组合中的各物品标签进行匹配,得到与物品标签匹配的用户历史信息。该过程,可以包括以下步骤:预先获取的用户历史信息中包括至少一个历史触发物品、以及至少一个搜索词,即,获取了用户的历史触发物品(例如,用户点击过的物品、用户收藏过的物品、用户分享过程的物品、用户购买过的物品、等等)、以及用户之前的搜索词。然后,将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品。并且,基于语义分析算法或者tf-idf技术,提取搜索词中的关键字,得到至少一个搜索关键字;再将搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字。从而得到了:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
351.然后,根据与物品标签匹配的用户历史信息(与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字),确定用户偏好信息。例如,将出现次数大于预设阈值的历史触发物品,做为用户偏好信息;将出现次数大于预设阈值的搜索关键字,做为用户偏好信息。再例如,采用字符编辑距离,确定出与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字中的用户偏好信息。
352.举例来说,在课程推荐的场景中(即,物品为课程),基于用户点击过的课程,得到最新点击过的n个课程,将n个课程组成历史触发物品的序列;n为大于等于1的正整数。在历史触发物品的序列中,依据点击时间的降序将n个课程进行排序,从而,将点击时间最新的排在前面;其中,点击时间可以反映出用户的偏好。获取用户的搜索词;采用tf-idf技术对搜索词进行分析,得到搜索关键字。预先设置了标签组合,标签组合中包括多个课程标签(即,物品标签),课程标签可以是课程类别、课程名称、等等。将n个课程与标签组合中的课程标签进行匹配,得到与课程标签匹配的课程;并且将搜索关键字与标签组合中的课程标签进行匹配,得到与课程标签匹配的搜索关键字。此时,与课程标签匹配的课程、与课程标签匹配的搜索关键字,其实都是课程标签;进而得到一个标签序列(该标签序列中包括与课程标签匹配的课程、与课程标签匹配的搜索关键字),统计该标签序列中数据(数据,指的是
与课程标签匹配的课程、与课程标签匹配的搜索关键字)的出现频率;依据出现频率计算出标签序列中数据的权重值;然后,将权重值大于预设权重值的数据,作为用户偏好信息,进而得到用户的课程偏好特征。
353.图7为本技术实施例提供的物品推荐模型的预测过程示意图,如图7所示,待识别数据中包括待分析的物品点击序列、待推荐物品、以及用户信息;其中,用户信息中包括用户偏好信息。将待识别数据输入到物品推荐模型的嵌入层(embedding layer)中进行初始计算,进而输出一个长向量,该长向量表征待识别数据。
354.本实施例中,将包含有用户偏好信息的用户信息也放入到待识别数据中,进行预测购买概率的识别。使得物品推荐模型所识别的物品的预测购买概率,更加贴合用户的需求;即用户偏好高的物品的预测购买概率会更高。并且,用户偏好信息是高阶特征,结合用户偏好信息和物品点击序列对预测购买概率的进行识别,可以增强模型的识别能力,识别出的预测购买概率更加准确。
355.s503、基于注意力调整机制确定待识别数据中的每一样本物品与待推荐物品之间的相似度,得到待识别数据中的每一样本物品的分数权重;根据待识别数据中的每一样本物品的分数权重对待识别数据中的每一样本物品进行参数调整,得到调整后的待识别数据。
356.示例性地,需要采用注意力调整机制调整待分析数据中每一样本物品的分数权重。如图7所示,首先,基于注意力调整机制确定待分析数据中的每一样本物品与待推荐物品之间的相似度,此时可以将待分析数据输入到物品推荐模型的注意力单元(attention unit)中,就可以输出待分析数据中的每一样本物品的分数权重。其中,注意力单元由输入层、外积运算(outer product)层、函数(concat)计算层、prelu/dice层、线性(linear)处理层;将每一样本物品、待推荐物品输入到函数计算层,通过外积运算层向函数计算层输入计算参数;结合计算参数对每一样本物品、待推荐物品进行处理,可以依次通过函数计算层、prelu/dice层、线性处理层进行计算处理,进而输出每一样本物品的分数权重。
357.如图7所示,依据每一样本物品的分数权重,对待分析数据中的每一样本物品进行参数调整(例如,每一样本物品的分数权重与每一样本物品进行乘积计算),得到调整后的每一样本物品;基于物品推荐模型的sum pooling层对各调整后的样本物品进行计算处理,得到向量;再将各调整后的样本物品、待推荐物品、以及用户信息输入到物品推荐模型的函数(concat)计算层,将数据进行合并,得到一个长向量,该长向量表征出了调整后的待分析数据。可知,各调整后的样本物品、待推荐物品、以及用户信息,构成调整后的待分析数据。
358.通过步骤s503,计算每一样本物品与待推荐物品之间的相似度,得到每一样本物品的分数权重;根据待分析数据中的每一样本物品的分数权重对待分析数据中的每一样本物品进行参数调整,得到调整后的每一样本物品;可以提升模型整体的识别能力。
359.后续步骤所处理的待分析数据,均为调整后的待分析数据。
360.s504、物品推荐模型中配置有多个识别模型;采用多个识别模型对待识别数据进行处理,得到多个分析数据;其中,不同的识别模型所采用的训练参数不同。
361.示例性地,采用多个识别模型对调整后的待识别数据分别进行训练,得到多个分析数据(每一分析数据为一个向量);其中,不同的识别模型采用的参数不同。
362.上述识别模型为物品推荐模型的一部分结构。识别模型可以采用dnn模型。例如,
识别模型的个数为3个。
363.s505、物品推荐模型中配置有第一门控模型;采用第一门控模型对待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第一分析权重。
364.示例性地,物品推荐模型中配置有第一门控(gate)模型和第二门控模型。其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。第一门控模型、第二门控模型和上述多个识别模型,构成了物品推荐模型的moe层,如图7所示。
365.在moe层中已经通过多个识别模型分别对调整后的待识别数据分别进行识别,得到多个分析数据;其中,不同的识别模型采用的参数不同。
366.并且,如图7所示,在moe层中,将调整后的待识别数据输入到第一门控模型中,进而基于第一门控模型对调整后的待识别数据依次进行维度转换处理、内积处理,输出与每一分析数据对应的第一分析权重。例如,每一分析数据的第一分析权重相同;或者,每一分析数据的第一分析权重不同;或者,部分分析数据的第一分析权重相同,其余分析数据的第一分析权重不同。
367.s506、将每一分析数据、与每一分析数据对应的第一分析权重两者进行相乘处理,得到每一分析数据所对应的第一调整信息;根据对各分析数据所对应的第一调整信息进行向量加权求和处理,得到第一分析数据。
368.示例性地,每一识别模型输出了每一识别数据,第一门控模型输出了与每一识别数据对应的第一分析权重;将每一识别数据、与每一识别数据对应的第一分析权重两者进行相乘处理,得到每一识别数据所对应的第一调整信息。进而得到各识别数据所对应的第一调整信息。
369.再将各识别数据所对应的第一调整信息进行向量加权求和的计算处理,输出第一分析数据。第一分析数据用于输入到物品推荐模型的点击率模型中进行识别处理。如图7所示,将每一识别数据、与每一识别数据对应的第一分析权重两者进行相乘处理,得到每一识别数据所对应的第一调整信息;将各第一调整信息进行向量加权求和的计算处理,输出第一分析数据。
370.s507、物品推荐模型中还配置有第二门控模型;采用第二门控模型对待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第二分析权重。其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。
371.示例性地,如图7所示,在moe层中,将调整后的待识别数据输入到第二门控模型中,进而基于第二门控模型对调整后的待识别数据依次进行维度转换处理、内积处理,输出与每一分析数据对应的第二分析权重。例如,每一分析数据的第二分析权重相同;或者,每一分析数据的第二分析权重不同;或者,部分分析数据的第二分析权重相同,其余分析数据的第二分析权重不同。
372.s508、将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息;根据对各分析数据所对应的第二调整信息进行向量加权求和处理,得到第二分析数据。
373.示例性地,每一识别模型输出了每一分析数据,第二门控模型输出了与每一分析数据对应的第二分析权重;将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息。进而得到各分析数据所对应的第
二调整信息。
374.再将各分析数据所对应的第二调整信息进行向量加权求和的计算处理,输出第二分析数据。第二分析数据用于输入到物品推荐模型的点击通过率模型中进行识别处理。如图7所示,将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息;将各第二调整信息进行向量加权求和的计算处理,输出第二分析数据。
375.通过步骤s505-s508的处理过程,在物品推荐模型中加入了一个moe层(moe层中包括了第一门控模型、第二门控模型和上述多个识别模型),基于第一门控模型输出第一分析权重,并基于第二门控模型输出第二分析权重,由于第一门控模型所采用的参数与第二门控模型所采用的参数不同,从而第一分析权重不同于第二分析权重。基于第一分析权重对分析数据进行调整得到第一分析数据,基于第二分析权重对分析数据进行调整得到第二分析数据,从而所得到的第一分析数据与第二分析数据不同,进而区分开输入到转化率模型、点击通过率模型中的识别数据。从而,弱化cvr识别任务和ctr识别任务的较低数据相关性所带来的识别问题,使得转化率模型(即,cvr模型)更好的表征出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的识别过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。并且,基于moe层可以进一步的减少“点击且转化”样本较少所带来的数据冲突。
376.s509、物品推荐模型中配置有转化率模型和点击通过率模型;基于转化率模型对第一分析数据进行识别,得到待推荐物品的转化率信息,并基于点击通过率模型对第二分析数据进行识别,得到待推荐物品的点击通过率信息。
377.示例性地,物品推荐模型中还配置了转化率模型(即,cvr模型)和点击通过率模型(即,ctr模型)。
378.将第一分析数据输入至转化率模型中,基于转化率模型对第一分析数据进行识别,输出待推荐物品的转化率信息。将第二分析数据输入至点击通过率模型中,基于点击通过率模型对第二分析数据进行识别,输出待推荐物品的点击通过率信息。
379.s510、根据待推荐物品的转化率信息、待推荐物品的点击通过率信息以及待推荐物品的预设价格信息,得到待推荐物品的预测购买概率。
380.示例性地,由于待推荐物品具有预设价格信息,从而可以对待推荐物品的转化率信息、待推荐物品的点击通过率信息以及待推荐物品的预设价格信息三者进行计算处理,输出待推荐物品的预测购买概率。
381.一个示例中,基于转化率模型输出了待推荐物品的转化率信息,基于点击通过率模型输出了待推荐物品的点击通过率信息;在物品推荐模型中会基于待推荐物品的转化率信息和待推荐物品的点击通过率信息进行乘积计算,输出待推荐物品的ctcvr信息。通过物品推荐模型可以直接获取到待推荐物品的点击通过率信息、以及待推荐物品的ctcvr信息,但是不能直接获取到待推荐物品的转化率信息。从而需要通过待推荐物品的点击通过率信息、以及待推荐物品的ctcvr信息,进行计算得到待推荐物品的转化率信息;例如,将待推荐物品的ctcvr信息除以待推荐物品的点击通过率信息,得到待推荐物品的转化率信息。然后,对待推荐物品的转化率信息、待推荐物品的点击通过率信息以及待推荐物品的预设价格信息三者进行计算处理,输出待推荐物品的预测购买概率。
382.举例来说,通过物品推荐模型可以直接获取到待推荐物品的点击通过率信息p_ctr、以及待推荐物品的ctcvr信息p_ctcvr,但是不能直接获取到待推荐物品的转化率信息p_cvr。从而需要通过待推荐物品的点击通过率信息p_ctr、以及待推荐物品的ctcvr信息p_ctcvr,进行计算得到待推荐物品的转化率信息p_cvr;将待推荐物品的ctcvr信息p_ctcvr除以待推荐物品的点击通过率信息p_ctr,得到待推荐物品的转化率信息p_cvr。然后,通过公式p_ctr*p_cvr*pirce,得到待推荐物品的预测购买概率;其中,pirce为待推荐物品的预设价格信息。
383.s511、根据各待推荐物品的预测购买概率,向用户推荐各待推荐物品。
384.示例性地,根据各待推荐物品的预测购买概率的降序,对各待推荐物品进行排序,得到排序后的各待推荐物品。然后将排序后的各待推荐物品,显示给用户,进而向用户推荐各待推荐物品。
385.本实施例中,在上述实施例的基础上,待识别数据中包括待分析的物品点击序列,该待分析的物品点击序列中包括多个样本物品;待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;其中,将“被点击且具有购买链接、但物品未被购买”的物品也作为了正样本,从而构造“假”的正样本,即“假”的ctcvr正样本,可以缓解“点击且转化”的样本较少而带来的问题,进而缓解数据稀疏的问题;并且采用不同的参考权重区分出“被点击且被购买”的正样本、以及“被点击且具有购买链接、但物品未被购买”的正样本,促进模型的识别。并且,将包含有用户偏好信息的用户信息也放入到待识别数据中,去预测待推荐物品的购买概率。使得物品推荐模型所识别的物品的预测购买概率,更加贴合用户的需求。然后,计算每一样本物品与待推荐物品之间的相似度,得到每一样本物品的分数权重;根据待识别数据中的每一样本物品的分数权重对待识别数据中的每一样本物品进行参数调整,得到调整后的每一样本物品;可以提升模型整体的识别能力。在物品推荐模型中加入了一个moe层(moe层中包括了第一门控模型、第二门控模型和上述多个识别模型),基于第一门控模型输出第一分析权重,并基于第二门控模型输出第二分析权重,由于第一门控模型所采用的参数与第二门控模型所采用的参数不同,从而第一分析权重不同于第二分析权重。基于第一分析权重对分析数据进行调整得到第一分析数据,基于第二分析权重对分析数据进行调整得到第二分析数据,从而所得到的第一分析数据与第二分析数据不同,进而区分开输入到转化率模型、点击通过率模型中的识别数据。从而,弱化cvr识别任务和ctr识别任务的较低数据相关性所带来的识别问题,使得转化率模型(即,cvr模型)更好的表征出转化率的学习过程、以及点击通过率模型(即,ctr模型)更好的表征出点击通过率的识别过程,即,使得转化率模型、点击通过率模型更好地学习底层表示以及各目标(各目标,指的是,转化率信息、点击通过率信息)。并且,基于moe层可以进一步的减少“点击且转化”样本较少所带来的数据冲突。基于转化率模型对第一分析数据进行识别,并基于点击通过率模型对第二分析数据进行识别,得到待推荐物品的点击通过率信息;并根据待推荐物品的转化率信息、待推荐物品的点击通过率信息以及待推荐物品的预设价格信息,得到待推荐物品的预测购买概率。基于各个待推荐物品的购买概率,向用户推荐物品。基于上述分析过程可知,所得到的用于识别物品的购买概率的esmm模型(即,物品推荐模型;本技术中的esmm模型不同于现有技术中的esmm模型),在识别物品的购买概率的时候,识别准确率较高;即,提升了物品的购买概率的识别准确率。从而采用上述实施例的物品推荐模型的训练方法所
得到的物品推荐模型,可以准确的识别待推荐物品的预测购买概率,准确的向用户推荐与用户匹配的物品。
386.需要注意的是,由于篇幅所限,本技术中并没有穷举所有的实施方式,只要是不互相矛盾的特征,均可以自由随意组合,成为本技术可选的实施方式。
387.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
388.图8为本技术实施例提供的一种物品推荐模型的训练装置的结构示意图;该装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。物品推荐模型中配置有转化率模型和点击通过率模型;如图8所示,该装置包括:获取单元31、执行单元32、第一训练单元33、第一调整单元34、第二调整单元35、第二训练单元36和处理单元37。
389.获取单元31,用于获取待训练数据。
390.执行单元32,用于重复以下各单元(即,第一训练单元33、第一调整单元34、第二调整单元35、第二训练单元36、处理单元37),直至达到预设条件。
391.第一训练单元33,用于对待训练数据进行多次训练,得到多个输出数据;其中,待训练数据中包括待训练的物品点击序列和目标物品;待训练的物品点击序列中包括与用户对应的至少一个样本物品。
392.第一调整单元34,用于基于预设的与每一输出数据对应的第一训练权重,对多个输出数据进行调整,得到第一训练数据。
393.第二调整单元35,用于基于预设的与每一输出数据对应的第二训练权重,对多个输出数据进行调整,得到第二训练数据。
394.第二训练单元36,用于基于转化率模型对第一训练数据进行训练,并基于点击通过率模型对第一训练数据进行训练,以得到目标物品的预测购买概率。
395.处理单元37,用于根据目标物品的预测购买概率、目标物品的真实购买概率,调整物品推荐模型中的各个参数。
396.示例性地,本实施例可以参见上述实施例的介绍,不再赘述。
397.图9为本技术实施例提供的另一种物品推荐模型的训练装置的结构示意图;该装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。物品推荐模型中配置有转化率模型和点击通过率模型;在图8所示实施例的基础上,如图9所示,物品推荐模型中配置有第一门控模型;第一调整单元34,包括:
398.第一处理模块341,用于采用第一门控模型对待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重。
399.第二处理模块342,用于将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息。
400.第三处理模块343,用于根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到第一训练数据。
401.一个示例中,第二调整单元35,包括:
402.第四处理模块351,用于采用第二门控模型对待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重。
403.第五处理模块352,用于将每一输出数据、与每一输出数据对应的第二训练权重两
者进行相乘处理,得到每一输出数据所对应的第二中间信息。
404.第六处理模块353,用于根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到第二训练数据;其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。
405.一个示例中,物品推荐模型中配置有多个训练模型;第一训练单元33,具体用于:
406.采用多个训练模型对待训练数据进行训练,得到多个输出数据;其中,不同的训练模型所采用的训练参数不同。
407.一个示例中,待训练数据中还包括用户特征,用户特征中包括用户偏好特征;获取单元31,包括:
408.获取模块311,用于获取待训练的物品点击序列、目标物品、以及用户的用户历史数据。
409.匹配模块312,用于将用户历史数据与标签组合进行匹配,其中,标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据。
410.确定模块313,用于根据与物品标签匹配的用户历史数据,确定用户偏好特征。
411.一个示例中,用户历史数据包括至少一个历史触发物品、至少一个搜索词。
412.一个示例中,匹配模块312,具体用于:
413.将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;对至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
414.一个示例中,待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合。
415.其中,第一正样本集合中的样本物品为第一状态;第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏。
416.第二正样本集合包括第一子集合和第二子集合,第一子集合中的样本物品为第二状态,第二子集合中的样本物品为第三状态;第二状态为物品被点击且被购买;第三状态为物品被点击且具有购买链接、但物品未被购买;其中,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
417.负样本集合中的样本物品为第四状态;第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
418.一个示例中,本实施例提供的装置,还包括:
419.第三调整单元41,用在第一训练单元33对待训练数据进行多次训练,得到多个输出数据之前,基于注意力调整机制确定待训练数据中的每一样本物品与目标物品之间的相似度,得到待训练数据中的每一样本物品的分数权重;根据待训练数据中的每一样本物品的分数权重对待训练数据中的每一样本物品进行参数调整,得到调整后的待训练数据。
420.一个示例中,第二训练单元33,具体用于:
421.基于转化率模型对第一训练数据进行训练,得到目标物品的转化率信息,并基于点击通过率模型对第一训练数据进行训练,得到目标物品的点击通过率信息;根据目标物
品的转化率信息、目标物品的点击通过率信息以及目标物品的预设价格信息,得到目标物品的预测购买概率。
422.一个示例中,处理单元37,具体用于:
423.若确定目标物品的预测购买概率与目标物品的真实购买概率之间的差值,大于预设阈值,则调整物品推荐模型中的各个参数。
424.示例性地,本实施例可以参见上述实施例的介绍,不再赘述。
425.需要说明的是,上述实施例提供的物品推荐模型的训练装置在执行物品推荐模型的训练方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的物品推荐模型的训练装置的实施例与物品推荐模型的训练方法的实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
426.图10为本技术实施例提供的一种基于多目标行为的物品推荐装置的结构示意图;该装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。如图10所示,该装置包括:执行单元51、获取单元52、预测单元53和推荐单元54。
427.执行单元51,用于重复获取单元52和预测单元53的过程,直至识别完至少一个待推荐物品。
428.获取单元52,用于获取待识别数据;其中,待识别数据中包括待分析的物品点击序列和待推荐物品;待分析的物品点击序列中包括与用户对应的至少一个样本物品。
429.预测单元53,用于采用物品推荐模型对待识别数据进行处理,得到待推荐物品的预测购买概率;其中,物品推荐模型为图8或图9所示装置所得到的模型。
430.推荐单元54,用于根据各待推荐物品的预测购买概率,向用户推荐各待推荐物品。
431.示例性地,本实施例可以参见上述实施例的介绍,不再赘述。
432.图11为本技术实施例提供的另一种基于多目标行为的物品推荐装置的结构示意图;该装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。在图10所示实施例的基础上,如图11所示,物品推荐模型中配置有转化率模型和点击通过率模型;预测单元53,包括:
433.处理模块531,用于对待识别数据进行多次处理,得到多个分析数据。
434.第一调整模块532,用于基于预设的与每一分析数据对应的第一分析权重,对多个分析数据进行调整,得到第一分析数据。
435.第二调整模块533,用于基于预设的与每一分析数据对应的第二分析权重,对多个分析数据进行调整,得到第二分析数据。
436.预测模块534,用于基于转化率模型对第一分析数据进行识别,并基于点击通过率模型对第二分析数据进行识别,以得到待推荐物品的预测购买概率。
437.一个示例中,物品推荐模型中配置有第一门控模型;第一调整模块532,包括:
438.第一处理子模块,用于采用第一门控模型对待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第一分析权重。
439.第二处理子模块,用于将每一分析数据、与每一分析数据对应的第一分析权重两者进行相乘处理,得到每一分析数据所对应的第一调整信息。
440.第三处理子模块,用于根据对各分析数据所对应的第一调整信息进行向量加权求和处理,得到第一分析数据。
441.一个示例中,物品推荐模型中还配置有第二门控模型;第二调整模块533,包括:
442.第四处理子模块,用于采用第二门控模型对待识别数据依次进行维度转换处理、内积处理,得到与每一分析数据对应的第二分析权重。
443.第五处理子模块,用于将每一分析数据、与每一分析数据对应的第二分析权重两者进行相乘处理,得到每一分析数据所对应的第二调整信息。
444.第六处理子模块,用于根据对各分析数据所对应的第二调整信息进行向量加权求和处理,得到第二分析数据;其中,第一门控模型所采用的参数与第二门控模型所采用的参数不同。
445.一个示例中,物品推荐模型中配置有多个识别模型;处理模块531,具体用于:
446.采用多个识别模型对待识别数据进行处理,得到多个分析数据;其中,不同的识别模型所采用的训练参数不同。
447.一个示例中,待识别数据中还包括用户信息,用户信息中包括用户偏好信息;获取单元52,包括:
448.获取模块521,用于获取待分析的物品点击序列、至少一个待推荐物品、以及用户的用户历史信息。
449.匹配模块522,用于将用户历史信息与标签组合进行匹配,其中,标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史信息。
450.确定模块523,用于根据与物品标签匹配的用户历史信息,确定用户偏好信息。
451.一个示例中,用户历史信息包括至少一个历史触发物品、至少一个搜索词。
452.一个示例中,匹配模块522,具体用于:
453.将每一历史触发物品与标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;对至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一搜索关键字与标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;其中,与物品标签匹配的用户历史信息包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
454.一个示例中,待识别数据中的待分析的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合。
455.其中,第一正样本集合中的样本物品为第一状态;第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏。
456.第二正样本集合包括第一子集合和第二子集合,第一子集合中的样本物品为第二状态,第二子集合中的样本物品为第三状态;第二状态为物品被点击且被购买;第三状态为物品被点击且具有购买链接、但物品未被购买;其中,第一子集合中的样本物品的参考权重,均大于第二子集合中的样本物品的参考权重。
457.负样本集合中的样本物品为第四状态;第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
458.一个示例中,预测单元53,还包括:
459.第三调整模块535,用于在处理模块531对待识别数据进行多次处理,得到多个分
析数据之前,基于注意力调整机制确定待识别数据中的每一样本物品与待推荐物品之间的相似度,得到待识别数据中的每一样本物品的分数权重;根据待识别数据中的每一样本物品的分数权重对待识别数据中的每一样本物品进行参数调整,得到调整后的待识别数据。
460.一个示例中,预测模块534,具体用于:
461.基于转化率模型对第一分析数据进行识别,得到待推荐物品的转化率信息,并基于点击通过率模型对第二分析数据进行识别,得到待推荐物品的点击通过率信息;根据待推荐物品的转化率信息、待推荐物品的点击通过率信息以及待推荐物品的预设价格信息,得到待推荐物品的预测购买概率。
462.示例性地,本实施例可以参见上述实施例的介绍,不再赘述。
463.需要说明的是,上述实施例提供的基于多目标行为的物品推荐装置在执行基于多目标行为的物品推荐方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于多目标行为的物品推荐装置的实施例与基于多目标行为的物品推荐方法的实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
464.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
465.图12为本技术实施例提供的一种电子设备的结构示意图,如图12所示,电子设备可包括:处理器61和存储器62;其中,存储器62存储有计算机程序,计算机程序适于由处理器61加载并执行上述的方法步骤。
466.电子设备还可以包括发送器63和接收器64。
467.图13为本技术实施例提供了另一种电子设备的结构示意图。如图13所示,电子设备1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
468.其中,通信总线1002用于实现这些组件之间的连接通信。
469.其中,用户接口1003可以包括显示屏(display)、摄像头(camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
470.其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
471.其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种接口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
472.其中,存储器1005可以包括随机存储器(random access memory,ram),也可以包
括只读存储器(read-only memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及电子设备的操作应用程序。
473.在图13所示的电子设备1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的电子设备的操作应用程序,并具体执行上述实施例提供的方法。
474.本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质可以存储有多条指令,指令适于由处理器加载并执行如上述实施例的方法步骤,具体执行过程可以参见上述实施例的具体说明,在此不进行赘述。
475.其中,可读存储介质所在设备可以是电子设备。
476.本技术实施例还提供一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,终端设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得终端设备执行上述任一实施例提供的方案。
477.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
478.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
479.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
480.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
481.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网
络接口和内存。
482.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
483.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
484.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
485.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1