本发明涉及人工智能,尤其涉及一种基于数据增强的推荐模型训练方法、装置、设备及计算机可读存储介质。
背景技术:
1、基于人工智能的推荐方法可以提高产品的购买率以及信息的曝光率。在大健康时代,医疗信息的普及以及医疗产品的推荐对于实现全民健康尤为重要。然而,现有的推荐方法一般只关注用户的显性反馈,并不能真正了解用户所需,尤其在医疗健康行业,现有的推荐方法推荐的信息不准确,不能推荐给用户真正所需的医疗常识或者医疗产品。
技术实现思路
1、本发明提供一种推荐模型训练方法、装置、设备及存储介质,其主要目的在于提高现有推荐系统的准确性。
2、为实现上述目的,本发明提供的一种推荐模型训练方法,包括:
3、获取用户数据集及内容数据集,并构建所述用户数据集及内容数据集之间的交互图和兴趣图;
4、利用所述交互图和兴趣图对预构建的推荐模型进行优化训练,得到初步更新的推荐模型;
5、根据所述用户数据集构建用户表征向量,及根据所述内容数据集构建内容表征向量;
6、利用所述用户表征向量及内容表征向量对所述初步更新的推荐模型进行迭代优化,得到训练完成的推荐模型。
7、可选地,所述构建所述用户数据集及内容数据集之间的交互图和兴趣图,包括:
8、获取所述用户数据集中的用户行为数据;
9、从所述用户行为数据中获取用户与内容之间的交互数据,并根据所述交互数据及用户数据集中的用户id和内容数据集中的产品或信息的id,生成用户与内容之间的交互图;
10、从所述行为数据中分析用户对内容的感兴趣程度,根据所述感兴趣程度,及用户数据集中的用户id和内容数据集中的产品或信息的id,生成用户与内容之间的兴趣图。
11、可选地,所述利用所述交互图和兴趣图对预构建的推荐模型进行优化训练,包括:
12、将所述交互图输入至预构建的推荐模型,得到所述交互图对应的模型更新参数θa;
13、将所述兴趣图输入至所述推荐模型,得到所述兴趣图对应的模型更新参数θr;
14、利用预设的参数更新原则,更新所述模型更新参数θa及模型更新参数θr,并计算所述模型更新参数θa及模型更新参数θr之间的距离,直到所述距离满足预设的阈值,停止参数更新,得到初步更新的推荐模型。
15、可选地,所述参数更新规则optθ如下:
16、
17、
18、其中,为梯度,η是梯度下降的学习率,t为更新次数,f是推荐模型,l是推荐模型的损失,θ是荐模型的模型参数,a代表交互数据,r代表兴趣度。
19、可选地,所述计算所述模型更新参数θa及模型更新参数θr之间的距离,直到所述距离满足预设的阈值,停止参数更新,包括:
20、采用下述函数计算所述模型更新参数θa及模型更新参数θr之间的距离:
21、
22、其中d(·,·)表示如下:
23、
24、
25、其中,是行和列分别为d1和d2的梯度矩阵,和分别交互图和兴趣图对应的第c列梯度矩阵的列向量;
26、当计算出来的距离大于预设的阈值时,返回所述利用预设的参数更新原则,更新所述模型更新参数θa及模型更新参数θr的步骤;
27、当计算出来的距离小于或等于预设的阈值时,输出当前的模型更新参数得到初步更新的推荐模型。
28、可选地,所述利用所述用户表征向量及内容表征向量对所述初步更新的推荐模型进行迭代优化,得到训练完成的推荐模型,包括:
29、步骤a:将所述用户表征向量及内容表征向量拼接,得到拼接向量,并将所述拼接向量依次输入到所述推荐模型的三个全连接层,得到用户对内容的兴趣度;
30、步骤b:利用所述推荐模型的损失函数计算所述兴趣度的损失值;
31、步骤c:根据所述损失值对所述推荐模型的模型参数进行迭代优化,并返回上述的步骤b,直到满足预设的条件时,停止迭代,得到训练完成的推荐模型。
32、可选地,所述得到训练完成的推荐模型之后,所述方法还包括:
33、获取用户与医疗相关的用户行为数据,利用所述训练完成的推荐模型,根据所述用户与医疗相关的用户行为数据,向所述用户推荐医疗相关信息或者药品。
34、为了解决上述问题,本发明还提供一种推荐模型训练装置,所述装置包括:
35、反馈分析模块,用于获取用户数据集及内容数据集,并构建所述用户数据集及内容数据集之间的交互图和兴趣图;
36、初始训练模块,用于利用所述交互图和兴趣图对预构建的推荐模型进行优化训练,得到初步更新的推荐模型;
37、迭代优化训练模块,用于根据所述用户数据集构建用户表征向量,及根据所述内容数据集构建内容表征向量,利用所述用户表征向量及内容表征向量对所述初步更新的推荐模型进行迭代优化,得到训练完成的推荐模型。
38、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
39、至少一个处理器;以及,
40、与所述至少一个处理器通信连接的存储器;其中,
41、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的推荐模型训练方法。
42、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的推荐模型训练方法。
43、本发明实施例利用用户的交互图等显性反馈以及兴趣图等隐性反馈训练推荐模型,可以提高推荐模型的推荐准确率。
1.一种推荐模型训练方法,其特征在于,所述方法包括:
2.如权利要求1所述的推荐模型训练方法,其特征在于,所述构建所述用户数据集及内容数据集之间的交互图和兴趣图,包括:
3.如权利要求1所述的推荐模型训练方法,其特征在于,所述利用所述交互图和兴趣图对预构建的推荐模型进行优化训练,包括:
4.如权利要求3所述的推荐模型训练方法,其特征在于,所述参数更新规则optθ如下:
5.如权利要求4所述的推荐模型训练方法,其特征在于,所述计算所述模型更新参数θa及模型更新参数θr之间的距离,直到所述距离满足预设的阈值,停止参数更新,包括:
6.如权利要求1所述的推荐模型训练方法,其特征在于,所述利用所述用户表征向量及内容表征向量对所述初步更新的推荐模型进行迭代优化,得到训练完成的推荐模型,包括:
7.如权利要求1所述的推荐模型训练方法,其特征在于,所述得到训练完成的推荐模型之后,所述方法还包括:
8.一种推荐模型训练装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的推荐模型训练方法。