本发明属于短视频推荐领域,具体的说是一种自适应加权的短视频推荐方法、电子设备和存储介质。
背景技术:
1、由于用户时间碎片化、移动互联网和智能手机的快速普及、制作门槛低等原因,短视频最近几年引起广泛关注。短视频能够抢占用户注意力和流量的关键是短视频平台可以根据用户的喜好进行精准的视频推荐。然而推荐系统对于小众用户的推荐准确率却并不理想,这导致了短视频平台的活跃用户数下降和用户流失等问题。因此,提升小众用户推荐准确率已经成为短视频平台关心的重要问题。
技术实现思路
1、本发明是为了解决上述现有技术存在的不足之处,提出一种自适应加权的短视频推荐方法、电子设备和存储介质,以期能通过自适应地给容易被错分的样本赋予更高的权重,从而在不影响整体推荐性能的情况下提升对小众用户的推荐准确率,进而能有效提升用户存留率和活跃度。
2、本发明为达到上述发明目的,采用如下技术方案:
3、本发明一种自适应加权的短视频推荐方法的特点在于,包括以下步骤:
4、s1、根据用户观看热门短视频的占比,将用户划分为大众用户和小众用户,并获取大众用户和小众用户分别与短视频的历史交互记录并输入预训练的全连接神经网络中进行特征提取,得到大众用户的样本特征集合以及小众用户的样本特征集合其中,ui表示第i条大众用户的样本(ui,ci)中的大众用户特征,ci表示第i条大众用户的样本(ui,ci)中的视频特征;i=1,2,…,n,n表示大众用户的样本总数;u′j表示第j条小众用户的样本(u′j,c′j)中的小众用户特征,c′j表示第j条小众用户的样本(u′j,c′j)中的视频特征,j=1,2,…,m,m表示小众用户的样本总数;
5、s2、构建两个三层的全连接神经网络组成的双塔模型,并将大众用户的样本特征集合以及小众用户的样本特征集合分别输入所述双塔模型中,并相应输出大众用户样本的高阶特征集合以及小众用户样本的高阶特征集合为其中,pi表示第i条大众用户的样本(pi,qi)中的大众用户高阶特征,qi表示第i条大众用户的样本(pi,qi)中的视频高阶特征,p′j表示第j条小众用户的样本(p′j,q′j)中的小众用户高阶特征,q′j表示第j条小众用户的样本(p′j,q′j)中的视频高阶特征。
6、s3、利用式(1)构建双塔模型的交叉熵损失l:
7、
8、式(1)中,表示pi的转置,表示p′j的转置,yi表示第i条大众用户的样本(ui,ci)的标签,y′j表示第i条大众用户的样本(ui,ci)的标签;
9、s4、利用梯度下降法对所述双塔模型进行预训练,并计算所述交叉熵损失l以更新模型参数,直到交叉熵损失l收敛为止,从而得到预训练后的双塔模型;
10、s5、对预训练后的双塔模型的更新:
11、s5.1、定义当前迭代次数为t,并初始化t=1;将预训练后的双塔模型作为第t次迭代的双塔模型;
12、利用式(2)计算第t次迭代中第i条大众用户的样本(ui,ci)的权重
13、
14、式(2)中,α是一个取值范围在[1,10]之间的参数,表示第t次迭代中第i条大众用户的样本(ui,ci)的交叉熵损失,并由式(3)得到;
15、
16、式(3)中,β是一个取值在[0.1,0.2]的参数;表示第t次迭代中第i条大众用户的样本(pi,qi)中的大众用户高阶特征,表示第t次迭代中第i条大众用户的样本(pi,qi)中的视频高阶特征,表示的转置,当t=1时,令第t-1次迭代中第i条大众用户的样本(ui,ci)的交叉熵损失
17、利用式(4)计算第t次迭代中第j条小众用户的样本(u′j,c′j)的权重
18、
19、式(4)中,表示第t次迭代中第j条小众用户的样本(u′j,c′j)的交叉熵损失,并由式(5)得到;
20、
21、式(5)中,表示第t次迭代中第j条小众用户的样本(p′j,q′j)中的小众用户高阶特征,表示第t次迭代中第j条小众用户的样本(p′j,q′j)中的视频高阶特征,表示的转置,当t=1时,令第t-1次迭代中第第j条小众用户的样本(u′j,c′j)的交叉熵损失
22、利用式(7)构建第t次迭代的加权损失函数lt:
23、
24、s5.4、利用梯度下降法对第t次迭代的双塔模型进行训练,并最小化加权损失函数lt以更新第t次迭代的双塔模型的参数;
25、s5.5、将t+1赋值给t后,返回步骤s5.2顺序执行,直至t达到最大迭代次数tmax为止,从而得到更新后的双塔模型;
26、s7、将任一用户的高阶特征集合和所有视频的高阶特征集合输入更新后的双塔网络中进行处理,并输出用户对所有视频的评分,从而选取评分最高的前top个视频推荐给相应用户。
27、本发明一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行所述短视频推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
28、本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行所述短视频推荐方法的步骤。
29、与现有技术相比,本发明的有益效果在于:
30、1、本发明能够随模型参数更新自适应地计算出每个样本的最优权重,相比于直接赋权的方法得到的权重更加精准,从而可以大幅度提升模型对于小众用户的推荐准确率。
31、2、本发明在样本级别对容易被错分的样本进行了细粒度的加权,给容易被错分的样本赋予了更高的权重,让模型可以更加关注用户对不同视频的兴趣偏好程度的差异,从而可以更加精确地学习用户和视频的交互关系,实现了更好的推荐准确率。
32、3、本发明结合用户的长期基本属性特征和近期兴趣特征,通过全连接神经网络对用户的长期基本特征和近期兴趣特征向量进行向量化,并将二者拼接作为用户的隐特征,从而更加真实全面的反应用户的个性化偏好,提升了模型对所有用户的推荐准确率。
33、4、本发明基于双塔深度神经网络模型,并根据样本被分错的概率给每个样本计算了权重,设计了加权的损失函数,采用随机梯度下降不断优化模型参数,从而能够在保证整体推荐准确率的情况下为小众用户提供更加准确的推荐。
1.一种自适应加权的短视频推荐方法,其特征在于,包括以下步骤:
2.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1所述短视频推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
3.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1所述短视频推荐方法的步骤。