负样本确定方法、装置、介质及电子设备与流程

文档序号:33952724发布日期:2023-04-26 12:56阅读:43来源:国知局
负样本确定方法、装置、介质及电子设备与流程

本公开涉及电子信息,具体地,涉及一种负样本确定方法、装置、介质及电子设备。


背景技术:

1、在对象的推送场景中,通常是利用推送至用户且用户点击了的对象作为正样本,利用推送至用户且用户未点击的对象作为负样本,并将正负样本用于模型训练,以利用训练好的模型进行推送。

2、然而,在实际推送场景中,由于各种原因可能导致用户并没有关注到推送的对象,用户也就无法对该对象进行点击,若直接利用推送至用户且用户未点击的对象作为负样本并将该负样本用于模型的训练,会导致模型的负样本中充斥着大量的假负样本,即用户未点击推送的对象并不是因为不对该对象感兴趣,而是并没有关注到推送的对象,利用这样的假负样本对模型进行训练会导致训练的模型很难学习到用户对各类对象的兴趣程度,从而影响模型在实际应用中的推送效果。


技术实现思路

1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、第一方面,本公开提供一种负样本确定方法,包括:

3、获取负样本集合,其中,所述负样本集合中的负样本为用户未点击的第一样本推送消息;

4、采用训练好的样本分类模型,确定所述负样本集合中的各负样本是否合格,其中,所述样本分类模型用于将用户能够关注到的第一样本推送消息确定为合格的负样本;

5、至少将所述负样本集合中合格的负样本作为用于训练推荐模型的负样本,其中,训练完成的推荐模型用于预测目标用户对待推送消息的点击率。

6、第二方面,本公开提供一种负样本确定装置,包括:

7、获取模块,用于获取负样本集合,其中,所述负样本集合中的负样本为用户未点击的第一样本推送消息;

8、第一确定模块,用于采用训练好的样本分类模型,确定所述负样本集合中的各负样本是否合格,其中,所述样本分类模型用于将用户能够关注到的第一样本推送消息确定为合格的负样本;

9、第二确定模块,用于至少将所述负样本集合中合格的负样本作为用于训练推荐模型的负样本,其中,训练完成的推荐模型用于预测目标用户对待推送消息的点击率。

10、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面中所述方法的步骤。

11、第四方面,本公开提供一种电子设备,包括:

12、存储装置,其上存储有计算机程序;

13、处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中所述方法的步骤。

14、通过上述技术方案,由于用户能够关注到且未点击的推送消息可以反映用户对该推送消息不感兴趣,因此,通过样本分类模型将用户能够关注到的第一样本推送消息确定为合格的负样本,在此基础上,将负样本集合中合格的负样本作为用于训练推荐模型的负样本,如此,可以降低用于训练推荐模型的假负样本的数量,从而提高推荐模型在实际应用中预估目标用户对待推送消息的点击率的准确率,进而提升推荐模型在实际应用中的预估效果。

15、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。



技术特征:

1.一种负样本确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述样本分类模型通过以下方式训练:

4.根据权利要求3所述的方法,其特征在于,所述预设规则包括以下至少一项:

5.根据权利要求1所述的方法,其特征在于,所述采用训练好的样本分类模型,确定所述负样本集合中的各负样本是否合格,包括:

6.根据权利要求5所述的方法,其特征在于,所述用户特征包括用户属性特征和用户行为统计特征,所述消息特征包括上下文特征。

7.一种负样本确定装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-6中任一项所述方法的步骤。

10.一种电子设备,其特征在于,包括:


技术总结
本公开涉及一种负样本确定方法、装置、介质及电子设备,方法包括:获取负样本集合,其中,所述负样本集合中的负样本为用户未点击的第一样本推送消息;采用训练好的样本分类模型,确定所述负样本集合中的各负样本是否合格,其中,所述样本分类模型用于将用户能够关注到的第一样本推送消息确定为合格的负样本;至少将所述负样本集合中合格的负样本作为用于训练推荐模型的负样本,其中,训练完成的推荐模型用于预测目标用户对待推送消息的点击率,提升推荐模型在实际应用中的预估效果。

技术研发人员:刘宇
受保护的技术使用者:抖音视界有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1