社区内容的探测方法及装置与流程

文档序号:35671946发布日期:2023-10-07 21:07阅读:52来源:国知局
社区内容的探测方法及装置与流程

本公开涉及数据处理,尤其涉及社区内容的探测方法及装置。


背景技术:

1、每当用户打开微店有推荐请求时,系统会根据用户的top-3偏好标签,去获取标签对应的所有需要探测的内容;系统还会获取探测时间过长的内容;然后对内容进行分组,其中,第一组为m个长期未探测完成的内容,根据点击率从高到低排序,第二组为用户的top-3偏好标签对应的内容,根据点击率从高到低排序,在曝光时,优先曝光第一组,当第一组曝光过了或者第一组不存在,再曝光第二组,其中,第一组是随机探测(因为和用户偏好标签不一定匹配),第二组是精准探测。

2、但这种探测方式,会使得部分标签下的内容探测完成很慢,且大部分成为随机探测,点击率低,即又慢又不准。

3、因此,如何提升社区内容的探测准确率和速度成为亟待解决的问题。


技术实现思路

1、为克服相关技术中存在的问题,本公开实施例提供社区内容的探测方法及装置。所述技术方案如下:

2、根据本公开实施例的第一方面,提供一种社区内容的探测方法,包括:

3、在接收到当前用户的推荐请求后,获取所述当前用户的第一偏好标签;

4、获取多个在第一预设时长内未完成探测的第一内容标签;

5、获取完成各个第一标签探测还需要的第一流量,以及,在第二预设时长内完成探测所需要的离线的流量预估;所述第一标签为所述第一偏好标签和所述第一内容标签中的标签;

6、将所述第一内容标签作为第一曝光组,并将所述第一组曝光组中的标签按照时间从远到近排序;将所述流量预估小于所述第一流量的标签作为第二曝光组,并将所述第二曝光组中的标签按照时间从远到近排序;将其他偏好标签和其他第一内容标签作为第三曝光组,并将所述第三曝光组中的标签按照点击率从高到低排序;

7、依次曝光每一个曝光组中的各个标签。

8、本公开是关于社区内容的探测方法及装置。该方法包括:在接收到当前用户的推荐请求后,获取当前用户的第一偏好标签;获取多个在第一预设时长内未完成探测的第一内容标签;获取完成各个第一标签探测还需要的第一流量,以及,在第二预设时长内完成探测所需要的离线的流量预估;第一标签为第一偏好标签和第一内容标签中的标签;将第一内容标签作为第一曝光组,并将第一组曝光组中的标签按照时间从远到近排序;将流量预估小于第一流量的标签作为第二曝光组,并将第二曝光组中的标签按照时间从远到近排序;将其他偏好标签和其他第一内容标签作为第三曝光组,并将第三曝光组中的标签按照点击率从高到低排序;依次曝光每一个曝光组中的各个标签。其中,在新内容的探测阶段,结合不同标签的流量预估,调整探测的优先级,更为合理充分的利用了不同的流量(提高预估流量不足内容的探测优先级),对流量进行合理的分配,对内容进行快速而准确的曝光,从而很好的权衡了不同品类的探测准确率和探测速度。

9、在一个实施例中,所述获取完成各个第一标签在第二预设时长内完成探测所需要的离线的流量预估,包括:

10、获取不同日期的各个预设历史时间段内各个第二标签的实际曝光次数;所述第二标签中包括所述第一标签;

11、根据各个所述第二标签的实际曝光次数获取所述不同日期的预设历史时间段的流量预估;

12、根据各个所述第二标签在各个所述不同日期的预设历史时间段的流量预估获取各个所述第一标签在所述第二预设时长内完成探测所需要的离线的流量预估。

13、在一个实施例中,所述获取不同日期的各个预设历史时间段内各个第二标签的实际曝光次数,包括:

14、获取所述不同日期的各个预设历史时间段内多个历史用户的前n个偏好标签;

15、获取所述不同日期的各个预设历史时间段内每个所述历史用户的前n个偏好标签中所有所述第二标签对应的全部实际曝光次数;

16、根据所述不同日期的各个预设历史时间段内每个所述历史用户的前n个偏好标签中所有所述第二标签对应的全部实际曝光次数,获取每个所述历史用户的前n个偏好标签中各个所述第二标签对应的实际曝光次数;

17、将相同的所述预设历史时间段内不同的所述历史用户对应的相同的所述第二标签的实际曝光次数之和作为所述预设历史时间段内所述第二标签对应的实际曝光次数。

18、在一个实施例中,所述根据所述不同日期的各个预设历史时间段内每个所述历史用户的前n个偏好标签中所有所述第二标签对应的全部实际曝光次数,获取每个所述历史用户的前n个偏好标签中各个所述第二标签对应的实际曝光次数,包括:

19、将所述不同日期的相同预设历史时间段内每个所述历史用户的前n个偏好标签中所有所述第二标签对应的全部实际曝光次数除以n,获取每个所述历史用户的每个所述第二标签对应的实际曝光次数。

20、在一个实施例中,所述根据各个所述第二标签的实际曝光次数获取所述不同日期的预设历史时间段的流量预估,包括:

21、根据所述不同日期的各个预设历史时间段的权重和各个所述第二标签的实际曝光次数,获取所述不同日期的各个预设历史时间段内各个所述第二标签的理论流量;其中,距离当前时间越接近,权重值越大;

22、根据所述不同日期的各个相同预设历史时间段对应的权重,以及,所述不同日期的各个相同预设历史时间段对应的相同的所述第二标签的理论流量,获取各个所述预设历史时间段对应的各个所述第二标签的流量预估。

23、在一个实施例中,所述获取各个所述预设历史时间段对应的各个所述第二标签的流量预估之后,还包括:

24、获取线上第一预设时间段内各个所述第二标签的实际流量;

25、根据所述流量预估和所述实际流量修正所述第一预设时间段之后的各个所述预设时间段的流量预估。

26、在一个实施例中,所述根据所述流量预估和所述实际流量修正所述第一预设时间段之后的各个所述预设时间段的流量预估,包括:

27、将所述第一预设时间段内各个所述第二标签对应的差距倍率进行线性拟合,得到回归函数,所述第一预设时间段内各个所述第二标签对应的差距倍率为所述第二标签对应的流量预估和所述第二标签对应的实际流量的比值;

28、根据所述回归函数获取所述第一预设时间段之后的各个预设时间段的修正系数;

29、根据所述第一预设时间段之后的各个所述预设时间段的修正系数修正所述第一预设时间段之后的各个所述预设时间段的流量预估。

30、根据本公开实施例的第二方面,提供一种社区内容的探测装置,包括:

31、第一获取模块,用于在接收到当前用户的推荐请求后,获取所述当前用户的第一偏好标签;

32、第二获取模块,用于获取多个在第一预设时长内未完成探测的第一内容标签;

33、第三获取模块,用于获取完成各个第一标签探测还需要的第一流量,以及,在第二预设时长内完成探测所需要的离线的流量预估;所述第一标签为所述第一偏好标签和所述第一内容标签中的标签;

34、分组模块,用于将所述第一内容标签作为第一曝光组,并将所述第一组曝光组中的标签按照时间从远到近排序;将所述流量预估小于所述第一流量的标签作为第二曝光组,并将所述第二曝光组中的标签按照时间从远到近排序;将其他偏好标签和其他第一内容标签作为第三曝光组,并将所述第三曝光组中的标签按照点击率从高到低排序;

35、曝光模块,用于依次曝光每一个曝光组中的各个标签。

36、根据本公开实施例的第三方面,提供一种社区内容的探测装置,包括:

37、处理器;

38、用于存储处理器可执行指令的存储器;

39、其中,所述处理器被配置为:

40、在接收到当前用户的推荐请求后,获取所述当前用户的第一偏好标签;

41、获取多个在第一预设时长内未完成探测的第一内容标签;

42、获取完成各个第一标签探测还需要的第一流量,以及,在第二预设时长内完成探测所需要的离线的流量预估;所述第一标签为所述第一偏好标签和所述第一内容标签中的标签;

43、将所述第一内容标签作为第一曝光组,并将所述第一组曝光组中的标签按照时间从远到近排序;将所述流量预估小于所述第一流量的标签作为第二曝光组,并将所述第二曝光组中的标签按照时间从远到近排序;将其他偏好标签和其他第一内容标签作为第三曝光组,并将所述第三曝光组中的标签按照点击率从高到低排序;

44、依次曝光每一个曝光组中的各个标签。

45、根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一项所述方法的步骤。

46、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1