本公开涉及互联网,尤其涉及一种直播推荐方法、装置、电子设备及存储介质。
背景技术:
1、直播是一种高即时,强互动的内容展现形式,主播在直播过程中,可以在向观众传达内容的同时与观众进行互动,从而满足用户寻求陪伴、娱乐消遣、打发时间以及获取关注度等业务需求。各大平台通过对直播进行推荐,可以吸引更广泛的用户群体,获得更高的直播点击率。
2、其中,直播推荐是一个典型的多目标场景,在一个用户的行为路径中,可能会经过点击、观看、关注和点赞等行为过程,而且不同行为的发生有先后顺序和依赖关系,每一种行为都可以成为多目标模型里的一个目标。比如,当用户在歌曲播放页的时候,如果点击右上角的直播入口,这时产生点击行为,点击之后会进入到直播间,这时会产生观看行为,观看一段时间后会有一定概率发生各种互动行为,等等。
3、现有技术中,可以采用esmm模型、esmm+fm模型、基于gradnorm的loss融合模型等模型进行直播推荐,但是,上述直播推荐模型的实现过程都较为复杂,而且所确定的待推荐直播能够带来的直播点击率和有效观看率有限,因此直播推荐的效果不佳。
技术实现思路
1、本公开提供一种直播推荐系统、方法、装置、电子设备及存储介质,以至少解决相关技术中直播推荐模型的实现过程都较为复杂,而且所确定的待推荐直播能够带来的直播点击率和有效观看率有限,因此直播推荐的效果不佳的问题。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种直播推荐方法,包括:
3、获取每个直播流的用户特征数据及行为数据;
4、将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
5、对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
6、按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
7、根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
8、可选地,所述将所述用户特征数据与所述行为数据进行关联,得到流式样本数据,包括:
9、获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
10、基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
11、从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
12、在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
13、将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
14、可选地,所述对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口,包括:
15、通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
16、在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
17、可选地,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率之前,包括:
18、对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
19、可选地,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率,包括:
20、基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
21、将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
22、可选地,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
23、根据本公开实施例的第二方面,提供一种直播推荐装置,包括:
24、获取模块,用于获取每个直播流的用户特征数据及行为数据;
25、关联模块,用于将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
26、确定模块,用于对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
27、处理模块,用于按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
28、推荐模块,用于根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
29、可选地,所述获取模块,用于:
30、获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
31、基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
32、从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
33、在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
34、将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
35、可选地,所述确定模块,用于:
36、通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
37、在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
38、可选地,所述确定模块,用于:
39、对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
40、可选地,所述处理模块,用于:
41、基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
42、将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
43、可选地,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
44、根据本公开实施例的第三方面,提供一种直播推荐电子设备,包括:
45、处理器;
46、用于存储所述处理器可执行指令的存储器;
47、其中,所述处理器被配置为执行所述指令,以实现所述任一项所述的直播推荐方法。
48、根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由直播推荐电子设备的处理器执行时,使得直播推荐电子设备能够执行所述任一项所述的直播推荐方法。
49、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述任一项所述的直播推荐方法。
50、本公开的实施例提供的技术方案至少带来以下有益效果:
51、获取每个直播流的用户特征数据及行为数据;将用户特征数据与行为数据进行关联,得到流式样本数据;对任意两个流式样本数据进行关联运算,确定流式样本数据之间的时间窗口;按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率;根据预估推荐率,从流式样本数据中确定待推荐样本,对待推荐样本对应的直播流进行推荐。
52、这样,提出一种基于mmoe多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
53、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。