推荐方法、介质、装置和计算设备与流程

文档序号:28168176发布日期:2021-12-24 23:02阅读:99来源:国知局
推荐方法、介质、装置和计算设备与流程

1.本公开的实施方式涉及互联网技术领域,更具体地,本公开的实施方式涉及一种推荐方法、介质、装置和计算设备。


背景技术:

2.本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.音视频应用能够为用户提供歌曲收听、视频观看等服务。在音视频应用中,如果能在海量的歌曲或视频中有效筛选出能够获得大量用户喜爱的爆款内容,就能够提高音视频应用的使用率,并能为音视频应用带来大量的新用户。
4.目前进行爆款内容筛选的方案,主要是在平台上小范围的展示内容,用户可以在平台上观看、点赞或分享。然后系统根据内容的有效播放率、点赞率等进行判断,从而在海量内容中确定有潜力成为爆款内容。
5.上述方式可能会导致一些优质内容在初期因为有效播放率低、点赞率低等原因被淘汰,使得爆款内容筛选的准确性较低,从而对音视频应用的使用率和拉新产生不利影响。


技术实现要素:

6.本公开实施例提供一种推荐方法、介质、装置和计算设备,以解决部分优质内容由于播放率和点赞率低等外部原因无法成为被推荐的爆款内容,不利于音视频应用的使用率提升和拉新的问题。
7.第一方面,本公开实施例提供一种推荐方法,包括:
8.获取多个对象的属性信息;
9.根据爆款潜力预估模型对各所述对象的属性信息进行处理,得到各所述对象的潜力预估值,所述潜力预估值用于指示所述对象的爆款潜力;
10.根据所述潜力预估值,在所述多个对象中确定在全站推荐的目标对象。
11.在一种可能的实施方式中,所述爆款潜力预估模型包括预处理模块和全连接模块;针对所述多个对象中的任意一个对象,根据爆款潜力预估模型对所述对象的属性信息进行处理,得到所述对象的潜力预估值,包括:
12.根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量;
13.对所述对象的各属性信息对应的特征向量进行合并处理,得到所述对象的合成特征向量;
14.根据所述全连接模块对所述合成特征向量进行处理,得到所述对象的潜力预估值。
15.在一种可能的实施方式中,所述属性信息包括音频;所述音频对应的预处理模块包括音频抽取层和音频特征提取层;所述根据各所述属性信息对应的预处理模块,对所述
对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量,包括:
16.根据音频抽取层对所述音频进行抽取操作,获取多个音频关键帧;
17.根据音频特征提取层对所述多个音频关键帧处理,得到所述音频对应的特征向量。
18.在一种可能的实施方式中,所述属性信息包括视频帧;所述视频帧对应的预处理模块包括卷积神经网络和长短期记忆人工神经网络;所述根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量,包括:
19.根据所述卷积神经网络获取所述视频帧的图像特征;
20.根据所述长短期记忆人工神经网络对所述视频帧的图像特征进行处理,得到所述视频帧对应的特征向量。
21.在一种可能的实施方式中,所述属性信息包括文本;所述文本对应的预处理模块包括分词层和词向量提取层;所述根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量,包括:
22.根据所述分词层对所述文本进行分词处理,得到多个分词;
23.根据所述词向量提取层,获取所述多个分词的词向量;
24.对所述多个分词的词向量进行融合,得到所述文本对应的特征向量。
25.在一种可能的实施方式中,所述属性信息包括封面图像;所述封面图像对应的预处理模块包括残差网络模型;所述根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量,包括:
26.根据所述残差网络模型对所述封面图像进行特征提取,得到所述封面图像对应的特征向量。
27.在一种可能的实施方式中,所述全连接模块中包括多个全连接层;所述根据所述全连接模块对所述合成特征向量进行处理,得到所述对象的潜力预估值,包括:
28.针对任意一个全连接层,根据所述全连接层的参数对所述全连接层的输入进行加权求和处理,并根据激活函数对加权求和处理后的结果进行映射处理,得到所述全连接层的输出;
29.根据所述全连接模块中的最后一个全连接层的输出,得到多个分值,所述多个分值包括播放分值、点赞分值、分享分值、流行持久度分值和流行爆发度分值中的至少一个;
30.根据所述分值和每个分值的权重值,获取所述对象的潜力预估值。
31.在一种可能的实施方式中,所述根据所述潜力预估值,在所述多个对象中确定在全站推荐的目标对象,包括:
32.根据所述潜力预估值,对所述多个对象进行筛选,确定初级流量池中的对象;
33.对所述初级流量池中的对象进行多级流量分发,确定各流量池的下一级流量池中的对象;
34.在最后一级流量分发结束后的剩余的对象中计算剩余的对象对应的推曝价值;
35.根据所述推曝价值,在所述剩余的对象中确定在全站待推荐的所述目标对象。
36.在一种可能的实施方式中,所述对所述初级流量池中的对象进行多级流量分发,确定各流量池的下一级流量池中的对象,包括:
37.在每一级的流量池中,获取用户特征向量;
38.将所述用户特征向量、对应的流量池中的各对象的潜力预估值和合成特征向量进行融合处理,得到各对象对应的融合值;
39.根据所述融合值对对应的流量池中的各所述对象进行排序,并根据所述排序结果对各所述对象进行分发;
40.根据分发后获得的反馈数据,对各所述对象进行筛选,确定对应的流量池的下一级流量池中的对象。
41.在一种可能的实施方式中,所述根据分发后获得的反馈数据,对各所述对象进行筛选,确定对应的流量池的下一级流量池中的对象,包括:
42.获取预设时间段内各所述对象对应的内容实时点赞率和完播率;
43.将实时点赞率大于或等于第一阈值、完播率大于或等于第二阈值以及潜力预估值大于或等于第三阈值的对象,确定为所述下一级流量池中的对象。
44.在一种可能的实施方式中,所述在最后一级流量分发结束后的剩余的对象中计算剩余的对象对应的推曝价值,包括:
45.确定处于最后一级流量池中的各第一对象;
46.获取各第一对象对应的推曝参数;
47.根据所述推曝参数计算所述各第一对象对应的推曝价值。
48.第二方面,本公开实施例提供一种推荐装置,包括:
49.获取模块,用于获取多个对象的属性信息;
50.处理模块,用于根据爆款潜力预估模型对各所述对象的属性信息进行处理,得到各所述对象的潜力预估值,所述潜力预估值用于指示所述对象的爆款潜力;
51.确定模块,用于根据所述潜力预估值,在所述多个对象中确定在全站推荐的目标对象。
52.在一种可能的实施方式中,所述爆款潜力预估模型包括预处理模块和全连接模块;针对所述多个对象中的任意一个对象,所述处理模块具体用于:
53.根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量;
54.对所述对象的各属性信息对应的特征向量进行合并处理,得到所述对象的合成特征向量;
55.根据所述全连接模块对所述合成特征向量进行处理,得到所述对象的潜力预估值。
56.在一种可能的实施方式中,所述属性信息包括音频;所述音频对应的预处理模块包括音频抽取层和音频特征提取层;所述处理模块具体用于:
57.根据音频抽取层对所述音频进行抽取操作,获取多个音频关键帧;
58.根据音频特征提取层对所述多个音频关键帧处理,得到所述音频对应的特征向量。
59.在一种可能的实施方式中,所述属性信息包括视频帧;所述视频帧对应的预处理模块包括卷积神经网络和长短期记忆人工神经网络;所述处理模块具体用于:
60.根据所述卷积神经网络获取所述视频帧的图像特征;
61.根据所述长短期记忆人工神经网络对所述视频帧的图像特征进行处理,得到所述视频帧对应的特征向量。
62.在一种可能的实施方式中,所述属性信息包括文本;所述文本对应的预处理模块包括分词层和词向量提取层;所述处理模块具体用于:
63.根据所述分词层对所述文本进行分词处理,得到多个分词;
64.根据所述词向量提取层,获取所述多个分词的词向量;
65.对所述多个分词的词向量进行融合,得到所述文本对应的特征向量。
66.在一种可能的实施方式中,所述属性信息包括封面图像;所述封面图像对应的预处理模块包括残差网络模型;所述处理模块具体用于:
67.根据所述残差网络模型对所述封面图像进行特征提取,得到所述封面图像对应的特征向量。
68.在一种可能的实施方式中,所述全连接模块中包括多个全连接层;所述处理模块具体用于:
69.针对任意一个全连接层,根据所述全连接层的参数对所述全连接层的输入进行加权求和处理,并根据激活函数对加权求和处理后的结果进行映射处理,得到所述全连接层的输出;
70.根据所述全连接模块中的最后一个全连接层的输出,得到多个分值,所述多个分值包括播放分值、点赞分值、分享分值、流行持久度分值和流行爆发度分值中的至少一个;
71.根据所述分值和每个分值的权重值,获取所述对象的潜力预估值。
72.在一种可能的实施方式中,所述确定模块具体用于:
73.根据所述潜力预估值,对所述多个对象进行筛选,确定初级流量池中的对象;
74.对所述初级流量池中的对象进行多级流量分发,确定各流量池的下一级流量池中的对象;
75.在最后一级流量分发结束后的剩余的对象中计算剩余的对象对应的推曝价值;
76.根据所述推曝价值,在所述剩余的对象中确定在全站待推荐的所述目标对象。
77.在一种可能的实施方式中,所述确定模块具体用于:
78.在每一级的流量池中,获取用户特征向量;
79.将所述用户特征向量、对应的流量池中的各对象的潜力预估值和合成特征向量进行融合处理,得到各对象对应的融合值;
80.根据所述融合值对对应的流量池中的各所述对象进行排序,并根据所述排序结果对各所述对象进行分发;
81.根据分发后获得的反馈数据,对各所述对象进行筛选,确定对应的流量池的下一级流量池中的对象。
82.在一种可能的实施方式中,所述确定模块具体用于:
83.获取预设时间段内各所述对象对应的内容实时点赞率和完播率;
84.将实时点赞率大于或等于第一阈值、完播率大于或等于第二阈值以及潜力预估值大于或等于第三阈值的对象,确定为所述下一级流量池中的对象。
85.在一种可能的实施方式中,所述确定模块具体用于:
86.确定处于最后一级流量池中的各第一对象;
87.获取各第一对象对应的推曝参数;
88.根据所述推曝参数计算所述各第一对象对应的推曝价值。
89.第三方面,本公开实施例提供一种计算设备,包括:至少一个处理器和存储器;
90.所述存储器存储计算机执行指令;
91.所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的推荐方法。
92.第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的推荐方法。
93.第五方面,本公开实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序;所述计算机程序被执行时实现第一方面任一项所述的推荐方法。
94.本公开实施例提供的推荐方法、介质、装置和计算设备,首先获取多个对象的属性信息,然后根据爆款潜力预估模型对各对象的属性信息进行处理,得到各对象的潜力预估值,其中潜力预估值指示了对应的对象的爆款潜力,因此,基于潜力预估值可以在多个对象中确定在全站推荐的目标对象。本公开实施例的方案,是通过获取对象的属性信息,并基于属性信息筛选出目标对象的,由于属性信息指示的是对象本身的特征,因此,能有效减少由于初期播放率等外部数据对于对象的筛选的影响,提高对象筛选的准确性,使得优质的对象最终能作为目标对象在全站进行推荐。
附图说明
95.通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
96.图1为本公开实施例提供的一种应用场景示意图;
97.图2为本公开实施例提供的推荐方法的流程示意图;
98.图3为本公开实施例提供的属性信息处理流程示意图;
99.图4为本公开实施例提供的爆款潜力预估模型处理示意图;
100.图5为本公开实施例提供的一种残差网络模型的结构示意图;
101.图6为本公开实施例提供的多级流量池筛选示意图;
102.图7为本公开实施例提供的多级流量筛选流程示意图;
103.图8为本公开实施例提供的分发界面示意图;
104.图9为本公开实施例提供的视频推荐示意图;
105.图10为本公开实施例提供的歌曲推荐示意图;
106.图11为本公开实施例提供的一种推荐装置的结构示意图;
107.图12为本公开实施例提供的程序产品示意图;
108.图13为本公开实施例提供的一种计算设备的结构示意图。
109.在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
110.下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
111.本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
112.根据本公开的实施方式,提出了一种推荐方法、介质、装置和计算设备。
113.下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
114.首先对本公开实施例涉及的基本概念进行介绍。
115.爆款:在商品销售中通常指人气很高,销售很好的商品,在互联网对象(内容)分发中,指的是某些在较短的时间内被用户广泛传播、点赞、播放的对象(内容)。
116.多模态机器学习:通过机器学习的方式处理和理解音频、视频、图像、文本等多源模态信息的学习方式。
117.多层感知器(multilayer perceptron,简称mlp):又称人工神经网络,多层感知器由输入层,隐藏层和输出层组成,层与层之间是全连接的。
118.基于内容的协同过滤(content

based to collaborative filtering,简称cb2cf):可以融合多模态特征生成嵌入(embedding)向量,然后将各特征向量拼接成一个合成向量,经过mlp输出一个与协同过滤(collaborative filtering,简称cf)embedding相同维度的向量,通过最小化其与cf embedding的均方误差(mean square error,简称mse)损失进行训练。
119.迁移学习:指的是运用已有的知识来学习新的知识,核心是找到已有知识和新知识之间的相似性。在迁移学习中,已有的知识叫做源域(source domain),要学习的新知识叫目标域(target domain)。
120.微调网络(fine

tuning):不同于从头训练一个新的网络,训练开始参数都被随机初始化,而微调网络可以在imagenet(是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库,能够从图片识别物体)上1000类分类训练好的参数的基础上,根据不同的分类识别任务进行小幅度的参数调整,使其可以使用于不同的问题。
121.yamnet模型:一个深度网络模型,采用mobilenet_v1(一个开源模型)深度可分离卷积架构,可以预测audioset

youtube(一个开放的音频数据集)语料库中521个音频事件类。
122.应用场景总览
123.图1为本公开实施例提供的一种应用场景示意图,如图1所示,包括服务器10、用户甲的客户端11、用户乙的客户端12和用户丙的客户端13。
124.服务器10用于在海量的对象中,确定有较大可能成为爆款的目标对象,然后在全站推荐该目标对象。目标对象的数量可以是一个或多个,目标对象例如可以是音频、视频等等。
125.以目标对象为歌曲“好日子”为例,服务器10在确定爆款歌曲“好日子”之后,会在
全站推荐该歌曲,其中,全站可以是各种不同的应用程序,还可以是一个应用程序中的不同的版面。
126.例如在图1中,服务器在某个音视频应用程序的不同的版面上推荐该歌曲。如图1中的客户端11示例,在音视频应用程序的首页面上推荐展示了歌曲“好日子”,用户甲可以在进入首页面后查看到该歌曲,进一步的,还可以点击收听该歌曲,或者点赞、评论等等。
127.如图1中的客户端12示例,在音视频应用程序的歌曲榜上也可以推荐展示该歌曲。当用户乙想要听优质好歌时,可以进入歌曲榜页面,从而可以查看到该歌曲,并可以进一步的点击收听、点赞、评论等等。
128.如图1中的客户端13示例,在音视频应用程序的个性化推荐页面上也可以推荐展示该歌曲。当用户丙打开个性化推荐页面时,可以查看到该歌曲,并可以点击收听、点赞、评论等等。
129.在全站推荐目标对象后,目标对象有了较大的曝光量,大量的用户可以在客户端上查看到目标对象。如果目标对象的内容优质,有较大比例的用户喜欢,则通过这部分用户的点赞、评论、分享等操作,使得目标对象进一步展示给更多其他的用户,形成良性循环,为音视频应用程序的打开率的提升和吸引新的用户提供助力。相反,如果目标对象不能够被大量用户喜欢,则在全站推荐目标对象后,用户的点赞、评论、分享的数据有限,通过这部分用户将目标对象进一步传播给其他的用户的数量也有限,对音视频应用程序的打开率的提升和吸引新的用户的助力有限。因此,如何在大量的对象中较准确的选择出优质的目标对象,对后续音视频应用程序的打开率的提升和吸引新的用户十分重要。
130.发明概述
131.随着计算机技术的发展,越来越多的对象(即内容资源)不断涌现,用户也可以通过互联网平台接触到各式各样的对象,例如,可以在音乐应用上查看到大量的歌曲、视频等,可以在视频应用上查看到大量的视频片段等。
132.由于对象较多而用户能够接触到的平台有限,因此,需要在海量的对象中筛选出具有爆款潜力的内容资源,并在各个平台上进行推荐,迅速成为爆款,从而提高各平台的打开率,也为平台吸引更多的新用户。
133.目前的爆款对象的筛选机制,主要是先小范围的在一些平台上进行推荐,然后获取各对象的播放率、点赞率、评论率等数据,根据这些数据对对象进行筛选。
134.由于推荐系统的复杂性,有些对象在一开始的分发中的播放率、点赞率、评论率等数据不太理想,但是在曝光量扩大后的转化结果会逐渐上升。上述筛选机制会将这部分优质的对象筛选出去,筛选的准确性较低,导致各平台的打开率较低,也不利于平台的拉新。
135.基于此,本公开实施例提供一种推荐方法,以在海量的对象中准确的筛选出具有爆款潜力的对象,并进行全站推荐,以提高平台的打开率和服务于平台的拉新。
136.示例性方法
137.下面结合图1的应用场景,参考图2来描述根据本公开示例性实施方式的推荐方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
138.图2为本公开实施例提供的推荐方法的流程示意图,如图2所示,该方法可以包括:
139.s21,获取多个对象的属性信息。
140.本公开实施例中的执行主体例如可以为服务器、终端设备等等。对象指的是内容资源,例如可以为视频、音频等等。其中,视频例如可以包括mv、短视频、视频片段等形式,音频例如可以包括歌曲等形式。
141.对象的属性信息指的是对象本身的特征,以mv为例,mv的属性信息例如可以包括mv中的图像、mv的音频、mv对应的艺人,等等。
142.s22,根据爆款潜力预估模型对各对象的属性信息进行处理,得到各对象的潜力预估值,潜力预估值用于指示对象的爆款潜力。
143.爆款潜力预估模型是用于预估对象的爆款潜力的。在使用爆款潜力预估模型对各对象的属性信息处理之前,首先要进行爆款潜力预估模型的训练。具体的,首先获取训练样本,训练样本中包括样本对象以及样本对象的样本潜力预估值。然后,通过爆款潜力预估模型对样本对象的属性信息处理,得到爆款潜力预估模型输出的潜力预估值,根据该潜力预估值和样本潜力预估值之间的差值,对爆款潜力预估模型的参数调整,得到训练完成的爆款潜力预估模型。
144.训练完成后,通过爆款潜力预估模型对各对象的属性信息进行处理,即可得到各对象的潜力预估值,潜力预估值指示了对应的对象的爆款潜力。对象的潜力预估值越高,指示该对象成为爆款的潜力越大。
145.s23,根据潜力预估值,在多个对象中确定在全站推荐的目标对象。
146.由于潜力预估值指示了相应的对象成为爆款的潜力,因此在获取了各对象的潜力预估值之后,可以根据各对象的潜力预估值,在多个对象中确定在全站推荐的目标对象。例如,可以直接将潜力预估值高于某一阈值的对象确定为目标对象;例如,还可以根据各对象的潜力预估值,给予各对象相应的曝光量,然后根据用户在客户端上针对各对象的观看、分享、评论等数据,综合确定目标对象。
147.在确定目标对象之后,可以将目标对象在全站推荐,例如,可以在多个应用程序的版面上进行推荐,也可以在某个应用程序的多个版面上进行推荐,等等。
148.本公开实施例提供的推荐方法,首先获取多个对象的属性信息,然后根据爆款潜力预估模型对各对象的属性信息进行处理,得到各对象的潜力预估值,其中潜力预估值指示了对应的对象的爆款潜力,因此,基于潜力预估值可以在多个对象中确定在全站推荐的目标对象。本公开实施例提供的推荐方法,是通过获取对象的属性信息,并基于属性信息筛选出目标对象的,由于属性信息指示的是对象本身的特征,因此,能有效减少由于初期播放率等外部数据对于对象的筛选的影响,提高对象筛选的准确性,使得优质的对象最终能作为目标对象在全站进行推荐。
149.下面将对本公开实施例的方案进行详细介绍。
150.在获取多个对象的属性信息后,需要根据爆款潜力预估模型对各对象的属性信息进行处理,得到各对象的潜力预估值。其中,爆款潜力预估模型中包括预处理模块和全连接模块。
151.下面将结合图3,对任意一个对象的属性信息的处理过程进行介绍。
152.图3为本公开实施例提供的属性信息处理流程示意图,如图3所示,包括:
153.s31,根据各属性信息对应的预处理模块,对对象的属性信息进行特征提取,获取对象的各属性信息对应的特征向量。
154.一个对象可能包括一个或多个属性信息,对于任意一个对象,首先通过预处理模块对属性信息进行特征提取,获取属性信息对应的特征向量。
155.其中,不同的属性信息对应的预处理模块不同,对于不同的属性信息,提取该属性信息对应的特征向量的方法不同。
156.图4为本公开实施例提供的爆款潜力预估模型处理示意图,如图4所示,示意了几种可能的属性信息,包括音频、视频帧、封面图像、文本、艺人等等,爆款潜力预估模型中包括这些不同的属性信息各自对应的预处理模块。预处理模块如图4中的虚线框内示意,其中,不同的属性信息对应的预处理模块不同。
157.当属性信息包括音频时,音频对应的预处理模块包括音频抽取层和音频特征提取层。首先,音频抽取层会对音频进行抽取操作,获取多个音频关键帧。在音频抽取层对音频进行抽取操作时,可以根据预设时间间隔进行抽取,也可以进行随机抽取,本公开实施例对此不作限定。
158.以对象为歌曲为例,可以从曲库中获取歌曲的音频文件,然后按照一定的时间间隔对音频文件进行抽取,得到音频关键帧即可,音频关键帧的数量可以根据需要设定。
159.在获取多个音频关键帧之后,可以根据音频特征提取层对多个音频关键帧处理,得到该音频对应的特征向量。在一些实施例中,音频特征提取层可以通过yamnet模型实现。以音频为歌曲为例,在获取多个音频关键帧之后,可以以该歌曲标注的曲风作为学习目标,使用迁移学习,将音频关键帧输入yamnet模型中,对yamnet模型的参数微调,可以得到表达该歌曲的向量,即音频对应的特征向量。
160.对象除了可以是歌曲这种形式外,还可以是视频或者其他可能的形式。以视频为例,则音频这个属性信息可以通过对视频中的音频进行提取。
161.当属性信息包括视频帧时,视频是由一帧一帧的图像构成的,这些图像即为视频帧,视频帧有相应的时序关系。本公开实施例中的视频帧这一属性信息是不包括音频的,对于一个视频对象而言,可以将其音频和视频帧作为两个不同的属性信息。
162.视频帧对应的预处理模块包括卷积神经网络和长短期记忆人工神经网络。首先,可以通过卷积神经网络获取视频帧的图像特征。然后,根据长短期记忆人工神经网络对视频帧的图像特征进行处理,得到视频帧对应的特征向量。
163.当属性信息包括文本时,文本对应的预处理模块包括分词层和词向量提取层。文本可以是与对象相关的各种不同的文本。以对象是歌曲为例,则对象的文本这一属性信息可以包括歌曲名、歌曲相关艺人名、歌词等等。
164.首先,可以通过分词层对文本进行分词处理,得到文本的多个分词。分词层可以基于各种分词工具或者分词算法实现。例如,可以对文本进行结巴分词,词典分词等等,不同的分词方法得到的多个分词可能不同。以文本“我来到北京清华大学”为例,对该文本进行分词,例如可以得到“我/来到/北京/清华大学”,或者,“我/来到/北京/清华/清华大学/华大/大学”,等等。
165.在获取多个分词后,根据词向量提取层,获取这多个分词的词向量。在一些实施例中,词向量提取层可以采用word2vec算法实现。最后,对多个分词的词向量进程融合,得到该文本对应的特征向量,融合的方式例如可以为平均池化(avg

pooling)方式。
166.当属性信息包括封面图像时,封面图像对应的预处理模块包括残差网络模型。由
于对象的属性信息可以包括视频帧,视频帧也是一种图像,因此本实施例中提取的是封面图像对应的特征向量。以视频为例,封面图像通常是最能反映该视频内容的一帧图像,能够让用户在较短的时间内获取到视频的主要信息。在后续推荐视频时,用户也是首先查看到视频的封面图像,因此需要对封面图像的特征进行提取。
167.在获取封面图像后,根据残差网络模型对封面图像进行特征提取,得到封面图像对应的特征向量。具体的,可以首先对封面图像进行预处理,然后通过一个在imagenet上预训练好的残差网络模型resnet提取封面图像的特征。图5为本公开实施例提供的一种残差网络模型的结构示意图,如图5所示,包括多个卷积层和池化层。在图5中,示例了该残差网络模型的各卷积层的结构、步长等,可以理解的是,图5中的残差网络模型仅仅为一种示例,并不构成对实际的残差网络模型的结构的限定。
168.任意一个对象可能包括音频、视频帧、封面图像以及文本中的一个或多个属性信息。例如对于mv来说,mv的属性信息可以包括音频、视频帧、封面图像、文本等等,对于歌曲来说,歌曲的属性信息可以包括音频、文本等等。
169.s32,对对象的各属性信息对应的特征向量进行合并处理,得到对象的合成特征向量。
170.如图4中所示,在通过各属性信息对应的预处理模块获取各属性信息对应的特征向量后,对各属性信息对应的特征向量进行合并处理,可以得到对象的合成特征向量。其中,合并处理例如可以是对各特征向量的拼接,也可以是对各特征向量的相加,等等。在获取合成特征向量后,就将合成特征向量输入至全连接模块。
171.s33,根据全连接模块对合成特征向量进行处理,得到对象的潜力预估值。
172.全连接模块中包括多个全连接层,全连接层的数量可以根据需要确定,例如可以设置3个全连接层,或者4个全连接层,等等。任意两个相邻的全连接层中,前一全连接层的输出是后一全连接层的输入。
173.各全连接层中包括一个或多个参数,以及相应的激活函数。当合成特征向量输入至第一个全连接层后,根据第一个全连接层的参数对合成特征向量进行加权求和处理,然后根据激活函数对加权求和处理后的结果进行映射处理,得到第一个全连接层的输出。
174.第一个全连接层的输出是第二个全连接层的输入。针对任意一个全连接层的处理均是类似的,均是根据全连接层的参数对全连接层的输入进行加权求和处理,并根据激活函数对加权求和处理后的结果进行映射处理,得到全连接层的输出。不同的全连接层的参数可能不同,不同的全连接层的激活函数可能相同,也可能不同。激活函数例如可以包括sigmoid函数、tanh函数、relu函数,等等。
175.全连接模块中的最后一个全连接层的输出即为输出的多个分值,这多个分值包括播放分值、点赞分值、分享分值、流行持久度分值和流行爆发度分值中的至少一个。在获取多个分值后,可以根据分值和每个分值的权重值,获取对象的潜力预估值。各个分值的权重值可以相同,也可以不同。例如,分享分值对于对象成为爆款的作用较大,可以给分享分值设置较高的权重值,点赞分值对于对象成为爆款的作用较小,可以给点赞分值设置较低的权重值。
176.在对爆款潜力预估模型进行训练时,可以获取训练样本,训练样本中包括样本对象和样本对象对应的分值,例如包括对象的播放分值、点赞分值、分享分值、流行持久度分
值和流行爆发度分值中的一个或多个。其中,样本对象对应的分值可以根据样本对象的历史表现数据得到,样本对象的历史表现数据例如可以包括样本对象在历史各个时段的播放量、点赞量、分享量、流行持久度和流行爆发度等等。
177.然后,通过爆款潜力预估模型对样本对象的属性信息进行处理,得到各样本对象的属性信息对应的特征向量,并进行合并得到样本合成特征向量后,通过全连接模块对样本合成特征向量处理,得到爆款潜力预估模型输出的各样本分值。进一步的,根据爆款潜力预估模型输出的各样本分值与标注的分值,计算对应的损失,例如图4中播放分值对应的损失1、点赞分值对应的损失2、流行爆发度分值对应的损失n等等。根据这些损失,得到总体的损失,然后基于总体的损失对爆款潜力预估模型的参数进行调整,得到训练完成的爆款潜力预估模型。
178.在模型训练完成之后,通过爆款潜力预估模型对对象的属性信息处理,最终输出各分值,得到对象的潜力预估值即可。
179.在根据潜力预估模型对多个对象的属性信息处理,得到各对象的潜力预估值后,需要根据潜力预估值对多个对象进行筛选,从而确定目标对象。本公开实施例中,是基于多级流量池进行筛选的。图6为本公开实施例提供的多级流量池筛选示意图,如图6所示,多级流量池中包括初级流量池61和最后一级流量池64,在初级流量池和最后一级流量池之间还可以包括一个或多个中间流量池,图6中示例了2个中间流量池,分别是二级流量池62和三级流量池63。
180.多个对象在进行初步筛选之后,筛选通过的对象进入初始流量池61,例如在图6中,进入初级流量池61的对象包括对象a、对象b、对象c、对象d、对象e、对象f、对象g和对象h。然后,根据一定的筛选条件,一级一级的依次筛选下一级流量池中的对象,直至得到最后一级流量池64中的对象。
181.例如在图6中,从初级流量池61至二级流量池62的筛选过程中,对象g和对象h被淘汰,对象a、对象b、对象c、对象d、对象e和对象f进入二级流量池62;从二级流量池62至三级流量池63的筛选过程中,对象f被淘汰,对象a、对象b、对象c、对象d和对象e进入三级流量池63;从三级流量池63至最后一级流量池64的筛选过程中,对象d和对象e被淘汰,对象a、对象b和对象c进入最后一级流量池64。
182.在确定最后一级流量池64中的对象之后,可以在最后一级流量池64中确定用于全站推荐的目标对象。例如在图6中,最终的目标对象,可能是对象a、对象b和对象c中的一个或多个。
183.需要说明的是,图6中的四级流量池仅仅为一种示例,实际中可以根据需要增加或减少流量池的层级。例如,当对象数量较多时,可以适当增加多级流量池的层级,控制最终筛选出来的目标对象的数量。
184.下面将结合图7对多级流量池下的对象筛选过程进行介绍。
185.图7为本公开实施例提供的多级流量筛选流程示意图,如图7所示,包括:
186.s71,根据潜力预估值,对多个对象进行筛选,确定初级流量池中的对象。
187.从多个对象中确定初级流量池中的对象的过程,即为对多个对象的海选过程。由于这多个对象还没有正式在各个平台推荐,无法获取用户对这些对象的关注数据(例如包括点赞、评论、分享等数据),因此,主要是根据对象的潜力预估值来进行筛选,确定初级流
量池中的对象。
188.例如,可以选择潜力预估值比较靠前的多个对象作为初级流量池中的对象,由于潜力预估值指示对象的爆款潜力,因此,可以将潜力预估值较低的对象在该过程中筛选出去。
189.另一方面,由于初级流量池中只是进行初步筛选,且为了避免将部分潜力预估值不是非常高但是后续可能成为爆款的对象筛选出去,因此,可以将多个对象中潜力预估值最低的一小部分对象筛选出去即可。例如,可以将潜力预估值最低的10%淘汰,保留靠前的90%的对象作为初级流量池中的对象;例如,也可以将潜力预估值最低的20%淘汰,保留靠前的80%的对象作为初级流量池中的对象,等等。
190.s72,对初级流量池中的对象进行多级流量分发,确定各流量池的下一级流量池中的对象。
191.在确定初级流量池中的对象之后,会对初级流量池中的对象进行多级流量分发,一级一级的筛选。对每一级的流量池中的对象进行筛选,确定下一级流量池中的对象的方法类似。
192.具体的,首先在每一级的流量池中,获取用户特征向量。用户特征向量指示的是相应的用户的偏好,当用户在使用客户端时,会产生用户特征数据,例如包括用户播放的歌曲、视频,例如包括用户对歌曲或视频的点赞、评论、分享,等等。在经用户授权后,可以获取这些用户特征数据,然后将这些用户特征数据转换为相应的向量,并进行聚合,即可以得到用户特征向量。
193.由于不同的用户的偏好不同,因此推荐给不同用户的对象也是不同的。针对任意一个用户,在获取用户特征向量后,可以将用户特征向量、对应的流量池中的各对象的潜力预估值和合成特征向量进行融合处理,得到各对象对应的融合值。然后,根据各对象对应的融合值对流量池中的各对象进行排序,并根据排序结果对各对象进行分发。
194.由于一个流量池中的对象的数量可能较为庞大,不可能将每个对象都推荐给用户,因此,针对任意一个用户而言,通过流量池中各对象对应的融合值对各对象进行排序后,首先根据排序结果召回排序靠前的部分对象。
195.例如,某一级流量池中有100个对象,针对任意一个用户,需要在这100个对象中选择其中的20个对象进行推荐,则这召回的20个对象就是根据排序结果确定的排序靠前的对象。
196.对于不同的用户而言,其用户特征向量不同,则通过用户特征向量、对象的潜力预估值和合成特征向量融合处理得到的融合值也不同,进而根据融合值排序后召回的对象也不同。
197.针对任意一个用户而言,由于召回的对象的数量可能有多个,因此在向用户推荐这多个对象时,需要确定推荐的顺序。本公开实施例中,可以基于用户对各对象的个性化精排模型分数确定推荐的顺序。
198.个性化精排模型分数反映的是用户对该对象感兴趣的概率,是一个位于0

1之间的数值,个性化精排模型分数需要将对象输入个性化精排模型得到。
199.个性化精排模型可以基于现有的模型框架进行训练得到。例如,可以在深度因式分解机(deep factorization machine,简称deep fm)的模型框架的基础上,通过训练样本
进行训练,得到训练完成的个性化精排模型。
200.具体的,首先需要获取训练样本,训练样本中包括样本对象以及对该样本对象标注的样本分数。样本分数可以基于用户对该样本对象的操作行为得到。以样本对象为一首歌曲为例,若用户对该歌曲感兴趣或者比较喜欢,则可以将该歌曲的样本分数标注为1,反之,若用户对该歌曲不感兴趣,则可以将该歌曲的样本分数标注为0。用户对该歌曲是否感兴趣,可以通过获取用户的操作行为获知。例如,若用户完整收听了该歌曲,或者点赞了该歌曲,或者分享了该歌曲,则表示用户对该歌曲感兴趣。若用户点击该歌曲后很快关闭相关界面,则表示用户对该歌曲不感兴趣。在经用户授权后,获取用户在客户端上的上述操作行为,即可得到用户对于样本对象的偏好,从而对样本对象进行标注,得到样本对象的样本分数。
201.然后,将样本对象输入至该模型,得到模型输出的分数,并根据模型输出的分数和标注的样本分数之间的差值,对模型的参数进行调整。通过上述训练过程,即可得到训练完成的个性化精排模型。
202.在个性化精排模型训练完成后,将对象输入至个性化精排模型,即可得到模型输出的个性化精排模型分数。个性化精排模型分数反映的是用户对于对象的偏好,即用户喜欢该对象的概率。个性化精排模型分数的取值越大,表明该用户喜欢该对象的概率越大,反之则表明该用户喜欢该对象的概率越小。
203.针对任意一个用户而言,在通过排序结果确定了若干个召回的对象后,可以通过个性化精排模型获取这若干个对象的个性化精排模型分数,然后在后续向该用户推荐这若干个对象时,根据个性化精排模型分数确定这若干个对象的顺序来推荐。
204.由于各对象的融合值是结合用户特征向量得到的,用户特征向量反映了用户的偏好,因此,根据融合值排序后进行分发,能够将各对象分发到对该对象更感兴趣的用户常用的平台上,能够提高用户对推荐的对象的兴趣,从而更有利于对象的推广和传播。
205.图8为本公开实施例提供的分发界面示意图,如图8所示,在界面81上,显示了某个音视频应用的首页推荐页面,首页推荐页面上包括流量分发后在某用户的客户端上展示的歌曲a、歌曲b和歌曲c。
206.其中,歌曲a、歌曲b和歌曲c是针对该用户召回的3首歌曲。在通过获取该用户的特征向量,并将用户特征向量、对象的潜力预估值和合成特征向量融合处理得到的融合值后,根据融合值对多首歌曲排序,将排序靠前的这三首歌曲召回,作为向该用户推荐的歌曲。
207.在确定向该用户推荐这3首歌曲之后,可以通过该用户的个性化精排模型,获取这3首歌曲的个性化精排模型分数,然后根据个性化精排模型分数确定向该用户推荐这3首歌曲时的推荐顺序。
208.例如在图8中,歌曲a的个性化精排模型分数最高,将歌曲a的推荐顺序排在第一位,歌曲b次之,歌曲c的个性化精排模型分数最低,将歌曲c的推荐顺序排在最后一位。
209.用户在看到界面81上的歌曲a后,点击歌曲a进行收听,界面81切换到界面82上。当用户对歌曲a比较喜欢时,还可能将歌曲a分享给其他的用户,或者对歌曲a进行点赞。例如在界面82上,用户对歌曲a进行了点赞和分享,提高了歌曲a的点赞率和分享率。用户的上述操作均为歌曲a的反馈数据。在经用户授权后,可以获取上述反馈数据。
210.同一个对象可以分发到不同的用户对应的客户端或者程序页面上,然后可以在分
发后,获取相应的反馈数据,并根据反馈数据对各对象进行筛选,即可确定下一级流量池中的对象。
211.具体的,在获得反馈数据后,获取预设时间段内各对象对应的实时点赞率和完播率,然后,将实时点赞率大于或等于第一阈值、完播率大于或等于第二阈值以及潜力预估值大于或等于第三阈值的对象,确定为下一级流量池中的对象。
212.其中,实时点赞率指的是对象的点赞量与播放量之间的比值,完播率指的是对象的完整播放量与点击打开对象的播放量之间的比值。本公开实施例中的完整播放量并不表示必须将对象从头播放到结尾,而只需要播放时长超过某一阈值即可视为完整播放。以歌曲为例,通常一首歌曲的时长在几分钟,例如可以设置当播放时长超过30秒时视为完整播放。则当用户点开播放该歌曲的时长大于或等于30秒时,则认为该用户完整播放了该歌曲,反之当用户点开播放该歌曲的时长小于30秒时,则认为该用户没有完整播放该歌曲。而用户只要点击打开了对象,则视为一个点击打开对象的播放量,无论时长是否超过某一阈值。
213.通常,点赞率越高,表明用户越喜欢该对象,用户完整播放的概率越高,表明用户越喜欢该对象,从而对象越有可能得到广泛的传播,越有可能成为爆款。同时,对象的潜力预估值也是基于对象本身,对各对象成为爆款的潜力进行的预估。因此,结合实时点赞率、完播率和潜力预估值,可以进行流量池中的对象的筛选,得到下一级流量池中的对象。
214.每一级的流量池中的对象在进行筛选时,其对应的第一阈值、第二阈值和第三阈值的取值可能不同,即不同层级的流量池的对象筛选过程中,对实时点赞率、完播率和潜力预估值的要求是不同的,每一层级的对象的筛选都比上一层级的筛选更为严格。以实时点赞率为例,从初级流量池筛选进入二级流量池中的对象时,可以将第一阈值设置为10%,从二级流量池筛选进入三级流量池中的对象时,可以将第一阈值设置为20%,从三级流量池筛选进入四级流量池中的对象时,可以将第一阈值设置为30%,等等。
215.s73,在最后一级流量分发结束后的剩余的对象中计算剩余的对象对应的推曝价值。
216.推曝价值用于自动评估对象是否有价值,是否值得推曝,以及衡量其成为爆款的可能性。推曝价值的核心指标主要是点赞和分享,点赞可以显式的表明用户对对象的喜爱,也能够刺激生产者产生更多的优质对象。分享则能够促进对象在各个平台的传播,形成更大范围内的影响力,对于平台吸引新用户起到较大的作用。
217.在进行一个个层级的流量池中的对象筛选后,得到最后一级流量。首先,确定处于最后一级流量池中的各第一对象,第一对象的数量可以为一个或多个。然后,可以获取各第一对象对应的推曝参数,其中,推曝参数可以包括时间差,潜力预估值,预期点赞数,实时点赞数,预期分享数,实时分享数,实时点赞率,实时分享率,个性化精排模型分数,等等。
218.时间差指的是当前时刻与目标时刻之间的时间差,可以以小时为单位进行计算。目标时刻指的是对目标对象进行全站推荐的时刻,本公开实施例中,不同的时刻对应的时间差是不同的。
219.预期点赞数指的是预先设置的目标对象要达到的点赞量,而实时点赞数指的是在进行流量分发后的对象的实际获取的点赞量,预期点赞数可以大于或等于实时点赞数,也可以小于实时点赞数。根据实时点赞数和点击播放数,可以获取实时点赞率。
220.预期分享数指的是预先设置的目标对象要达到的分享量,而实时分享数指的是在
进行流量分发后的对象的实际获取的分享量,预期分享数可以大于或等于实时分享数,也可以小于实时分享数。根据实时分享数和点击播放数,可以获取实时分享率。
221.个性化精排模型分数反映的是用户对该对象感兴趣的概率,是一个位于0

1之间的数值,个性化精排模型分数需要将对象输入个性化精排模型得到。个性化精排模型的训练方式请参见上述实施例相关内容的介绍,此处不再赘述。对于不同的用户而言,同一个对象的个性化精排模型分数可能不同,对应的推曝价值也可能不同。
222.在获取上述推曝参数后,可以计算最后一级流量池中的各第一对象的推曝价值。其中,推曝价值的计算可以基于如下公式:
[0223][0224]
value为推曝价值,推曝参数包括:d为时间差,p为潜力预估值,e1为预期点赞数,c1为实时点赞数,e
s
为预期分享数,c
s
为实时分享数,r1为实时点赞率,r
s
为实时分享率,r为个性化精排模型分数。
[0225]
s74,根据推曝价值,在剩余的对象中确定在全站待推荐的目标对象。
[0226]
推曝价值越高,则表示相应的对象越有可能成为爆款对象。因此,可以根据各剩余的对象的推曝价值,确定目标对象,然后在全站推荐。
[0227]
下面结合图9和图10分别对视频和歌曲这两类对象的推荐过程进行介绍。
[0228]
图9为本公开实施例提供的视频推荐示意图,如图9所示,首先是视频发布。发布的视频的数量比较大,对于发布的视频,首先进行机器审核和人工审核,审核的过程主要是淘汰一些不合规定的视频,审核后通过的视频进入推荐池。
[0229]
进入推荐池的视频,需要进行海选,海选通过的视频进入初级流量池。海选的过程,主要是依据视频的潜力预估值。潜力预估值越大的视频,代表后面成为爆款的可能性越大,因此,可以将推荐池中靠前的一部分视频筛选进入初级流量池,例如,可以将推荐池中前80%的视频筛选入初级流量池。
[0230]
进入初级流量池后,针对各用户,可以获取用户特征向量,然后根据用户特征向量、各视频的潜力预估值和合成特征向量进行融合,得到各视频的融合值,根据融合值对初级流量池中的视频进行排序,并根据排序结果确定召回的视频。
[0231]
然后,通过个性化精排模型对召回的视频进行处理,得到各召回的视频的个性化精排模型分数,并根据个性化精排模型分数,向该用户对应的客户端推荐这些召回的视频。该个性化精排模型的训练过程可以参见上述实施例中的相关内容。
[0232]
例如在初级流量池中有100个视频,针对某用户甲,可以通过融合值的排序结果在这100个视频中召回排序靠前的10个视频。然后,通过个性化精排模型获取这10个视频的个性化精排模型分数,根据个性化模型分数确定在向该用户甲推荐的时候这10个视频的推荐顺序,实现向用户甲的推荐。针对任意一个用户,均可以采用上述方式进行视频的推荐,从而在各平台或页面上展示视频。
[0233]
用户在客户端上查看到平台或页面上展示的视频后,可以对视频进行播放观看、点赞、分享、评论等等,这些操作构成了分发后的反馈数据。然后,获取各个视频的反馈数
据,根据各个视频的反馈数据进行筛选,选择进入二级流量池的对象。
[0234]
例如在图9中,获取反馈数据后,判断各视频的点赞率、完播率和潜力预估值是否满足条件。具体的,可以设置一个点赞率阈值、完播率阈值和潜力预估值阈值,根据这些阈值判断相应的数据是否满足条件,对于满足条件的视频,可以进入二级流量池,不满足条件的视频淘汰,只给予一般曝光量的推荐。
[0235]
从二级流量池至三级流量池的筛选过程,与从初级流量池至二级流量池的筛选过程类似。首先,进入二级流量池后,可以获取用户特征向量,然后根据用户特征向量、各视频的潜力预估值和合成特征向量进行融合,得到各视频的融合值,并根据融合值对二级流量池中的视频排序,根据排序结果确定召回的视频。然后,通过个性化精排模型获取召回的视频的个性化精排模型分数,并根据个性化精排模型分数确定向用户推荐这些视频的顺序。通过上述操作,在各用户对应的客户端的各平台或页面上对视频进行展示。
[0236]
然后,获取各个视频的反馈数据,根据各个视频的反馈数据进行筛选,选择进入三级流量池的对象。
[0237]
例如在图9中,获取反馈数据后,判断各视频的点赞率、完播率和潜力预估值是否满足条件。具体的,可以设置一个点赞率阈值、完播率阈值和潜力预估值阈值,根据这些阈值判断相应的数据是否满足条件,对于满足条件的视频,可以进入三级流量池,不满足条件的视频淘汰,只给予一般曝光量的推荐。
[0238]
各级流量池之间的筛选过程类似,但是具体的设置条件可能不同,例如各级流量池之间的筛选过程中,对于点赞率、完播率和潜力预估值的要求是逐步增加的。
[0239]
图9的示例中,最后一级流量池即为三级流量池。在确定三级流量池中的对象后,对三级流量池中的视频可以进行二次人工审核,对于二次人工审核不通过的视频淘汰,通过二次人工审核的视频,会进行推曝价值的计算,根据各视频的推曝价值与个性化排序,进行跨场景推荐,例如在图9的示例中,可以在音视频应用的云村、视频榜、首页视频等平台进行推荐。
[0240]
图10为本公开实施例提供的歌曲推荐示意图,如图10所示,首先获取多个歌曲,这多个歌曲进入推荐池。进入推荐池的歌曲,需要进行海选,海选通过的歌曲进入初级流量池。海选的过程,主要是依据歌曲的潜力预估值。潜力预估值越大的歌曲,代表后面成为爆款的可能性越大,因此,可以将推荐池中靠前的一部分歌曲筛选进入初级流量池,例如,可以将推荐池中前90%的歌曲筛选入初级流量池。
[0241]
进入初级流量池后,可以对歌曲进行流量分发。具体的,可以获取用户特征向量,然后根据用户特征向量、各歌曲的潜力预估值和合成特征向量进行融合,得到各歌曲的融合值,并根据融合值对初级流量池中的歌曲进行排序,并根据排序结果确定召回的歌曲。
[0242]
然后,通过个性化精排模型对召回的歌曲进行处理,得到各召回的歌曲的个性化精排模型分数,并根据个性化精排模型分数,向该用户对应的客户端推荐这些召回的歌曲。该个性化精排模型的训练过程可以参见上述实施例中的相关内容。
[0243]
例如在初级流量池中有100个歌曲,针对某用户乙,可以通过融合值的排序结果在这100个歌曲中召回排序靠前的10个歌曲。然后,通过个性化精排模型获取这10个歌曲的个性化精排模型分数,根据个性化模型分数确定在向该用户乙推荐的时候这10个歌曲的推荐顺序,实现向用户乙的推荐。针对任意一个用户,均可以采用上述方式进行歌曲的推荐,从
而在客户端的各平台或页面上展示歌曲。
[0244]
用户在查看到平台或页面上展示的歌曲后,可以对歌曲进行播放观看、点赞、分享、评论等等,这些操作构成了分发后的反馈数据。然后,获取各个歌曲的反馈数据,根据各个歌曲的反馈数据进行筛选,判断歌曲是否满足相应的条件。如果满足,则进入下一级流量池,否则淘汰该歌曲。
[0245]
其中,相应的条件例如可以为,判断各歌曲的点赞率、完播率和潜力预估值是否满足条件。具体的,可以设置一个点赞率阈值、完播率阈值和潜力预估值阈值,根据这些阈值判断相应的数据是否满足条件,对于满足条件的歌曲,可以进入下一级流量池,不满足条件的歌曲淘汰。
[0246]
在图10中示例了六级流量池,各流量池之间的筛选过程类似,主要是筛选条件有一定的差异例如各级流量池之间的筛选过程中,对于点赞率、完播率和潜力预估值的要求是逐步增加的。
[0247]
图10的示例中,最后一级流量池即为六级流量池。在确定六级流量池中的对象后,对六级流量池中的对象进行推曝价值的计算,根据各视频的推曝价值与个性化排序,进行跨场景推荐,例如在图10的示例中,可以在音视频应用的个性推荐、歌曲榜、首页视频等平台进行推荐。
[0248]
本公开实施例提供的推荐方法,首先获取多个对象的属性信息,然后根据爆款潜力预估模型对各对象的属性信息进行处理,得到各对象的潜力预估值,其中潜力预估值指示了对应的对象的爆款潜力,因此,基于潜力预估值可以在多个对象中确定在全站推荐的目标对象。本公开实施例的方案,是通过获取对象的属性信息,并基于属性信息筛选出目标对象的,由于属性信息指示的是对象本身的特征,因此,能有效减少由于初期播放率等外部数据对于对象的筛选的影响,提高对象筛选的准确性,使得优质的对象最终能作为目标对象在全站进行推荐。
[0249]
示例性装置
[0250]
在介绍了本公开示例性实施方式的介质之后,接下来,参考图11对本公开示例性实施方式的推荐装置进行说明。本公开示例性实施方式的装置,可以实现前述方法实施例中的各个过程,并达到相同的功能和效果。
[0251]
图11为本公开实施例提供的一种推荐装置的结构示意图,如图11所示,包括:
[0252]
获取模块111,用于获取多个对象的属性信息;
[0253]
处理模块112,用于根据爆款潜力预估模型对各所述对象的属性信息进行处理,得到各所述对象的潜力预估值,所述潜力预估值用于指示所述对象的爆款潜力;
[0254]
确定模块113,用于根据所述潜力预估值,在所述多个对象中确定在全站推荐的目标对象。
[0255]
在一种可能的实施方式中,所述爆款潜力预估模型包括预处理模块和全连接模块;针对所述多个对象中的任意一个对象,所述处理模块112具体用于:
[0256]
根据各所述属性信息对应的预处理模块,对所述对象的属性信息进行特征提取,获取所述对象的各属性信息对应的特征向量;
[0257]
对所述对象的各属性信息对应的特征向量进行合并处理,得到所述对象的合成特征向量;
[0258]
根据所述全连接模块对所述合成特征向量进行处理,得到所述对象的潜力预估值。
[0259]
在一种可能的实施方式中,所述属性信息包括音频;所述音频对应的预处理模块包括音频抽取层和音频特征提取层;所述处理模块112具体用于:
[0260]
根据音频抽取层对所述音频进行抽取操作,获取多个音频关键帧;
[0261]
根据音频特征提取层对所述多个音频关键帧处理,得到所述音频对应的特征向量。
[0262]
在一种可能的实施方式中,所述属性信息包括视频帧;所述视频帧对应的预处理模块包括卷积神经网络和长短期记忆人工神经网络;所述处理模块112具体用于:
[0263]
根据所述卷积神经网络获取所述视频帧的图像特征;
[0264]
根据所述长短期记忆人工神经网络对所述视频帧的图像特征进行处理,得到所述视频帧对应的特征向量。
[0265]
在一种可能的实施方式中,所述属性信息包括文本;所述文本对应的预处理模块包括分词层和词向量提取层;所述处理模块112具体用于:
[0266]
根据所述分词层对所述文本进行分词处理,得到多个分词;
[0267]
根据所述词向量提取层,获取所述多个分词的词向量;
[0268]
对所述多个分词的词向量进行融合,得到所述文本对应的特征向量。
[0269]
在一种可能的实施方式中,所述属性信息包括封面图像;所述封面图像对应的预处理模块包括残差网络模型;所述处理模块112具体用于:
[0270]
根据所述残差网络模型对所述封面图像进行特征提取,得到所述封面图像对应的特征向量。
[0271]
在一种可能的实施方式中,所述全连接模块中包括多个全连接层;所述处理模块具体用于:
[0272]
针对任意一个全连接层,根据所述全连接层的参数对所述全连接层的输入进行加权求和处理,并根据激活函数对加权求和处理后的结果进行映射处理,得到所述全连接层的输出;
[0273]
根据所述全连接模块中的最后一个全连接层的输出,得到多个分值,所述多个分值包括播放分值、点赞分值、分享分值、流行持久度分值和流行爆发度分值中的至少一个;
[0274]
根据所述分值和每个分值的权重值,获取所述对象的潜力预估值。
[0275]
在一种可能的实施方式中,所述确定模块113具体用于:
[0276]
根据所述潜力预估值,对所述多个对象进行筛选,确定初级流量池中的对象;
[0277]
对所述初级流量池中的对象进行多级流量分发,确定各流量池的下一级流量池中的对象;
[0278]
在最后一级流量分发结束后的剩余的对象中计算剩余的对象对应的推曝价值;
[0279]
根据所述推曝价值,在所述剩余的对象中确定在全站待推荐的所述目标对象。
[0280]
在一种可能的实施方式中,所述确定模块113具体用于:
[0281]
在每一级的流量池中,获取用户特征向量;
[0282]
将所述用户特征向量、对应的流量池中的各对象的潜力预估值和合成特征向量进行融合处理,得到各对象对应的融合值;
[0283]
根据所述融合值对对应的流量池中的各所述对象进行排序,并根据所述排序结果对各所述对象进行分发;
[0284]
根据分发后获得的反馈数据,对各所述对象进行筛选,确定对应的流量池的下一级流量池中的对象。
[0285]
在一种可能的实施方式中,所述确定模块113具体用于:
[0286]
获取预设时间段内各所述对象对应的内容实时点赞率和完播率;
[0287]
将实时点赞率大于或等于第一阈值、完播率大于或等于第二阈值以及潜力预估值大于或等于第三阈值的对象,确定为所述下一级流量池中的对象。
[0288]
在一种可能的实施方式中,所述确定模块113具体用于:
[0289]
确定处于最后一级流量池中的各第一对象;
[0290]
获取各第一对象对应的推曝参数;
[0291]
根据所述推曝参数计算所述各第一对象对应的推曝价值。
[0292]
本公开实施例提供的推荐装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
[0293]
示例性介质
[0294]
在介绍了本公开示例性实施方式的方法之后,接下来,参考图12对本公开示例性实施方式的存储介质进行说明。
[0295]
图12为本公开实施例提供的程序产品示意图,参考图12所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品120,其可以采用便携式紧凑盘只读存储器(cd

rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
[0296]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0297]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
[0298]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备。
[0299]
示例性计算设备
[0300]
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图13对本公开示例性实施方式的计算设备进行说明。
[0301]
图13显示的计算设备130仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0302]
图13为本公开实施例提供的一种计算设备的结构示意图,如图13所示,计算设备130以通用计算设备的形式表现。计算设备130的组件可以包括但不限于:上述至少一个处理单元131、上述至少一个存储单元132,连接不同系统组件(包括处理单元131和存储单元132)的总线133。
[0303]
总线133包括数据总线、控制总线和地址总线。
[0304]
存储单元132可以包括易失性存储器形式的可读介质,例如随机存取存储器(ram)1321和/或高速缓存存储器1322,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(rom)1323。
[0305]
存储单元132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325,这样的程序模块1324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0306]
计算设备130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口135进行。并且,计算设备130还可以通过网络适配器136与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图13所示,网络适配器136通过总线133与计算设备130的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备130使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0307]
应当注意,尽管在上文详细描述中提及了推荐装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
[0308]
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0309]
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1