视频推荐方法及装置与流程

文档序号：29219124发布日期：2022-03-12 12:17阅读：83来源：国知局

1.本公开总体说来涉及电子技术领域，更具体地讲，涉及一种视频推荐方法及装置。

背景技术：

2.在针对视频搜索的视频推荐中，需要对与搜索文本(例如，搜索关键词)相关的视频进行排序，并按照排序结果推荐给用户。例如，用户可通过应用的客户端输入搜索关键词来搜索所需要的视频，客户端可将包括用户输入的搜索关键词的搜索请求发送到该应用的服务端，应用的服务端可响应于该搜索请求搜索相关的视频，并对这些视频进行排序，然后，可将排序靠前的视频发送到应用客户端推荐给用户。然而，现有的视频推荐方法的推荐效果还有待提高。

技术实现要素：

3.本公开的示例性实施例在于提供一种视频推荐方法及装置，以至少解决上述相关技术中的问题，也可不解决任何上述问题。
4.根据本公开实施例的第一方面，提供一种视频推荐方法，包括：获取搜索请求中的搜索关键词，确定与所述搜索关键词相关的视频；对确定的视频进行排序得到目标序列；对确定的视频中满足第一预设条件的视频进行排序得到探索序列；基于探索序列和目标序列，确定推荐序列；按照推荐序列中对视频的排序，确定所述搜索请求对应的推荐视频；其中，第一预设条件为：发布时长小于时长阈值且在搜索请求下的曝光次数小于次数阈值，其中，发布时长为当前时间与视频发布时间之间的差值。
5.可选地，对确定的视频进行排序得到目标序列的步骤包括：按照预估的每个视频的第一推荐得分，对确定的视频进行排序；对确定的视频中满足第一预设条件的视频进行排序得到探索序列的步骤包括：按照预估的每个满足第一预设条件的视频的第二推荐得分，对确定的视频中满足第一预设条件的视频进行排序；其中，第一推荐得分越高表示推荐度越高，第二推荐得分越高表示推荐度越高。
6.可选地，基于探索序列和目标序列，确定推荐序列的步骤包括：确定调整系数，以使探索序列中排在第m位的视频的第二推荐得分乘以调整系数后大于目标序列中排在第n位的视频的第一推荐得分；将排在探索序列中的每个视频的第二推荐得分乘以调整系数后的得分作为该视频的第三推荐得分；按照排在探索序列中的各个视频的第三推荐得分和排在目标序列中的各个视频的第一推荐得分，对确定的视频进行排序得到推荐序列。
7.可选地，在对确定的视频进行排序得到推荐序列的步骤中，如果任意一个视频同时具有第一推荐得分和第三推荐得分，则按照所具有的第一推荐得分和第三推荐得分之中的较高得分对该视频进行排序；如果任意一个视频仅具有第一推荐得分，则按照所具有的第一推荐得分对该视频进行排序。
8.可选地，确定调整系数的步骤包括：获取目标序列中排在第n位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第一比值；获取目标序列
中排在第n-k位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第二比值，其中，k为大于或者等于1的整数；将调整系数确定为大于第一比值且小于第二比值的数值。
9.可选地，通过下述方式预估每个满足第一预设条件的视频的第二推荐得分：针对每个满足第一预设条件的视频，将关于该视频及其消费用户的二部图结果输入图神经网络，以得到该视频的特征；基于该视频的特征和所述搜索关键词的特征，得到该视频的第二推荐得分。
10.可选地，基于该视频的特征和所述搜索关键词的特征，得到该视频的第二推荐得分的步骤包括：将该视频的特征和所述搜索关键词的特征输入双塔神经网络分别进行特征提取，对分别提取得到的特征进行拼接得到拼接后的特征，基于拼接后的特征得到该视频的第二推荐得分。
11.可选地，所述双塔神经网络包括：第一多层感知器、第二多层感知器、第三多层感知器、拼接层、以及分类层，其中，将该视频的特征和所述搜索关键词的特征输入双塔神经网络分别进行特征提取，对分别提取得到的特征进行拼接得到拼接后的特征，基于拼接后的特征得到该视频的第二推荐得分的步骤包括：将该视频的特征输入第一多层感知器；将所述搜索关键词的特征输入第二多层感知器；将第一多层感知器输出的向量和第二多层感知器输出的向量经由拼接层拼接后输入第三多层感知器；将第三多层感知器输出的向量输入分类层，得到分类层输出的该视频的第二推荐得分。
12.可选地，所述对确定的视频中满足第一预设条件的视频进行排序得到探索序列的步骤包括：对确定的视频中满足第一预设条件的视频以及满足第二预设条件的视频进行排序，得到探索序列；其中，第二预设条件为：发布时长小于时长阈值、在搜索请求下的曝光次数大于或等于次数阈值、且用户消费后验情况满足预设消费条件。
13.可选地，用户消费后验情况满足预设消费条件包括：基于各个消费后验指标的指标值确定的综合指标值高于预设阈值；其中，所述各个消费后验指标包括以下项之中的至少一项：观看时长、点击率、长播率、以及点赞率。
14.可选地，所述双塔神经网络通过下述方式训练得到：获取训练样本，其中，所述训练样本包括：带有标注的发布时长小于时长阈值的视频样本，所述标注包括：视频样本为正样本或负样本的标注，视频样本的标注基于在搜索请求下对该视频样本的消费后验情况而确定；将关于视频样本及其消费用户的二部图结果输入图神经网络，以得到视频样本的特征；将视频样本的特征和搜索请求中的搜索关键词的特征输入所述双塔神经网络，得到预测的视频样本的第二推荐得分；基于预测的视频样本的第二推荐得分和视频样本的标注，确定所述双塔神经网络的损失函数的损失值；通过根据所述损失值调整所述双塔神经网络的网络参数，对所述双塔神经网络进行训练。
15.根据本公开实施例的第二方面，提供一种视频推荐装置，包括：视频确定单元，被配置为获取搜索请求中的搜索关键词，确定与所述搜索关键词相关的视频；目标序列确定单元，被配置为对确定的视频进行排序得到目标序列；探索序列确定单元，被配置为对确定的视频中满足第一预设条件的视频进行排序得到探索序列；推荐序列确定单元，被配置为基于探索序列和目标序列，确定推荐序列；推荐视频确定单元，被配置为按照推荐序列中对视频的排序，确定所述搜索请求对应的推荐视频；其中，第一预设条件为：发布时长小于时
长阈值且在搜索请求下的曝光次数小于次数阈值，其中，发布时长为当前时间与视频发布时间之间的差值。
16.可选地，目标序列确定单元被配置为按照预估的每个视频的第一推荐得分，对确定的视频进行排序；探索序列确定单元被配置为按照预估的每个满足第一预设条件的视频的第二推荐得分，对确定的视频中满足第一预设条件的视频进行排序；其中，第一推荐得分越高表示推荐度越高，第二推荐得分越高表示推荐度越高。
17.可选地，推荐序列确定单元被配置为：确定调整系数，以使探索序列中排在第m位的视频的第二推荐得分乘以调整系数后大于目标序列中排在第n位的视频的第一推荐得分；将排在探索序列中的每个视频的第二推荐得分乘以调整系数后的得分作为该视频的第三推荐得分；按照排在探索序列中的各个视频的第三推荐得分和排在目标序列中的各个视频的第一推荐得分，对确定的视频进行排序得到推荐序列。
18.可选地，推荐序列确定单元被配置为：如果任意一个视频同时具有第一推荐得分和第三推荐得分，则按照所具有的第一推荐得分和第三推荐得分之中的较高得分对该视频进行排序；如果任意一个视频仅具有第一推荐得分，则按照所具有的第一推荐得分对该视频进行排序。
19.可选地，推荐序列确定单元被配置为：获取目标序列中排在第n位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第一比值；获取目标序列中排在第n-k位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第二比值，其中，k为大于或者等于1的整数；将调整系数确定为大于第一比值且小于第二比值的数值。
20.可选地，探索序列确定单元被配置为通过下述方式预估每个满足第一预设条件的视频的第二推荐得分：针对每个满足第一预设条件的视频，将关于该视频及其消费用户的二部图结果输入图神经网络，以得到该视频的特征；基于该视频的特征和所述搜索关键词的特征，得到该视频的第二推荐得分。
21.可选地，探索序列确定单元被配置为将该视频的特征和所述搜索关键词的特征输入双塔神经网络分别进行特征提取，对分别提取得到的特征进行拼接得到拼接后的特征，基于拼接后的特征得到该视频的第二推荐得分。
22.可选地，所述双塔神经网络包括：第一多层感知器、第二多层感知器、第三多层感知器、拼接层、以及分类层，其中，探索序列确定单元被配置为：将该视频的特征输入第一多层感知器；将所述搜索关键词的特征输入第二多层感知器；将第一多层感知器输出的向量和第二多层感知器输出的向量经由拼接层拼接后输入第三多层感知器；将第三多层感知器输出的向量输入分类层，得到分类层输出的该视频的第二推荐得分。
23.可选地，探索序列确定单元被配置为对确定的视频中满足第一预设条件的视频以及满足第二预设条件的视频进行排序，得到探索序列；其中，第二预设条件为：发布时长小于时长阈值、在搜索请求下的曝光次数大于或等于次数阈值、且用户消费后验情况满足预设消费条件。
24.可选地，用户消费后验情况满足预设消费条件包括：基于各个消费后验指标的指标值确定的综合指标值高于预设阈值；其中，所述各个消费后验指标包括以下项之中的至少一项：观看时长、点击率、长播率、以及点赞率。
25.可选地，所述双塔神经网络通过下述方式训练得到：获取训练样本，其中，所述训练样本包括：带有标注的发布时长小于时长阈值的视频样本，所述标注包括：视频样本为正样本或负样本的标注，视频样本的标注基于在搜索请求下对该视频样本的消费后验情况而确定；将关于视频样本及其消费用户的二部图结果输入图神经网络，以得到视频样本的特征；将视频样本的特征和搜索请求中的搜索关键词的特征输入所述双塔神经网络，得到预测的视频样本的第二推荐得分；基于预测的视频样本的第二推荐得分和视频样本的标注，确定所述双塔神经网络的损失函数的损失值；通过根据所述损失值调整所述双塔神经网络的网络参数，对所述双塔神经网络进行训练。
26.根据本公开实施例的第三方面，提供一种电子设备，包括：至少一个处理器；至少一个存储计算机可执行指令的存储器，其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行如上所述的视频推荐方法。
27.根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行如上所述的视频推荐方法。
28.根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机指令，所述计算机指令被至少一个处理器执行时实现如上所述的视频推荐方法。
29.根据本公开的示例性实施例的视频推荐方法及装置，通过结合包括新发布的曝光次数少的视频的探索序列和包括所有视频的目标序列，来确定最终的推荐序列，能够让新的优质视频拥有一定的探索流量，让好的视频得到展示，提高了视频推荐的准确度以及推荐效果。
30.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
31.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
32.图1示出根据本公开示例性实施例的视频推荐方法的应用场景图；
33.图2示出根据本公开示例性实施例的视频推荐方法的流程图；
34.图3示出根据本公开示例性实施例的基于探索序列和目标序列确定推荐序列的方法的流程图；
35.图4示出根据本公开示例性实施例的训练双塔神经网络的方法的流程图；
36.图5示出根据本公开示例性实施例的视频推荐装置的结构框图；
37.图6示出根据本公开示例性实施例的电子设备的结构框图。
具体实施方式
38.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
39.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
40.在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括a和b之中的至少一个”即包括如下三种并列的情况：(1)包括a；(2)包括b；(3)包括a和b。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。
41.图1示出根据本公开示例性实施例的视频推荐方法的应用场景图。
42.参照图1，当用户在客户端搜索视频时，客户端可向服务器端发送包括搜索关键词的视频搜索请求；服务器端可响应于客户端的视频搜索请求，执行根据本公开示例性实施例的视频推荐方法以向客户端推荐满足用户搜索需求的视频序列。
43.应该理解，根据本公开示例性实施例的视频推荐方法不仅可应用于上述场景，还可应用于其他适合的场景，本公开对此不作限制。
44.图2示出根据本公开示例性实施例的视频推荐方法的流程图。作为示例，所述视频推荐方法可由服务器端来执行。
45.参照图2，在步骤s101，获取搜索请求中的搜索关键词。
46.作为示例，所述搜索请求可为用于搜索与至少一个搜索关键词相关的视频的请求。
47.在步骤s102，确定与所述搜索关键词相关的视频。
48.作为示例，可从数据库中搜索属性信息与所述搜索关键词相关联的视频。作为示例，视频的属性信息可包括但不限于以下项之中的至少一项：视频的标识信息(例如，视频名称等)、视频的标签信息、视频的内容信息(例如，视频中出现的演员名称、角色名称等)、视频的发布者信息。
49.在步骤s103，对确定的视频进行排序得到目标序列。
50.在目标序列中，视频的推荐度越高，排序可越靠前。
51.作为示例，可按照预估的每个视频的第一推荐得分，对确定的视频进行排序。其中，第一推荐得分越高表示推荐度越高。
52.作为示例，可基于视频的特征，预估视频的第一推荐得分。例如，可基于视频的消费后验指标特征，预估视频的第一推荐得分。
53.作为示例，所述消费后验指标可包括但不限于以下项之中的至少一项：观看时长、点击率、长播率、点赞率、以及收藏率。
54.在步骤s104，对确定的视频中满足第一预设条件的视频进行排序得到探索序列。
55.在探索序列中，视频的推荐度越高，排序可越靠前。
56.作为示例，第一预设条件可包括：发布时长小于时长阈值且在搜索请求下的曝光次数小于次数阈值，其中，发布时长为当前时间与视频发布时间之间的差值。
57.作为示例，视频在搜索请求下的曝光次数可理解为：已响应于搜索请求将该视频推荐给客户端，并被客户端显示出来的次数。
58.作为示例，所述次数阈值可为100，应该理解，该数值仅作为示例，可根据实际情况和需求设置适合的数值。
59.作为示例，所述时长阈值可为1天，应该理解，该数值仅作为示例，可根据实际情况和需求设置适合的数值。
60.此外，作为示例，步骤s104可包括：对确定的视频中满足第一预设条件的视频以及满足第二预设条件的视频进行排序，得到探索序列。
61.作为示例，第二预设条件可包括：发布时长小于时长阈值、在搜索请求下的曝光次数大于或等于次数阈值、且用户消费后验情况满足预设消费条件。
62.作为示例，视频的用户消费后验情况可为该视频(例如，在曾响应搜索请求推荐给用户后)被用户消费的情况。
63.作为示例，用户消费后验情况满足预设消费条件可包括：基于各个消费后验指标的指标值确定的综合指标值高于预设阈值。例如，可对各个消费后验指标的指标值进行加权求和来得到综合指标值。例如，观看时长越长、点击率越高、长播率越高、点赞率越高，综合指标值越高。例如，视频的综合指标值y＝ax1+bx2+cx3+dx4，其中，x1至x4分别表示该视频的各个消费后验指标的指标值，a、b、c、d分别表示对应的消费后验指标的加权系数。
64.根据本公开的示例性实施例，可将发布时长较短且曝光次数较少的视频构成探索序列，此外，还可将发布时长较短、曝光次数有所提升、且用户消费后验情况较好的视频继续保留在探索序列中，而使发布时长较短、曝光次数有所提升、但用户消费后验情况较差的视频退出探索序列。
65.作为示例，可按照预估的每个满足预设条件的视频(即，满足第一预设条件的视频；或者，满足第一预设条件的视频和满足第二预设条件的视频)的第二推荐得分，对确定的视频中满足预设条件的视频进行排序。其中，第二推荐得分越高表示推荐度越高。
66.作为示例，可基于视频的消费用户得到视频的特征，并基于视频的特征和所述搜索关键词的特征，预估视频的第二推荐得分。
67.作为示例，可针对每个满足预设条件的视频，将关于该视频及其消费用户的二部图结果输入图神经网络，以得到该视频的特征；并基于该视频的特征和所述搜索关键词的特征，得到该视频的第二推荐得分。例如，可针对每个满足预设条件的视频，将关于该视频及其消费用户的二部图结果输入图神经网络(graph neural networks，gnn)，以得到该视频的embedding特征(嵌入特征)，应该理解，也可为其他类型的特征，本公开对此不作限制。例如，所述搜索关键词的特征可为：通过bert(bidirectional encoder representations from transformers)网络提取的所述搜索关键词的特征。应该理解，也可通过其他方式提取所述搜索关键词的特征，本公开对此不作限定。例如，所述搜索关键词的特征的类型可为所述搜索关键词的embedding特征。应该理解，也可为其他类型的特征，本公开对此不作限制。
68.作为示例，关于视频及其消费用户的二部图结果可基于该视频的用户消费数据被构建。例如，视频的消费用户可为曾点击播放该视频、或长播该视频、或点赞该视频、或收藏该视频的用户。二部图又称作二分图，是图论中的一种特殊模型，设g＝(v，e)是一个无向图，如果顶点v可分割为两个互不相交的子集(a，b)，并且图中的每条边(i，j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in a，j in b)，则称图g为一个二分图。例如，视
频和用户可作为二部图中的顶点，视频和其消费用户之间可通过边连接。
69.作为示例，可将该视频的特征和所述搜索关键词的特征输入双塔神经网络，得到该视频的第二推荐得分。作为示例，可将该视频的特征和所述搜索关键词的特征输入双塔神经网络分别进行特征提取，对分别提取得到的特征进行拼接得到拼接后的特征，基于拼接后的特征得到该视频的第二推荐得分。
70.作为示例，所述双塔神经网络可包括：第一多层感知器、第二多层感知器、第三多层感知器、拼接层concat、以及分类层。多层感知器(multilayer perceptron,mlp)为神经网络模型。例如，分类层可使用softmax函数进行分类。应该理解，该双塔神经网络结构仅作为示例，所述双塔神经网络也可被构建成其他形式，本公开对此不作限制。
71.作为示例，可将该视频的特征输入第一多层感知器；将所述搜索关键词的特征输入第二多层感知器；将第一多层感知器输出的向量和第二多层感知器输出的向量经由拼接层拼接后输入第三多层感知器；将第三多层感知器输出的向量输入分类层，得到分类层输出的该视频的第二推荐得分。
72.下面将会结合图4来描述该双塔神经网络的训练方法的示例性实施例。
73.在步骤s105，基于探索序列和目标序列，确定推荐序列。
74.作为示例，可基于探索序列和目标序列，确定推荐序列，以使排在探索序列中的视频在推荐序列中的排序更靠前，从而使确定的视频中满足预设条件的视频能够被优先推荐。
75.下面将结合图3描述步骤s105的示例性实施例。
76.在步骤s106，按照推荐序列中对视频的排序，确定所述搜索请求对应的推荐视频。即，视频在推荐序列中的排序越靠前，越优先作为所述搜索请求对应的推荐视频推荐给用户。
77.图3示出根据本公开示例性实施例的基于探索序列和目标序列确定推荐序列的方法的流程图。
78.参照图3，在步骤s201，确定调整系数，以使探索序列中排在第m位的视频的第二推荐得分乘以调整系数后大于目标序列中排在第n位的视频的第一推荐得分。
79.n为大于0的整数。作为示例，所述n可设置为4，应该理解，该数值仅作为示例，可根据实际情况和需求设置适合的数值。m为大于0的整数。作为示例，所述m可设置为1，应该理解，该数值仅作为示例，可根据实际情况和需求设置适合的数值。
80.作为示例，可获取目标序列中排在第n位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第一比值；并获取目标序列中排在第n-k位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第二比值，其中，k为大于或者等于1的整数；然后，将调整系数确定为大于第一比值且小于第二比值的数值。
81.在步骤s202，将排在探索序列中的每个视频的第二推荐得分乘以调整系数后的得分作为该视频的第三推荐得分。
82.在步骤s203，按照排在探索序列中的各个视频的第三推荐得分和排在目标序列中的各个视频的第一推荐得分，对确定的视频进行排序得到推荐序列。
83.作为示例，如果任意一个视频同时具有第一推荐得分和第三推荐得分，则按照所
具有的第一推荐得分和第三推荐得分之中的较高得分对该视频进行排序；如果任意一个视频仅具有第一推荐得分，则按照所具有的第一推荐得分对该视频进行排序。换言之，无论是第一推荐得分还是第三推荐得分，只要视频的推荐得分越高，其在推荐序列中的排序越靠前。
84.作为示例，可将排在探索序列中的每个视频，按照该视频的第三推荐得分及排在目标序列中的各个视频的第一推荐得分的高低，排列到目标序列中，并仅保留该视频在目标序列中更靠前的排序位置，以得到推荐序列。
85.具体说来，按照排在探索序列中的各个视频的第三推荐得分和排在目标序列中的各个视频的第一推荐得分的高低，将排在探索目标中的每个视频插入目标序列中，推荐得分越高，排序越靠前；且同一视频在目标序列中仅保留其更靠前的排序位置。例如，目标序列为：视频a，视频b，视频c，视频d，视频e，
……
，视频z，其中，视频a的第一推荐得分≥视频b的第一推荐得分≥视频c的第一推荐得分≥
……
≥视频z的第一推荐得分，探索序列为：视频c、视频d。按照视频c和视频d的第三推荐得分，将视频c和视频d排列到目标序列中，由于视频c的第三推荐得分高于视频b的第一推荐得分且低于视频a的第一推荐得分，视频d的第三推荐得分高于视频f的第一推荐得分且低于视频e的第一推荐得分，所以将视频c和视频d排列到目标序列中后得到序列：视频a，视频c，视频b，视频c，视频d，视频e，视频d，视频f
……
，视频z，为避免序列中重复出现同一视频，针对同一视频在目标序列中仅保留其更靠前的排序位置，就得到推荐序列：视频a，视频c，视频b，视频d，视频e，视频f
……
，视频z。
86.图4示出根据本公开示例性实施例的训练双塔神经网络的方法的流程图。
87.参照图4，在步骤s301，获取训练样本，其中，所述训练样本包括：带有标注的发布时长小于预设时长的视频样本，所述标注包括：视频样本为正样本或负样本的标注，视频样本的标注基于在搜索请求下对该视频样本的消费后验情况而确定。
88.例如，基于用户的搜索请求，将该视频样本推荐给用户后，可根据用户对其的消费情况，确定其是正样本还是负样本。例如，用户点击观看或长播的视频样本可作为正样本，否则作为负样本。
89.在步骤s302，将关于视频样本及其消费用户的二部图结果输入图神经网络，以得到视频样本的特征。
90.在步骤s303，将视频样本的特征和搜索请求中的搜索关键词的特征输入所述双塔神经网络，得到预测的视频样本的第二推荐得分。
91.在步骤s304，基于预测的视频样本的第二推荐得分和视频样本的标注，确定所述双塔神经网络的损失函数的损失值。损失函数的损失值表征了预测的视频样本的第二推荐得分与视频样本的标注之间的差距程度。
92.作为示例，所述损失函数可为交叉熵损失函数。应该理解，也可为其他类型的损失函数，本公开对此不作限制。
93.在步骤s305，通过根据所述损失值调整所述双塔神经网络的网络参数，对所述双塔神经网络进行训练。
94.作为示例，可根据所述损失值计算所述双塔神经网络的各网络参数的梯度，针对每个网络参数，根据计算的该网络参数的梯度来更新该网络参数的参数值。所述双塔神经网络的网络参数可包括：第一多层感知器、第二多层感知器、第三多层感知器、拼接层
concat、以及分类层的参数。
95.应该理解，可使用多个训练样本对所述双塔神经网络进行迭代训练。
96.本公开的实施例提供的技术方案可带来以下有益效果：
97.通过探索序列让新的优质视频拥有一定的探索流量，从而能够让好的视频得到展示；
98.通过学习搜索关键词和视频的语义特征，让缺少文本信息的视频也能得到很好的匹配产生比较好的序，以避免文本信息不多的优质视频，无法得到有效的展示而被忽略；
99.在针对新的视频的曝光量达到一定阈值后，通过消费后验决定是否保留该视频在探索序列中，以此让优质视频得到更好的曝光机会；
100.解决了相关技术中视频推荐方式存在的对视频的后验特征偏重较大，产生了马太效应，对新发布的视频不太友好的问题。
101.图5示出根据本公开示例性实施例的视频推荐装置的结构框图。
102.如图5所示，根据本公开示例性实施例的视频推荐装置10包括：视频确定单元101、目标序列确定单元102、探索序列确定单元103、推荐序列确定单元104、推荐视频确定单元105。
103.具体说来，视频确定单元101被配置为获取搜索请求中的搜索关键词，确定与所述搜索关键词相关的视频。
104.目标序列确定单元102被配置为对确定的视频进行排序得到目标序列。
105.探索序列确定单元103被配置为对确定的视频中满足第一预设条件的视频进行排序得到探索序列。
106.推荐序列确定单元104被配置为基于探索序列和目标序列，确定推荐序列。
107.推荐视频确定单元105被配置为按照推荐序列中对视频的排序，确定所述搜索请求对应的推荐视频。
108.第一预设条件为：发布时长小于时长阈值且在搜索请求下的曝光次数小于次数阈值，其中，发布时长为当前时间与视频发布时间之间的差值。
109.作为示例，目标序列确定单元102可被配置为按照预估的每个视频的第一推荐得分，对确定的视频进行排序；探索序列确定单元103可被配置为按照预估的每个满足第一预设条件的视频的第二推荐得分，对确定的视频中满足第一预设条件的视频进行排序；其中，第一推荐得分越高表示推荐度越高，第二推荐得分越高表示推荐度越高。
110.作为示例，推荐序列确定单元104可被配置为：确定调整系数，以使探索序列中排在第m位的视频的第二推荐得分乘以调整系数后大于目标序列中排在第n位的视频的第一推荐得分；将排在探索序列中的每个视频的第二推荐得分乘以调整系数后的得分作为该视频的第三推荐得分；按照排在探索序列中的各个视频的第三推荐得分和排在目标序列中的各个视频的第一推荐得分，对确定的视频进行排序得到推荐序列。
111.作为示例，推荐序列确定单元104可被配置为：如果任意一个视频同时具有第一推荐得分和第三推荐得分，则按照所具有的第一推荐得分和第三推荐得分之中的较高得分对该视频进行排序；如果任意一个视频仅具有第一推荐得分，则按照所具有的第一推荐得分对该视频进行排序。
112.作为示例，推荐序列确定单元104可被配置为：获取目标序列中排在第n位的视频
的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第一比值；获取目标序列中排在第n-k位的视频的第一推荐得分与探索序列中排在第m位的视频的第二推荐得分的比值，作为第二比值，其中，k为大于或者等于1的整数；将调整系数确定为大于第一比值且小于第二比值的数值。
113.作为示例，探索序列确定单元103可被配置为通过下述方式预估每个满足第一预设条件的视频的第二推荐得分：针对每个满足第一预设条件的视频，将关于该视频及其消费用户的二部图结果输入图神经网络，以得到该视频的特征；基于该视频的特征和所述搜索关键词的特征，得到该视频的第二推荐得分。
114.作为示例，探索序列确定单元103可被配置为将该视频的特征和所述搜索关键词的特征输入双塔神经网络分别进行特征提取，对分别提取得到的特征进行拼接得到拼接后的特征，基于拼接后的特征得到该视频的第二推荐得分。
115.作为示例，所述双塔神经网络可包括：第一多层感知器、第二多层感知器、第三多层感知器、拼接层、以及分类层，其中，探索序列确定单元103可被配置为：将该视频的特征输入第一多层感知器；将所述搜索关键词的特征输入第二多层感知器；将第一多层感知器输出的向量和第二多层感知器输出的向量经由拼接层拼接后输入第三多层感知器；将第三多层感知器输出的向量输入分类层，得到分类层输出的该视频的第二推荐得分。
116.作为示例，探索序列确定单元103可被配置为对确定的视频中满足第一预设条件的视频以及满足第二预设条件的视频进行排序，得到探索序列；其中，第二预设条件为：发布时长小于时长阈值、在搜索请求下的曝光次数大于或等于次数阈值、且用户消费后验情况满足预设消费条件。
117.作为示例，用户消费后验情况满足预设消费条件可包括：基于各个消费后验指标的指标值确定的综合指标值高于预设阈值；其中，所述各个消费后验指标可包括以下项之中的至少一项：观看时长、点击率、长播率、以及点赞率。
118.作为示例，所述双塔神经网络可通过下述方式训练得到：获取训练样本，其中，所述训练样本包括：带有标注的发布时长小于时长阈值的视频样本，所述标注包括：视频样本为正样本或负样本的标注，视频样本的标注基于在搜索请求下对该视频样本的消费后验情况而确定；将关于视频样本及其消费用户的二部图结果输入图神经网络，以得到视频样本的特征；将视频样本的特征和搜索请求中的搜索关键词的特征输入所述双塔神经网络，得到预测的视频样本的第二推荐得分；基于预测的视频样本的第二推荐得分和视频样本的标注，确定所述双塔神经网络的损失函数的损失值；通过根据所述损失值调整所述双塔神经网络的网络参数，对所述双塔神经网络进行训练。
119.关于上述实施例中的视频推荐装置10，其执行操作的具体方式已经在有关方法的实施例中进行了详细描述，此处将不做详细阐述说明。
120.此外，应该理解，上述实施例中的视频推荐装置10中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理，可以例如使用现场可编程门阵列(fpga)或专用集成电路(asic)来实现各个单元。
121.图6示出根据本公开示例性实施例的电子设备的结构框图。
122.参照图6，该电子设备20包括：至少一个存储器201和至少一个处理器202，所述至少一个存储器201中存储有计算机可执行指令集合，当计算机可执行指令集合被至少一个
处理器202执行时，执行如上述示例性实施例所述的视频推荐方法。
123.作为示例，电子设备20可以是pc计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里，电子设备20并非必须是单个的电子设备，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备20还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。
124.在电子设备20中，处理器202可包括中央处理器(cpu)、图形处理器(gpu)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器202还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
125.处理器202可运行存储在存储器201中的指令或代码，其中，存储器201还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。
126.存储器201可与处理器202集成为一体，例如，将ram或闪存布置在集成电路微处理器等之内。此外，存储器201可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器201和处理器202可在操作上进行耦合，或者可例如通过i/o端口、网络连接等互相通信，使得处理器202能够读取存储在存储器中的文件。
127.此外，电子设备20还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备20的所有组件可经由总线和/或网络而彼此连接。
128.根据本公开的示例性实施例，还可提供一种存储指令的计算机可读存储介质，其中，当指令被至少一个处理器运行时，促使至少一个处理器执行如上述示例性实施例所述的视频推荐方法。这里的计算机可读存储介质的示例包括：只读存储器(rom)、随机存取可编程只读存储器(prom)、电可擦除可编程只读存储器(eeprom)、随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)、闪存、非易失性存储器、cd-rom、cd-r、cd+r、cd-rw、cd+rw、dvd-rom、dvd-r、dvd+r、dvd-rw、dvd+rw、dvd-ram、bd-rom、bd-r、bd-r lth、bd-re、蓝光或光盘存储器、硬盘驱动器(hdd)、固态硬盘(ssd)、卡式存储器(诸如，多媒体卡、安全数字(sd)卡或极速数字(xd)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，此外，在一个示例中，计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上，使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
129.根据本公开的示例性实施例，还可提供一种计算机程序产品，该计算机程序产品中的指令可由至少一个处理器执行以完成如上述示例性实施例所述的视频推荐方法。
130.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
131.应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张水发
技术所有人：北京达佳互联信息技术有限公司
我是此专利的发明人

上一篇：一种基于CCD面阵探测的胶体金免疫检测装置的制作方法
上一篇：一种新型内进流格栅过滤网板的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。