基于负反馈的流媒体内容推荐方法、装置及电子设备

文档序号：32999603发布日期：2023-01-18 00:53阅读：21来源：国知局

1.本发明涉及信息处理技术领域，尤其涉及一种基于负反馈的流媒体内容推荐方法、装置及电子设备。

背景技术：

2.城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战的过程。例如，可以通过社交媒体数据挖掘人的喜好和规律，制定推荐系统，服务城市运转。推荐系统是一种根据用户对物品的历史交互行为学习用户兴趣偏好并向用户推荐感兴趣的物品的系统，比如可以在电子商务平台、短视频、音乐平台等平台通过推荐系统为用户推荐感兴趣的内容。
3.随着信息数据量的迅速增加，隐式反馈的推荐系统已经占据了主导地位，但目前基于隐式反馈的推荐系统在采集数据过程中过度依赖用户和物品之间的正反馈，推荐模型训练中的负样本则从未交互的物品中随机选取，存在样本偏差的问题，特别是在流媒体内容推荐中，大部分数据均为不明确反馈和负反馈，这样，过度依赖正反馈会导致推荐系统的准确性不高。

技术实现要素：

4.本发明提供一种基于负反馈的流媒体内容推荐方法、装置及电子设备，用以解决现有技术中流媒体内容推荐时过度依赖正反馈而导致推荐内容准确性低的缺陷，提高流媒体内容推荐的准确性。
5.本发明提供一种基于负反馈的流媒体内容推荐方法，包括：
6.获取用户信息和待推荐流媒体内容集合，并将所述用户信息和所述待推荐流媒体内容集合输入推荐模型，获得所述推荐模型输出的所述用户信息对所述待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，所述推荐模型是基于所述用户信息对应的样本负反馈流媒体内容和根据所述样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；
7.对所述不感兴趣概率进行从小到大排序，将排序结果中的前第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；
8.将所述待推荐流媒体内容集合中与所述目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；
9.输出所述目标推荐流媒体内容。
10.根据本发明提供的一种基于负反馈的流媒体内容推荐方法，所述输出所述目标推荐流媒体内容包括：
11.将所述目标推荐流媒体内容中的各待推荐流媒体内容，按照不感兴趣概率从小到大的顺序依次输出。
12.根据本发明提供的一种基于负反馈的流媒体内容推荐方法，所述推荐模型是基于
以下步骤训练得到的：
13.获取所述用户信息对应的历史反馈内容集合中的负反馈流媒体内容，得到所述样本负反馈流媒体内容；
14.从所述历史反馈内容集合中搜索第二预设数量个与所述样本负反馈流媒体内容不相似的内容，得到所述样本潜在正反馈流媒体内容；
15.基于所述样本负反馈流媒体内容和所述样本潜在正反馈流媒体内容构建训练样本对，并基于所述训练样本对和推荐损失函数对所述初始推荐模型进行训练，得到所述推荐模型。
16.根据本发明提供的一种基于负反馈的流媒体内容推荐方法，所述从所述历史反馈内容集合中搜索第二预设数量个与所述样本负反馈流媒体内容不相似的内容，得到所述样本潜在正反馈流媒体内容，包括：
17.从所述样本负反馈流媒体内容中选择第三预设数量个内容，得到负反馈流媒体内容代表集合；
18.从所述历史反馈内容集合中采集第四预设数量个内容，得到候选内容集合；
19.计算所述候选内容集合中各内容与所述负反馈流媒体内容代表集合中各内容的不相似度；
20.对所述不相似度进行从大到小的排序，将排序结果中的前第二预设数量个不相似度确定为目标不相似度；
21.将所述候选内容集合中与所述目标不相似度对应的内容确定为所述样本潜在正反馈流媒体内容。
22.根据本发明提供的一种基于负反馈的流媒体内容推荐方法，所述推荐损失函数为：
[0023][0024]
其中，l代表所述推荐损失函数的函数值，g代表所述样本负反馈流媒体内容，pu代表所述样本潜在正反馈流媒体内容，u代表所述用户信息，i代表所述样本负反馈流媒体内容中的第i个内容，j代表所述样本潜在正反馈流媒体内容中的第j个内容，d
ui
代表所述用户信息和所述样本负反馈流媒体内容中的第i个内容的不相似度，d
uj
代表所述用户信息和所述样本潜在正反馈流媒体内容中的第j个内容的不相似度，σ()代表sigmoid函数。
[0025]
根据本发明提供的一种基于负反馈的流媒体内容推荐方法，所述用户信息和所述历史反馈内容集合表征在同一个多维表征空间中，所述多维表征空间基于所述推荐模型的嵌入层实现。
[0026]
本发明还提供一种基于负反馈的流媒体内容推荐装置，包括：
[0027]
获取模块，用于获取用户信息和待推荐流媒体内容集合，并将所述用户信息和所述待推荐流媒体内容集合输入推荐模型，获得所述推荐模型输出的所述用户信息对所述待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，所述推荐模型是基于所述用户信息对应的样本负反馈流媒体内容和根据所述样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；
[0028]
第一确定模块，用于对所述不感兴趣概率进行从小到大排序，将排序结果中的前
第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；
[0029]
第二确定模块，用于将所述待推荐流媒体内容集合中与所述目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；
[0030]
输出模块，用于输出所述目标推荐流媒体内容。
[0031]
本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任一种所述基于负反馈的流媒体内容推荐方法。
[0032]
本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于负反馈的流媒体内容推荐方法。
[0033]
本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述基于负反馈的流媒体内容推荐方法。
[0034]
本发明提供的基于负反馈的流媒体内容推荐方法、装置及电子设备，通过推荐模型对用户信息和待推荐流媒体内容集合进行处理以获得推荐模型输出的该用户信息对该待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，该推荐模型基于用户信息对应的样本负反馈流媒体内容和根据该样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到，充分考虑了用户与流媒体内容之间的负反馈，利用了流媒体推荐中样本负反馈流媒体内容较多的特点，弥补了正反馈比较稀疏而导致训练样本不足及样本偏差的缺陷，能够提高基于用户与流媒体内容之间的负反馈学习到的用户对各待推荐流媒体内容的不感兴趣概率的准确性，进而根据该不感兴趣概率能够从待推荐流媒体内容集合中反向搜索出用户最感兴趣的第一预设数量个流媒体内容推荐给用户，提高了流媒体内容推荐的准确性。
附图说明
[0035]
为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0036]
图1是本发明提供的基于负反馈的流媒体内容推荐方法的流程示意图；
[0037]
图2是本发明提供的推荐模型的训练方法的流程示意图；
[0038]
图3是本发明提供的基于正反馈的随机采样原理示意图；
[0039]
图4是本发明提供的搜索样本潜在正反馈流媒体内容的方法的流程示意图；
[0040]
图5是本发明提供的搜索样本潜在正反馈流媒体内容的原理示意图；
[0041]
图6是本发明提供的推荐模型训练方法的原理示意图；
[0042]
图7是本发明提供的基于负反馈的流媒体内容推荐装置的结构示意图；
[0043]
图8是本发明提供的电子设备的结构示意图。
具体实施方式
[0044]
为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，
而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0045]
推荐系统主要依赖于显式反馈和隐式反馈，显式反馈是指用户对物品的评分，可以用于电影、图书等物品的推荐；隐式反馈是指非1即0的二元反馈，例如点击与否、购买与否等反馈行为，只能提供部分正反馈的信号。随着信息数据量的迅速增加，隐式反馈的推荐系统已成为主流研究方向，比如可以使用浅层模型学习用户和物品的表征并用向量内积建模交互概率，可以基于神经网络预测交互概率等。
[0046]
相关技术中，基于隐式反馈的推荐系统，在采集数据过程中只收集用户和物品之间的正反馈，如点击和购买行为等，因此，在推荐模型训练过程中需要做负采样，即从未交互的物品中随机选取物品作为负样本。但是，用户在推荐平台上往往会产生一定数量的明确的负反馈，如不感兴趣等行为。目前的推荐系统往往将这些行为忽略，导致对于用户兴趣偏好的建模不准确，影响推荐系统的性能。特别是在流媒体内容推荐中，用户可以直接播放歌曲或视频等流媒体，同时可以选择跳过或观看，由于没有明确的点击行为，对于负反馈的利用和建模成为了推荐系统的关键。
[0047]
综上，目前的推荐系统过度依赖用户和物品之间的正反馈，而在实际流媒体推荐中，大部分样本是不明确反馈和负反馈，正反馈非常稀疏，导致推荐模型训练时出现样本不足的缺陷；而且，在推荐模型的训练过程中容易忽略用户和物品之间的负反馈，随机采集的负样本不准确，存在样本偏差的问题。
[0048]
在实际的流媒体推荐中，用户和流媒体内容交互会产生大量的负反馈，数量远超正反馈，如对于音乐和视频的跳过行为即反映了用户对当前播放内容的反向兴趣偏好。若能利用这些负反馈为用户推荐流媒体内容，将有助于提高推荐系统的性能。
[0049]
基于此，本发明实施例提供了一种基于负反馈的流媒体内容推荐方法，可以获取用户信息和待推荐流媒体内容集合，并将该用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，对这些不感兴趣概率进行从小到大排序，然后从待推荐流媒体内容集合中，将排序结果中的前第一预设数量个不感兴趣概率所对应的待推荐流媒体内容确定为目标推荐流媒体内容推荐给用户。其中的推荐模型基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到。
[0050]
也就是说，本发明实施例提供的基于负反馈的流媒体内容推荐方法，可以基于用户和流媒体内容之间的负反馈，学习用户的反向兴趣偏好，根据学习出的反向兴趣偏好从海量流媒体内容中搜索用户潜在感兴趣的内容，然后将这些潜在感兴趣的内容推荐给用户。
[0051]
下面结合图1-图6对本发明的基于负反馈的流媒体内容推荐方法进行描述。该基于负反馈的流媒体内容推荐方法可以应用于服务器、手机、电脑等电子设备，也可以应用于设置在服务器、手机、电脑等电子设备中的基于负反馈的流媒体内容推荐装置中，该基于负反馈的流媒体内容推荐装置可以通过软件、硬件或两者的结合来实现。
[0052]
图1示例性示出了本发明实施例提供的基于负反馈的流媒体内容推荐方法的流程示意图，参照图1所示，该基于负反馈的流媒体内容推荐方法可以包括如下的步骤110～步骤150。
[0053]
步骤110：获取用户信息和待推荐流媒体内容集合。
[0054]
用户信息可以是用户的身份标识号(identity document，id)信息，待推荐流媒体内容集合可以由流媒体平台提供，比如可以是音乐平台、短视频平台、直播平台或视频点播平台等平台提供的流媒体内容，推荐系统可以从该待推荐流媒体内容集合中选择流媒体内容推荐给用户。示例性的，用户登录流媒体平台时，可以获取到用户信息。
[0055]
步骤120：将用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率。
[0056]
其中，推荐模型是基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的。
[0057]
推荐模型可以在给定用户信息和待推荐流媒体内容集合后，预估该用户信息对于待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率。该推荐模型可以通过对深度神经网络进行实例化获得，并以反向传播算法进行参数的更新和优化，待收敛后替换线上的推荐模型进行流媒体内容推荐，可以借助用户与流媒体内容之间的交互行为不断优化。具体的，该推荐模型可以基于用户信息对应的样本负反馈流媒体内容和根据该样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到。
[0058]
示例性的，图2示出了本发明实施例提供的推荐模型的训练方法的流程示意图，参照图2所示，该训练方法可以包括如下的步骤210～步骤230。
[0059]
步骤210：获取用户信息对应的历史反馈内容集合中的负反馈流媒体内容，得到样本负反馈流媒体内容。
[0060]
用户和流媒体内容交互的过程中可以产生大量的交互行为，包括正反馈行为和负反馈行为，对于流媒体，产生的负反馈行为的数量远大于正反馈行为，其中的正反馈行为比如可以包括点击、购买等，负反馈行为比如可以包括跳过行为等。在用户和流媒体内容的交互过程中可以对这些交互行为进行记录，获得相应的正反馈流媒体内容和负反馈流媒体内容，得到该用户的历史反馈内容集合。可以从该历史反馈内容集合中获取负反馈流媒体内容，得到样本负反馈流媒体内容。
[0061]
示例性的，在用户和流媒体内容的交互过程中可以仅记录负反馈行为，该负反馈行为对应的流媒体内容即为样本负反馈流媒体内容，比如可以获得用户对于流媒体内容的负反馈交互记录为[(x1，y1)，(x2，y2)，
…
，(xi，yi)，
…
，(xn，yn)]，其中n为样本个数，xi为第i个用户，yi为第i个流媒体内容。样本潜在正反馈流媒体内容则可以基于样本负反馈流媒体内容在历史反馈内容集合中进行潜在正反馈搜索确定，具体的，可参见步骤220。
[0062]
步骤220：从历史反馈内容集合中搜索第二预设数量个与样本负反馈流媒体内容不相似的内容，得到样本潜在正反馈流媒体内容。
[0063]
在本发明实施例中，构建了不相似性函数，通过该不相似性函数可以估计一个用户跳过一个流媒体内容的概率，也即估计一个用户对一个流媒体内容不感兴趣的程度，通过该不相似性函数也可以捕捉两个流媒体内容之间的不相似性。通过构建不相似性空间，为所有用户及其样本负反馈流媒体内容学习表征向量，就可以从与用户向量不相似的子空间检索出目标推荐流媒体内容推荐给用户。
[0064]
示例性的，在不相似性函数的构建过程中，可以将每个用户信息和流媒体内容表征为一个多维空间的嵌入向量，同时，可以将所有的用户信息和所有的流媒体内容表征在
同一个多维表征空间中，而不区分用户信息和流媒体内容两个子空间，该多维表征空间可以通过一个嵌入层e实现。相应的，在本发明实施例中，用户信息和历史反馈内容集合可以表征在同一个多维表征空间中，该多维表征空间可以基于推荐模型的嵌入层实现。
[0065]
例如，嵌入层e可以表示为e＝[e
u1
，e
u2
，
…eum
，e
i1
，e
i2
，
…ein
]，其中，m和n分别为用户信息的个数和流媒体内容的个数，e
u1
、e
u2
和e
um
代表不同的用户信息，e
i1
、e
i2
和e
in
代表不同的流媒体内容。
[0066]
在本发明实施例中，不相似性函数f(e
x
，ey)以两个嵌入向量e
x
和ey为输入，比如可以是e中的任意两个向量，可以输出两者之间的不相似度d
xy
，即d
xy
＝f(e
x
，ey)。当输入不相似性函数的一对实体为用户信息和流媒体内容，该d
xy
可以用来估计一个用户对一个流媒体内容不感兴趣的概率；当输入不相似性函数的一对实体为两个流媒体内容，该d
xy
用来评估这两个流媒体内容之间的不相似性。
[0067]
对于基于负反馈的流媒体内容推荐，需要满足一个流媒体内容与其自身之间的不相似性应当最低的要求，基于此，在本发明实施例中提供了如下可选的不相似性函数：
[0068]
(1)f1(e
x
,ey)＝-e
x
·ey
，表示对嵌入向量e
x
和ey计算内积后取反；
[0069]
(2)f2(e
x
,ey)＝||e
x-ey||，表示计算嵌入向量e
x
和ey的向量差的模长；
[0070]
(3)表示将嵌入向量e
x
和ey拼接后输入多层感知机模型h()；
[0071]
(4)f4(e
x
,ey)＝-g(e
x
)
·
g(ey)，表示对嵌入向量e
x
和ey经过图神经网络模型g()之后的向量内积取反。
[0072]
在基于正反馈的内容推荐方法中，需要从整个内容集合中随机选择用户未交互的内容作为负反馈样本，这种随机策略对于负采样是合理的，因为用户感兴趣的只是全体内容集合的一小部分空间，从整个内容集合中随机抽取的内容很有可能不会位于这个小部分空间中。也就是说，这种随机策略选择的内容是负反馈样本的概率很大。例如，图3示例性示出了基于正反馈的随机采样原理示意图，参照图3所示，虚线圈区域31代表用户感兴趣的内容，环形区域32代表用户不感兴趣的内容，方形点代表正反馈样本，圆点代表负采样获得的负反馈样本，可见，负采样落在环形区域32的概率比较大，即从整个内容集合中随机抽取的内容是负反馈样本的概率很大，能够满足负采样的需求。
[0073]
但是，在基于负反馈的流媒体内容推荐方法中，因为只有负反馈样本可用，所以需要进行正采样来获得正反馈样本，如果采用与上述负采样同样的方法进行正采样，则随机抽取的内容是正反馈样本的概率非常小。
[0074]
基于此，在本发明实施例中，可以利用不相似性函数从历史反馈内容集合中搜索那些与用户信息对应的负反馈样本不相似的流媒体内容作为潜在的正反馈样本。
[0075]
示例性的，图4示出了本发明实施例提供的搜索样本潜在正反馈流媒体内容的方法的流程示意图，参照图4所示，该方法可以包括如下的步骤410～步骤450。
[0076]
步骤410：从样本负反馈流媒体内容中选择第三预设数量个内容，得到负反馈流媒体内容代表集合。
[0077]
对于每个用户信息，可以从该用户信息对应的样本负反馈流媒体内容中随机抽取第三预设数量个内容作为负反馈样本的代表，比如抽取50个内容，得到负反馈流媒体内容
代表集合。其中的样本负反馈流媒体内容即为负反馈样本。
[0078]
步骤420：从历史反馈内容集合中采集第四预设数量个内容，得到候选内容集合。
[0079]
示例性的，可以从所有用户信息对应的历史反馈内容集合中随机采集第四预设数量个内容作为候选内容集合，或者，对于每个用户信息，可以从该用户信息对应的历史反馈内容集合中随机采集第四预设数量个内容作为该用户信息对应的候选内容集合。
[0080]
步骤430：计算候选内容集合中各内容与负反馈流媒体内容代表集合中各内容的不相似度。
[0081]
得到负反馈流媒体内容代表集合和候选内容集合之后，可以利用不相似性函数计算候选内容集合中各内容与负反馈流媒体内容代表集合中各内容的不相似度。
[0082]
步骤440：对不相似度进行从大到小的排序，将排序结果中的前第二预设数量个不相似度确定为目标不相似度。
[0083]
计算出候选内容集合中各内容与负反馈流媒体内容代表集合中各内容的不相似度之后，可以对这些不相似度按照进行从大到小的排序，选择排序结果中的前第二预设数量个不相似度，比如前30个不相似度，得到目标不相似度。
[0084]
步骤450：将候选内容集合中与目标不相似度对应的内容确定为样本潜在正反馈流媒体内容。
[0085]
比如确定出了30个不相似度作为目标不相似度，则将候选内容集合中这30个不相似度对应的内容确定为样本潜在正反馈流媒体内容，也就是从候选内容集合中选择与负反馈流媒体内容代表集合最不相似的30个内容作为样本潜在正反馈流媒体内容。该样本潜在正反馈流媒体内容即为潜在的正反馈样本。
[0086]
基于图4对应实施例的方法，图5示例性示出了搜索样本潜在正反馈流媒体内容的原理示意图，参照图5所示，虚线圈区域51代表用户感兴趣的内容，环形区域52代表用户不感兴趣的内容，在进行样本潜在正反馈流媒体内容搜索时，可以从环形区域52中选择第三预设数量个负反馈流媒体内容代表负反馈流媒体内容代表集合，比如环形区域52中的4个黑色圆点；将整个圆形区域作为候选内容集合，计算其中每个内容与这4个黑色圆点的不相似度，然后对这些不相似度进行从大到小的排序，从排序结果中选择前第二预设数量个不相似度，比如选择第1个不相似度，选择出的该不相似度对应着虚线圈区域51中的三角形点，该三角形点即为确定出的样本潜在正反馈流媒体内容。
[0087]
这样，可以利用不相似性函数从历史反馈内容集合中搜索出与用户信息对应的样本负反馈流媒体内容最不相似的内容作为样本潜在正反馈流媒体内容，获得正反馈样本。
[0088]
步骤230：基于样本负反馈流媒体内容和样本潜在正反馈流媒体内容构建训练样本对，并基于训练样本对和推荐损失函数对初始推荐模型进行训练，得到推荐模型。
[0089]
初始推荐模型可以是深度神经网络(deep neural networks，dnn)模型、卷积神经网络(convolutional neural networks，cnn)模型等基础神经网络模型，可以利用样本负反馈流媒体内容和样本潜在正反馈流媒体内容训练后替换线上的推荐模型。或者，也可以将当前线上的推荐模型作为初始推荐模型，利用样本负反馈流媒体内容和样本潜在正反馈流媒体内容进行优化训练，以更新当前线上的推荐模型。
[0090]
示例性的，可以将样本潜在正反馈流媒体内容中的每一个流媒体内容作为正样本，将样本负反馈流媒体内容中的每一个流媒体内容作为负样本，将每一个正样本结合负
样本构建训练样本对。基于构建的训练样本对，可以采用推荐损失函数对初始推荐模型进行训练，得到推荐模型。
[0091]
示例性的，推荐损失函数可以表示为：
[0092][0093]
其中，l代表推荐损失函数的损失值，g代表样本负反馈流媒体内容，pu代表样本潜在正反馈流媒体内容，u代表用户信息，i代表样本负反馈流媒体内容中的第i个内容，j代表样本潜在正反馈流媒体内容中的第j个内容，d
ui
代表用户信息和样本负反馈流媒体内容中的第i个内容的不相似度，d
uj
代表用户信息和样本潜在正反馈流媒体内容中的第j个内容的不相似度，σ()代表sigmoid函数。
[0094]
通过构建的训练样本对计算该推荐损失函数的损失值l，并通过反向传播算法进行模型参数及l的更新与优化，直至l达到最小值，初始推荐模型收敛，得到训练好的推荐模型，可以用该推荐模型替换线上的推荐模型进行流媒体内容推荐。
[0095]
通过优化该推荐损失函数的损失值，可以使d
ui
和d
uj
之间的差距尽可能大，使用户不感兴趣的流媒体内容在学习的不相似性空间中会与用户信息的表征距离更远，而用户可能感兴趣的流媒体内容则与用户信息的表征距离更近，满足用户信息和样本负反馈流媒体内容之间的不相似性应该高于用户信息和样本潜在正反馈流媒体内容之间的不相似性的要求。
[0096]
基于图2对应实施例的推荐模型的训练方法，图6示例性示出了本发明实施例提供的推荐模型训练方法的原理示意图，参照图6所示，可以在用户与流媒体内容交互的过程中收集用户与流媒体内容之间的负反馈数据，得到样本负反馈流媒体内容o，o中包含用户信息u及其对应的负反馈流媒体内容i的关联数据(u，i)，同时可以获得用户交互的所有流媒体内容，得到历史反馈内容集合。推荐模型训练时设置有超参数，该超参数可以包括：负反馈代表数(第三预设数量)r，随机采样数(第四预设数量)s和搜索的正反馈数(第二预设数量)t；待训练的初始推荐模型包含嵌入层e，可以用于实现用户信息和历史反馈内容集合的表征空间。
[0097]
根据图6所示，首先初始化推荐损失函数l为0；接着，对于样本负反馈流媒体内容o中的每一个(u，i)，从用户信息u的样本负反馈流媒体内容中选择r个流媒体内容作为负反馈流媒体内容代表，得到负反馈流媒体内容代表集合h；从历史反馈内容集合中随机采样s个内容，得到候选内容集合c；从候选内容集合c中选择与该用户信息u的负反馈流媒体内容代表集合h最不相似的t个流媒体内容，得到样本潜在正反馈流媒体内容的集合p；使用不相似性函数f计算用户信息u和负反馈流媒体内容i之间的不相似度，然后为p中的每一个正样本结合负样本i计算推荐损失函数l，并通过反向传播算法优化损失函数l，直至初始推荐模型收敛，得到训练好的推荐模型。
[0098]
这样，通过选择负反馈流媒体内容代表集合h和候选内容集合c，并从候选内容集合c中选择与h最不相似的t个流媒体内容作为样本潜在正反馈流媒体内容，进而基于该样本潜在正反馈流媒体内容和样本负反馈流媒体内容构建训练样本对进行推荐模型的训练，可以提高推荐模型训练的效率。
[0099]
步骤130：对不感兴趣概率进行从小到大排序，将排序结果中的前第一预设数量个
不感兴趣概率确定为目标不感兴趣概率集合。
[0100]
获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率之后，可以对这些不感兴趣概率进行从大到小的排序，将排序结果中的前第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合。或者，在一种示例实施例中，也可以将小于概率阈值的不感兴趣概率确定为目标不感兴趣概率集合。
[0101]
步骤140：将待推荐流媒体内容集合中与目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容。
[0102]
得到目标不感兴趣概率集合之后，可以在待推荐流媒体内容集合中查找该目标不感兴趣概率集合所对应的待推荐流媒体内容，得到目标推荐流媒体内容。比如，不感兴趣概率的排序从小到大分别为a1、a2、a3、
……
a10，第一预设数量为3，则可以确定目标不感兴趣概率集合包括a1、a2和a3，假设a1、a2和a3分别是待推荐流媒体内容集合中流媒体内容b3、b2和b1的不感兴趣概率，则可以将流媒体内容b3、b2和b1确定为目标推荐流媒体内容。
[0103]
步骤150：输出目标推荐流媒体内容。
[0104]
示例性的，可以将目标推荐流媒体内容中的各待推荐流媒体内容，按照不感兴趣概率从小到大的顺序依次输出。也就是说，可以根据推荐模型输出的不感兴趣概率的倒序从待推荐流媒体内容集合中为用户推荐第一预设数量个流媒体内容，这第一预设数量个流媒体内容可以按照用户的感兴趣程度依次输出。
[0105]
本发明实施例提供的基于负反馈的流媒体内容推荐方法，通过推荐模型对用户信息和待推荐流媒体内容集合进行处理以获得推荐模型输出的该用户信息对该待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，该推荐模型基于用户信息对应的样本负反馈流媒体内容和根据该样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到，充分考虑了用户与流媒体内容之间的负反馈，利用了流媒体推荐中负反馈较多的特点，弥补了正反馈比较稀疏而导致训练样本不足及样本偏差的缺陷，能够提高基于用户与流媒体内容之间的负反馈学习到的用户对各待推荐流媒体内容的不感兴趣概率的准确性，进而根据该不感兴趣概率能够从待推荐流媒体内容集合中反向搜索出用户最感兴趣的第一预设数量个流媒体内容推荐给用户，提高了流媒体内容推荐的准确性。
[0106]
下面对本发明提供的基于负反馈的流媒体内容推荐装置进行描述，下文描述的基于负反馈的流媒体内容推荐装置与上文描述的基于负反馈的流媒体内容推荐方法可相互对应参照。
[0107]
图7示例性示出了本发明实施例提供的基于负反馈的流媒体内容推荐装置的结构示意图，参照图7所示，基于负反馈的流媒体内容推荐装置700可以包括获取模块710、第一确定模块720、第二确定模块730和输出模块740。其中，获取模块710可以用于获取用户信息和待推荐流媒体内容集合，并将用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，其中的推荐模型是基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；第一确定模块720可以用于对不感兴趣概率进行从小到大排序，将排序结果中的第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；第二确定模块730可以用于将待推荐流媒体内容集合中与目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；输出模块740可以用于输出
目标推荐流媒体内容。
[0108]
一种示例实施例中，输出模块740可以具体用于将目标推荐流媒体内容中的各待推荐流媒体内容，按照不感兴趣概率从小到大的顺序依次输出。
[0109]
一种示例实施例中，基于负反馈的流媒体内容推荐装置700还可以包括训练模块，该训练模块可以用于训练推荐模型。示例性的，该训练模块可以包括：获取单元，可以用于获取用户信息对应的历史反馈内容集合中的负反馈流媒体内容，得到样本负反馈流媒体内容；搜索单元，可以用于从历史反馈内容集合中搜索第二预设数量个与样本负反馈流媒体内容不相似的内容，得到样本潜在正反馈流媒体内容；训练单元，可以用于基于样本负反馈流媒体内容和样本潜在正反馈流媒体内容构建训练样本对，并基于训练样本对和推荐损失函数对初始推荐模型进行训练，得到推荐模型。
[0110]
一种示例实施例中，搜索单元可以包括：选择子单元，可以用于从样本负反馈流媒体内容中选择第三预设数量个内容，得到负反馈流媒体内容代表集合；采集子单元可以用于从历史反馈内容集合中采集第四预设数量个内容，得到候选内容集合；计算子单元，可以用于计算候选内容集合中各内容与负反馈流媒体内容代表集合中各内容的不相似度；第一确定子单元，可以用于对不相似度进行从大到小的排序，将排序结果中的前第二预设数量个不相似度确定为目标不相似度；第二确定子单元，可以用于将候选内容集合中与目标不相似度对应的内容确定为样本潜在正反馈流媒体内容。
[0111]
一种示例实施例中，推荐损失函数可以表示为：
[0112][0113]
其中，l代表推荐损失函数的函数值，g代表样本负反馈流媒体内容，pu代表样本潜在正反馈流媒体内容，u代表用户信息，i代表样本负反馈流媒体内容中的第i个内容，j代表样本潜在正反馈流媒体内容中的第j个内容，d
ui
代表用户信息和样本负反馈流媒体内容中的第i个内容的不相似度，d
uj
代表用户信息和样本潜在正反馈流媒体内容中的第j个内容的不相似度，σ()代表sigmoid函数。
[0114]
一种示例实施例中，用户信息和历史反馈内容集合表征在同一个多维表征空间中，多维表征空间基于推荐模型的嵌入层实现。
[0115]
图8示例了一种电子设备的实体结构示意图，如图8所示，该电子设备800可以包括：处理器(processor)810、通信接口(communication interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行上述各方法实施例提供的基于负反馈的流媒体内容推荐方法，该方法可以包括：获取用户信息和待推荐流媒体内容集合，并将用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，该推荐模型是基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；将不感兴趣概率进行从小到大排序，将排序结果中的第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；将待推荐流媒体内容集合中与目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；输出目标推荐流媒体内容。
[0116]
此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0117]
另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法实施例所提供的基于负反馈的流媒体内容推荐方法，该方法可以包括：获取用户信息和待推荐流媒体内容集合，并将用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，该推荐模型是基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；对不感兴趣概率进行从小到大排序，将排序结果中的第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；将待推荐流媒体内容集合中与目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；输出目标推荐流媒体内容。
[0118]
又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法实施例所提供的基于负反馈的流媒体内容推荐方法，该方法可以包括：获取用户信息和待推荐流媒体内容集合，并将用户信息和待推荐流媒体内容集合输入推荐模型，获得推荐模型输出的用户信息对待推荐流媒体内容集合中各待推荐流媒体内容的不感兴趣概率，该推荐模型是基于用户信息对应的样本负反馈流媒体内容和根据样本负反馈流媒体内容确定的样本潜在正反馈流媒体内容训练得到的；对不感兴趣概率进行从小到大排序，将排序结果中的第一预设数量个不感兴趣概率确定为目标不感兴趣概率集合；将待推荐流媒体内容集合中与目标不感兴趣概率集合对应的待推荐流媒体内容确定为目标推荐流媒体内容；输出目标推荐流媒体内容。
[0119]
以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
[0120]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0121]
最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管
参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李勇高宸郑瑜金德鹏
技术所有人：清华大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。