播放内容推荐方法、装置、电子设备及存储介质与流程

文档序号：27264315发布日期：2021-11-05 23:21阅读：149来源：国知局

1.本公开涉及信息推荐技术领域，特别涉及一种播放内容推荐方法、装置、电子设备及存储介质。

背景技术：

2.互联网电视服务是针对电视大屏终端提供的视频内容服务。与传统电视相比，互联网电视能够提供丰富的点播内容，用户可以及时的获取到最新的互联网视频；与小屏终端(例如：手机、平板电脑)相比，互联网电视又可以近实时的提供与传统电视相同的频道直播内容。
3.然而，丰富的视频内容库也导致了用户越来越难从海量的视频中快速找到自己喜爱的内容，此时就需要引入智能视频内容推荐技术。智能视频内容推荐技术能够从用户的收看历史和其它交互信息(例如收藏、评论)中挖掘出用户的兴趣偏好，进而为每个用户匹配到少量的个性化的视频内容并展示给用户。这样可以有效的降低用户的筛选成本，提升用户的满意度和黏性。
4.在电视视频内容推荐领域内，大部分的推荐技术通常都是基于用户收看过的内容集合以及内容特征等数据，进行模型构建与内容推荐。但是，用户的收视行为往往是混合了直播和点播的播放，推荐技术需要在不同的时间点智能的选择为用户推荐不同形式的内容，则必须融合考虑这两种截然不同的内容特性。目前还没有一种推荐技术能够很好地综合这两种内容特性为用户推荐视频内容。

技术实现要素：

5.本公开实施例提供了一种播放内容推荐方法、装置、电子设备及存储介质。该技术方案如下：
6.一方面，提供了一种播放内容推荐方法，所述方法包括：获取用户在历史阶段的播放行为数据；根据所述用户在历史阶段的播放行为数据，确定所述用户在历史阶段的播放行为特征；其中，所述播放行为特征至少包括：内容特征、时间特征、位置特征；将所述用户在历史阶段的播放行为特征输入到预先训练的推荐模型，得到所述推荐模型针对所述用户输出的当前时刻的各播放内容，以及所述各播放内容的推荐分数；根据所述各播放内容的推荐分数，对用户进行播放内容推荐。
7.在一种可选的实施例中，所述播放行为数据至少包括：内容数据、时间数据、位置数据；其中所述内容数据包括：点播内容数据、直播频道数据；所述时间数据包括：播放时长、播放开始时间。
8.在一种可选的实施例中，获取用户在历史阶段的播放行为数据，包括：获取用户在历史阶段的原始播放行为数据；对所述历史阶段的原始播放行为数据去噪，得到去噪后的播放行为数据；根据所述去噪后的播放行为数据中的内容数据和时间数据，对所述去噪后的播放行为数据进行合并处理，得到合并处理后的播放行为数据；根据所述合并处理后
的播放行为数据中的内容数据，确定所述合并处理后的播放行为数据的总条数；根据所述合并处理后的播放行为数据中的时间数据，从所述合并处理后的播放行为数据中确定指定条数的播放行为数据，作为所述用户在历史阶段的播放行为数据。
9.在一种可选的实施例中，所述内容特征包括：内容编码特征和内容类型特征；根据所述用户在历史阶段的播放行为数据，确定所述用户在历史阶段的播放行为特征，包括：根据所述历史阶段的播放行为数据中播放行为数据的条数，确定各播放行为数据的内容编码特征；根据所述历史阶段的播放行为数据中的点播内容数据、直播频道数据，确定各播放行为数据的内容类型特征；根据所述历史阶段的播放行为数据中的时间数据，确定各播放行为数据的时间特征和位置特征。
10.在一种可选的实施例中，所述预先训练的推荐模型至少包括：特征融合模块；将所述用户在历史阶段的播放行为特征输入到预先训练的推荐模型，包括：针对所述历史阶段的每个播放行为数据，将该播放行为数据的内容编码特征、内容类型特征、时间特征和位置特征输入到所述预先训练的推荐模型中的特征融合模块，得到该播放行为数据对应的融合特征向量。
11.在一种可选的实施例中，所述预先训练的推荐模型还包括：序列编码模块；得到该播放行为数据对应的融合特征向量之后，还包括：将该播放行为数据对应的融合特征向量输入到所述预先训练的推荐模型中的序列编码模块，得到该播放行为数据对应的潜在兴趣向量。
12.在一种可选的实施例中，所述预先训练的推荐模型还包括：解码预测模块；得到该播放行为数据对应的潜在兴趣向量之后，还包括：将该播放行为数据对应的潜在兴趣向量输入到所述预先训练的推荐模型中的解码预测模块，得到该播放行为数据对应的播放内容，以及该播放内容的推荐分数；其中所述推荐分数的数值大小与所述用户对该播放行为数据对应的播放内容的喜爱程度呈正比。
13.在一种可选的实施例中，根据所述各播放内容的推荐分数，对用户进行播放内容推荐，包括：根据所述各播放内容的推荐分数，按照推荐分数从高到低的顺序排序，将排序为第1位至第s位的播放内容推荐给用户；其中s为大于1，且小于播放内容总个数的正整数。
14.在一种可选的实施例中，待训练的推荐模型包括：特征融合模块、序列编码模块、解码预测模块；预先训练推荐模型包括：获取历史阶段中已知播放内容的各播放行为数据，作为训练样本，并将所述训练样本的播放内容作为标注；根据所述训练样本，确定所述训练样本的播放行为特征；将所述训练样本的播放行为特征输入到待训练的推荐模型中的特征融合模块，得到所述待训练的特征融合模块输出的融合特征向量；将所述待训练的特征融合模块输出的融合特征向量输入到待训练的推荐模型中的序列编码模块，得到所述待训练的序列编码模块输出的潜在兴趣向量；将所述待训练的序列编码模块输出的潜在兴趣向量输入到待训练的推荐模型中的解码预测模块，得到所述待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数；根据所述训练样本的标注，以及所述待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数，确定损失；以损失最小化为训练目标，对所述待训练的推荐模型进行训练。
15.一方面，提供了一种播放内容推荐装置，该装置包括：
16.获取模块，用于获取用户在历史阶段的播放行为数据；
17.确定模块，用于根据所述用户在历史阶段的播放行为数据，确定所述用户在历史阶段的播放行为特征；其中，所述播放行为特征至少包括：内容特征、时间特征、位置特征；
18.输出模块，用于将所述用户在历史阶段的播放行为特征输入到预先训练的推荐模型，得到所述推荐模型针对所述用户输出的当前时刻的各播放内容，以及所述各播放内容的推荐分数；
19.推荐模块，用于根据所述各播放内容的推荐分数，对用户进行播放内容推荐。
20.在一种可选的实施例中，所述获取模块，还用于：获取用户在历史阶段的原始播放行为数据；对所述历史阶段的原始播放行为数据去噪，得到去噪后的播放行为数据；根据所述去噪后的播放行为数据中的内容数据和时间数据，对所述去噪后的播放行为数据进行合并处理，得到合并处理后的播放行为数据；根据所述合并处理后的播放行为数据中的内容数据，确定所述合并处理后的播放行为数据的总条数；根据所述合并处理后的播放行为数据中的时间数据，从所述合并处理后的播放行为数据中确定指定条数的播放行为数据，作为所述用户在历史阶段的播放行为数据。
21.在一种可选的实施例中，所述确定模块，还用于：根据所述历史阶段的播放行为数据中播放行为数据的条数，确定各播放行为数据的内容编码特征；根据所述历史阶段的播放行为数据中的点播内容数据、直播频道数据，确定各播放行为数据的内容类型特征；根据所述历史阶段的播放行为数据中的时间数据，确定各播放行为数据的时间特征和位置特征。
22.在一种可选的实施例中，所述输出模块，还用于：针对所述历史阶段的每个播放行为数据，将该播放行为数据的内容编码特征、内容类型特征、时间特征和位置特征输入到所述预先训练的推荐模型中的特征融合模块，得到该播放行为数据对应的融合特征向量。
23.在一种可选的实施例中，所述输出模块，还用于：在得到该播放行为数据对应的融合特征向量之后，将该播放行为数据对应的融合特征向量输入到所述预先训练的推荐模型中的序列编码模块，得到该播放行为数据对应的潜在兴趣向量。
24.在一种可选的实施例中，所述输出模块，还用于：得到该播放行为数据对应的潜在兴趣向量之后，将该播放行为数据对应的潜在兴趣向量输入到所述预先训练的推荐模型中的解码预测模块，得到该播放行为数据对应的播放内容，以及该播放内容的推荐分数；其中所述推荐分数的数值大小与所述用户对该播放行为数据对应的播放内容的喜爱程度呈正比。
25.在一种可选的实施例中，所述推荐模块，还用于：根据所述各播放内容的推荐分数，按照推荐分数从高到低的顺序排序，将排序为第1位至第s位的播放内容推荐给用户；其中s为大于1，且小于播放内容总个数的正整数。
26.在一种可选的实施例中，该装置还包括：预训练模块，用于预先训练推荐模型。具体用于：获取历史阶段中已知播放内容的各播放行为数据，作为训练样本，并将所述训练样本的播放内容作为标注；根据所述训练样本，确定所述训练样本的播放行为特征；将所述训练样本的播放行为特征输入到待训练的推荐模型中的特征融合模块，得到所述待训练的特征融合模块输出的融合特征向量；将所述待训练的特征融合模块输出的融合特征
向量输入到待训练的推荐模型中的序列编码模块，得到所述待训练的序列编码模块输出的潜在兴趣向量；将所述待训练的序列编码模块输出的潜在兴趣向量输入到待训练的推荐模型中的解码预测模块，得到所述待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数；根据所述训练样本的标注，以及所述待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数，确定损失；以损失最小化为训练目标，对所述待训练的推荐模型进行训练。
27.一方面，提供了一种电子设备，该电子设备包括一个或多个处理器和一个或多个存储器，该一个或多个存储器中存储有至少一条程序代码，该程序代码由该一个或多个处理器加载并执行以实现该播放内容推荐方法所执行的操作。
28.一方面，提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条程序代码，该程序代码由处理器加载并执行以实现该播放内容推荐方法所执行的操作。
29.本公开实施例提供的技术方案带来的有益效果至少包括：构建了一个预先训练的推荐模型，该推荐模型考虑到收视内容和收视时间等两种不同的信息，除了在播放内容中挖掘用户的兴趣偏好外，还考虑到用户收看内容的时间点所蕴含的重要偏好信息，能够很好地在不同的时间点智能地为用户推荐相应的播放内容，具有良好的推荐效果。
附图说明
30.为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
31.图1是本公开实施例提供的一种播放内容推荐方法的实施环境示意图；
32.图2是本公开实施例提供的一种播放内容推荐方法的流程图；
33.图3是本公开实施例提供的一种推荐模型的工作流程图；
34.图4是本公开实施例提供的一种播放内容推荐装置的结构示意图；
35.图5是本公开实施例提供的一种终端的结构示意图；
36.图6是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
37.为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。
38.首先，针对本公开实施例中涉及的应用场景进行描述：
39.本公开实施例涉及的播放内容推荐方法可应用于智能视频内容推荐中，具体可应用于电视内容推荐场景下的视频内容推荐。在一些实施例中，该播放内容推荐方法可以应用于电视大屏场景中。当然，该播放内容推荐方法还可以应用于其他的场景中，本公开实施例对此不加以限定。
40.图1是本公开实施例提供的一种播放内容推荐方法的实施环境示意图，参见图1，该实施环境包括：第一电子设备101、第二电子设备102、第三电子设备103和第四电子设备
104。
41.上述第一电子设备101、第二电子设备102、第三电子设备103和第四电子设备104均为播放内容推荐方法能够适用的终端设备。第一电子设备101、第二电子设备102、第三电子设备103和第四电子设备104均可以接入互联网。上述电子设备可以是电视机、投影仪、智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此，本公开实施例对此不作限定。
42.图2是本公开实施例提供的一种播放内容推荐方法的流程图，参见图2，可应用于图1中的第一电子设备101、第二电子设备102、第三电子设备103和第四电子设备104中的一种或者多种，该方法包括：
43.201、获取用户在历史阶段的播放行为数据。
44.202、根据所述用户在历史阶段的播放行为数据，确定所述用户在历史阶段的播放行为特征；其中，所述播放行为特征至少包括：内容特征、时间特征、位置特征。
45.203、将所述用户在历史阶段的播放行为特征输入到预先训练的推荐模型，得到所述推荐模型针对所述用户输出的当前时刻的各播放内容，以及所述各播放内容的推荐分数。
46.204、根据所述各播放内容的推荐分数，对用户进行播放内容推荐。
47.本公开实施例提供的方案，构建了一个预先训练的推荐模型，该推荐模型考虑到收视内容和收视时间等两种不同的信息，除了在播放内容中挖掘用户的兴趣偏好外，还考虑到用户收看内容的时间点所蕴含的重要偏好信息，能够很好地在不同的时间点智能地为用户推荐相应的播放内容，具有良好的推荐效果。
48.下面对播放内容推荐方法的工作过程进行进一步的说明。继续参见图2，该方法包括：
49.201、获取用户在历史阶段的播放行为数据。
50.电视终端设备实时收集各用户在历史阶段中的播放行为数据。播放行为数据至少包括：内容数据、时间数据、位置数据；其中内容数据包括：点播内容数据、直播频道数据；时间数据包括：播放时长、播放开始时间，还可以包括播放结束时间。电视终端设备收集到上述信息后，传输给后端服务器。
51.可选的，获取用户在历史阶段的播放行为数据，包括：获取用户在历史阶段的原始播放行为数据；对历史阶段的原始播放行为数据去噪，得到去噪后的播放行为数据；根据去噪后的播放行为数据中的内容数据和时间数据，对去噪后的播放行为数据进行合并处理，得到合并处理后的播放行为数据；根据合并处理后的播放行为数据中的内容数据，确定合并处理后的播放行为数据的总条数；根据合并处理后的播放行为数据中的时间数据，从合并处理后的播放行为数据中确定指定条数的播放行为数据，作为用户在历史阶段的播放行为数据。
52.接下来举例说明对原始播放行为数据去噪和合并处理的过程。可选的，后端服务器获取到用户在历史阶段的原始播放行为数据后，可进行下述步骤的加工处理：
53.1、去噪处理：比如，过滤掉无效的行为数据，无效的行为数据可包括：播放内容为自动播放的广告、点播内容编码或是直播频道编码缺失的、播放时长小于一定阈值(该阈值可为5分钟)等数据。通过该步骤，可以过滤掉原始播放行为数据中的噪声，降低干扰。
54.2、合并处理：比如，合并同一个用户的连续播放行为数据。对于点播类内容，合并相邻且相同内容的播放行为，比如连续收看同一部电视剧下的不同集号将被合并为同一个播放行为。对于直播类内容，合并相邻且相同的频道的播放行为，比如连续收看同一个直播频道下的不同节目也可被合并为同一个播放行为等。
55.经过去噪处理和合并处理后，根据合并处理后的播放行为数据中的时间数据，确定指定条数的播放行为数据。可选的，收集每个用户在历史阶段的播放行为数据，按照播放行为发生的时间顺序保留每个用户最近n个播放行为数据，其中n是一个可调节的阈值。
56.经过上述步骤处理过的播放行为数据，既包含点播内容数据，也包含直播频道数据。
57.202、根据用户在历史阶段的播放行为数据，确定用户在历史阶段的播放行为特征；其中，播放行为特征至少包括：内容特征、时间特征、位置特征。可选的，内容特征包括：内容编码特征和内容类型特征。
58.在一些实施例中，根据历史阶段的播放行为数据中播放行为数据的条数，确定各播放行为数据的内容编码特征；根据历史阶段的播放行为数据中的点播内容数据、直播频道数据，确定各播放行为数据的内容类型特征；根据历史阶段的播放行为数据中的时间数据，确定各播放行为数据的时间特征和位置特征。
59.可选的，可采用数据预处理模块将用户收看的不同播放内容转换为统一定义的编码格式，并提取出若干有效特征。提取特征的步骤可包括：
60.步骤1、将所有的点播内容和直播频道进行统一编码处理。假设点播内容和直播频道一共有m个，则编码池为0到m
‑
1一共有m个不同的整数值，不同的值代表不同的内容，可以通过映射表还原为其代表的原始点播内容编号或原始直播频道，可将编码池记为v。v＝{v1,v2,...,v
m
}，v
i
∈[0，m
‑
1]。
[0061]
步骤2、如前所述保留了每个用户最近n个播放行为数据后，从每个用户总长度为n的播放行为序列中，随机取出长度为l的连续播放行为序列(其中， l＜n，且l是一个可以调节的阈值)。如前所述，用户播放行为数据包括：内容数据(即，内容编码数据s
u
和内容类型数据c
u
)，时间数据t
u
，位置数据。
[0062]
步骤3、将内容编码数据s
u
中的点播内容编号或直播频道通过步骤1中的映射表转换到统一编码，记为内容编码特征v
u
。
[0063]
步骤4、将内容类型数据c
u
转换为内容类型特征c
u
包含两种值：点播、直播。通过映射表将这两值转换为整数特征值，具体来说：将“点播”值转换为整数0，将“直播”值转换为整数1。将内容类型数据c
u
中的每个值依次转换后生成内容类型特征为2个值的枚举类型，值域为[0,1]。
[0064]
步骤5、从时间数据t
u
中提取时间特征。进一步的，时间特征可分为星期值特征和小时值特征
[0065]
1)将时间数据t
u
中每个内容的播放开始时间转换为该时间对应的星期值特征即，将时间解析为每周的第几天。例如，用户在2021年1月1日10:30 开始播放，当天为星期五，则提取出5作为特征值。为7个值的枚举类型，值域为[0
‑
6]。
[0066]
2)将时间数据t
u
中每个内容的播放开始时间转换为该时间对应的小时值特征即，将时间解析为每天的第几个小时。例如，用户在2021年1月1日 10:30开始播放，则提取出10作为特征值。为24个值的枚举类型，值域为 [0
‑
23]。
[0067]
需要说明的是，针对时间信息还可提取出更多特征，比如提取播放开始时间发生在每个月的几号作为特征，提取播放开始时间发生在每小时的第几分钟作为特征等等，提取的时间特征越丰富，隐含获取到用户的生活作息规律越准确，从而能够更加智能地为用户推荐播放内容。
[0068]
步骤6、为了强化表示用户各个播放行为的前后顺序，将长度为l的连续播放行为数据中每个内容排在第几位，作为位置特征pos
u
提取出来。具体来说，将该连续播放行为数据中第一个内容的特征值设为0，第二个内容的特征值设为1，依次类推。因为连续播放行为序列的长度固定为l，所以pos
u
值也是固定的， pos
u
＝[0,1,...,l
‑
1]。
[0069]
203、将用户在历史阶段的播放行为特征输入到预先训练的推荐模型，得到推荐模型针对用户输出的当前时刻的各播放内容，以及各播放内容的推荐分数。
[0070]
在一些实施例中，预先训练的推荐模型至少包括：特征融合模块。将用户在历史阶段的播放行为特征输入到预先训练的推荐模型，包括：针对历史阶段的每个播放行为数据，将该播放行为数据的内容编码特征、内容类型特征、时间特征和位置特征输入到预先训练的推荐模型中的特征融合模块，得到该播放行为数据对应的融合特征向量。
[0071]
针对上述内容，如图3所示，将举例对特征融合模块的工作过程进行说明。具体的，内容编码特征v
u
、位置特征pos
u
、内容类型特征星期值特征小时值特征都是长度为l、值为整数的序列，但是这5个序列的值域和值对应的含义各不相同。特征融合模块需要将它们融合成一个序列，具体方式可以为：将这5个序列的数值分别通过神经网络embedding层投射到维度为d的向量空间中(d是一个可调节的阈值)，即，将序列中的每一个值转换成一个d 维的向量。将5个序列中相同位置的embedding向量按位相加。最终生成一个长度为l，每个序列值都是一个d维向量的融合特征向量e
u
。
[0072]
需要说明的是，除了上述的特征融合方法之外，还可以横向拼接多个序列的向量后(例如，将5个d维向量拼接成一个5*d维的向量)，输入一个全连接层，输出长度为l的融合特征向量e
u
。即，通过神经网络训练得到融合特征向量e
u
。当然，还可采用其他方式进行特征融合，本公开对此不作限制。
[0073]
可选的，预先训练的推荐模型还包括：序列编码模块。得到该播放行为数据对应的融合特征向量e
u
之后，还包括：将该播放行为数据对应的融合特征向量e
u
输入到预先训练的推荐模型中的序列编码模块，得到该播放行为数据对应的潜在兴趣向量h
u
。
[0074]
针对上述内容，将举例对序列编码模块的工作过程进行说明。继续如图3 所示，具体的，序列编码模块可采用一个基于深度神经网络的时间序列模型，经过多层网络结构的转换，提取出与输入的用户播放行为数据中的融合特征向量e
u
一一对应的用户潜在兴趣向量h
u
。
[0075]
需要说明的是，为了能够进一步挖掘出播放行为数据中的行为模式，本公开中的序列编码模块可选择时间序列模型 (bidirectional encoder representations from transformers，bert)来进行兴趣建模，同时重点考虑到将播放行为发生的时间作为特征
融合到模型里，当然也可以采用其他模型，比如循环神经网络(recurrent neural network，rnn)、长短期记忆网络(long short
‑
term memory，lstm)等，本公开对此不做限制。
[0076]
可选的，预先训练的推荐模型还包括：解码预测模块。继续见图3，得到该播放行为数据对应的潜在兴趣向量之后，还包括：将该播放行为数据对应的潜在兴趣向量输入到预先训练的推荐模型中的解码预测模块，得到该播放行为数据对应的播放内容v，以及该播放内容的推荐分数score；其中推荐分数score的数值大小与用户对该播放行为数据对应的播放内容的喜爱程度呈正比。
[0077]
针对上述内容，将举例对解码预测模块的工作过程进行说明。具体的，用户潜在兴趣向量h
u
中最后一个值融合了输入的全部序列信息。解码预测模块将基于预测出用户实际观看的内容可使用一层全连接网络结构将转换成m维的向量，作为用户潜在兴趣在全部m个内容上的分布。再通过softmax 函数处理，输出该推荐模型预测的用户对每一个播放内容喜爱的概率，即推荐分数，并将其记为p(v)。
[0078]
在推荐模型的预先训练过程中，已知最后一位的实际播放内容为本公开可使用p(v)和的交叉熵作为模型loss。本公开可使用adam算法对该推荐模型的参数进行优化，当然，还可以采用sgd、rmsprop等其他优化算法，本公开对此不作限制。通过多轮迭代训练，直到达到预定的迭代次数或是模型loss不再减小。
[0079]
204、根据各播放内容的推荐分数，对用户进行播放内容推荐。
[0080]
继续沿用上例，将内容编码特征v
u
、位置特征pos
u
、内容类型特征星期值特征小时值特征输入到训练好的推荐模型中，得到用户当前时刻对全部播放内容的喜爱概率分布p(v)，将各概率分布值作为推荐分数score。
[0081]
得到了各播放内容的推荐分数后，根据各播放内容的推荐分数，按照推荐分数从高到低的顺序排序，将排序为第1位至第s位的播放内容推荐给用户；其中s为大于1，且小于播放内容总个数的正整数。具体的，将p(v)中所有推荐分数从高到低排列，可取前s个内容(s≥1，s可以根据实际推荐场景进行调节)，并获取对应的内容编码。根据前述得到的映射表，将需要推荐的内容编码还原为实际的点播内容编号或是直播频道，作为最终推荐结果返回给电视终端，电视终端实时更新推荐结果。
[0082]
在实施本方案之前，需要预先训练推荐模型。可选的，待训练的推荐模型包括：特征融合模块、序列编码模块、解码预测模块。预先训练推荐模型包括：获取历史阶段中已知播放内容的各播放行为数据，作为训练样本，并将训练样本的播放内容作为标注；根据训练样本，确定训练样本的播放行为特征；将训练样本的播放行为特征输入到待训练的推荐模型中的特征融合模块，得到待训练的特征融合模块输出的融合特征向量；将待训练的特征融合模块输出的融合特征向量输入到待训练的推荐模型中的序列编码模块，得到待训练的序列编码模块输出的潜在兴趣向量；将待训练的序列编码模块输出的潜在兴趣向量
输入到待训练的推荐模型中的解码预测模块，得到待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数；根据训练样本的标注，以及待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数，确定损失；以损失最小化为训练目标，对待训练的推荐模型进行训练。
[0083]
需要说明的是，本公开中的推荐模型需要根据用户在历史阶段的播放行为数据预测出用户在下一个时刻(也即当前时刻)最可能收看的内容是什么。对于已知的用户收看内容的内容编码特征推荐模型需要根据前l
‑
1的特征序列预测出下一个内容是的概率最高。因此在处理训练样本数据时，将内容编码特征v
u
中最后一位的真实值隐藏，用统一的特殊值[mask]标记，即，将原始内容编码特征v
u
替换为同样需要隐藏内容类型特征中最后一位，记为星期值特征和小时值特征无需特殊处理。而内容编码特征v
u
最后一个的实际值就是推荐模型预测的目标，也就是该样本对应的标签label。在推荐模型的预先训练过程中，已知最后一位的实际播放内容为本公开可使用p(v)和的交叉熵作为模型loss。通过多轮迭代训练，直到达到预定的迭代次数或是模型loss不再减小，则该推荐模型训练完成。
[0084]
本公开实施例提供的方案，构建了一个预先训练的推荐模型，模型数量少并且推荐模型的结构简单，模型的训练过程也较为简单，该推荐模型在训练过程中融合了点播内容和直播频道等信息。该推荐模型考虑到收视内容和收视时间等两种不同的信息，除了在播放内容中挖掘用户的兴趣偏好外，还考虑到用户收看内容的时间点所蕴含的重要偏好信息，该信息其实还隐含着用户的生活作息规律，能够很好地在不同的时间点智能地为用户推荐相应的播放内容，具有良好的推荐效果。
[0085]
上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。
[0086]
图4是本公开实施例提供的一种播放内容推荐装置的结构示意图，参见图4，该装置包括：
[0087]
获取模块301，用于获取用户在历史阶段的播放行为数据；
[0088]
确定模块302，用于根据所述用户在历史阶段的播放行为数据，确定所述用户在历史阶段的播放行为特征；其中，所述播放行为特征至少包括：内容特征、时间特征、位置特征；
[0089]
输出模块303，用于将所述用户在历史阶段的播放行为特征输入到预先训练的推荐模型，得到所述推荐模型针对所述用户输出的当前时刻的各播放内容，以及所述各播放内容的推荐分数；
[0090]
推荐模块304，用于根据所述各播放内容的推荐分数，对用户进行播放内容推荐。
[0091]
在一种可选的实施例中，所述获取模块301，还用于：获取用户在历史阶段的原始播放行为数据；对历史阶段的原始播放行为数据去噪，得到去噪后的播放行为数据；根据去噪后的播放行为数据中的内容数据和时间数据，对去噪后的播放行为数据进行合并处
理，得到合并处理后的播放行为数据；根据合并处理后的播放行为数据中的内容数据，确定合并处理后的播放行为数据的总条数；根据合并处理后的播放行为数据中的时间数据，从合并处理后的播放行为数据中确定指定条数的播放行为数据，作为用户在历史阶段的播放行为数据。
[0092]
在一种可选的实施例中，所述确定模块302，还用于：根据历史阶段的播放行为数据中播放行为数据的条数，确定各播放行为数据的内容编码特征；根据历史阶段的播放行为数据中的点播内容数据、直播频道数据，确定各播放行为数据的内容类型特征；根据历史阶段的播放行为数据中的时间数据，确定各播放行为数据的时间特征和位置特征。
[0093]
在一种可选的实施例中，所述输出模块303，还用于：针对历史阶段的每个播放行为数据，将该播放行为数据的内容编码特征、内容类型特征、时间特征和位置特征输入到预先训练的推荐模型中的特征融合模块，得到该播放行为数据对应的融合特征向量。
[0094]
在一种可选的实施例中，所述输出模块303，还用于：在得到该播放行为数据对应的融合特征向量之后，将该播放行为数据对应的融合特征向量输入到预先训练的推荐模型中的序列编码模块，得到该播放行为数据对应的潜在兴趣向量。
[0095]
在一种可选的实施例中，所述输出模块303，还用于：得到该播放行为数据对应的潜在兴趣向量之后，将该播放行为数据对应的潜在兴趣向量输入到预先训练的推荐模型中的解码预测模块，得到该播放行为数据对应的播放内容，以及该播放内容的推荐分数；其中推荐分数的数值大小与用户对该播放行为数据对应的播放内容的喜爱程度呈正比。
[0096]
在一种可选的实施例中，所述推荐模块304，还用于：根据各播放内容的推荐分数，按照推荐分数从高到低的顺序排序，将排序为第1位至第s位的播放内容推荐给用户；其中s为大于1，且小于播放内容总个数的正整数。
[0097]
在一种可选的实施例中，该装置还包括：预训练模块305，用于预先训练推荐模型。具体用于：获取历史阶段中已知播放内容的各播放行为数据，作为训练样本，并将训练样本的播放内容作为标注；根据训练样本，确定训练样本的播放行为特征；将训练样本的播放行为特征输入到待训练的推荐模型中的特征融合模块，得到待训练的特征融合模块输出的融合特征向量；将待训练的特征融合模块输出的融合特征向量输入到待训练的推荐模型中的序列编码模块，得到待训练的序列编码模块输出的潜在兴趣向量；将待训练的序列编码模块输出的潜在兴趣向量输入到待训练的推荐模型中的解码预测模块，得到待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数；根据训练样本的标注，以及待训练的解码预测模块输出的各播放内容以及各播放内容的推荐分数，确定损失；以损失最小化为训练目标，对待训练的推荐模型进行训练。
[0098]
本公开实施例提供的方案，提供了一种播放内容推荐装置，预先构建了一个预先训练的推荐模型，该推荐模型考虑到收视内容和收视时间等两种不同的信息，能够很好地在不同的时间点智能地为用户推荐相应的播放内容，具有良好的推荐效果。
[0099]
需要说明的是：上述实施例提供的播放内容推荐装置在对各类电子设备进行控制时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将电子设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的播放内容推荐装置与播放内容推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
[0100]
本公开实施例中的电子设备可以提供为一种终端，图5是本公开实施例提供的一种终端800的结构示意图。该终端800可以是：智能设备、平板电脑、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0101]
通常，终端800包括有：处理器801和存储器802。
[0102]
处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用dsp(digital signal processing，数字信号处理)、 fpga(field－programmable gate array，现场可编程门阵列)、pla (programmable logic array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(central processing unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以集成有gpu(graphics processing unit，图像处理器)， gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器 801还可以包括ai(artificial intelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。
[0103]
存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个程序代码，该至少一个程序代码用于被处理器801所执行以实现本公开中方法实施例中第一电子设备、第二电子设备、第三电子设备以及应用终端所提供的信息管理方法。
[0104]
在一些实施例中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803 相连。具体地，外围设备包括：射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
[0105]
外围设备接口803可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。
[0106]
射频电路804用于接收和发射rf(radio frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2g、3g、4g及 5g)、无线局域网和/或wifi(wireless fidelity，无线保真)网络。在一些实施例中，射频电路804还可以包括nfc(near field communication，近距离无线通信)有关的电路，本公开对此不加以限定。
[0107]
显示屏805用于显示ui(user interface，用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏805可以为一个，设置在终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在另一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用lcd(liquid crystal display，液晶显示屏)、 oled(organic light
‑
emitting diode,有机发光二极管)等材质制备。
[0108]
摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及 vr(virtual reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。
[0109]
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路 804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路807还可以包括耳机插孔。
[0110]
定位组件808用于定位终端800的当前地理位置，以实现导航或lbs (locationbased service，基于位置的服务)。定位组件808可以是基于美国的 gps(global positioning system，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0111]
电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0112]
在一些实施例中，终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器 813、指纹传感器814、光学传感器815以及接近传感器816。
[0113]
加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制显示屏805以横向视图或纵向视
图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
[0114]
陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3d动作。处理器 801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0115]
压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时，由处理器801根据用户对显示屏805的压力操作，实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0116]
指纹传感器814用于采集用户的指纹，由处理器801根据指纹传感器814 采集到的指纹识别用户的身份，或者，由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器801授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商logo时，指纹传感器814可以与物理按键或厂商logo集成在一起。
[0117]
光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制显示屏805的显示亮度。具体地，当环境光强度较高时，调高显示屏805的显示亮度；当环境光强度较低时，调低显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。
[0118]
接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器 801控制显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制显示屏805从息屏状态切换为亮屏状态。
[0119]
本领域技术人员可以理解，图5中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。
[0120]
本公开实施例中的电子设备可以提供为一种服务器，图6是本公开实施例提供的一种服务器的结构示意图，该服务器900可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(central processing units，cpu)901 和一个或多个的存储器902，其中，该一个或多个存储器902中存储有至少一条程序代码，该至少一条程序代码由该一个或多个处理器901加载并执行以实现上述各个方法实施例中服务器执行的信息管理方法。当然，该服务器900还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器900还可以包括其他用于实现设备功能的部件，在此不做赘述。
[0121]
在示例性实施例中，还提供了一种计算机可读存储介质，例如包括程序代码的存储器，上述程序代码可由处理器执行以完成上述实施例中的信息管理方法。例如，该计算
机可读存储介质可以是只读存储器(read
‑
only memory,rom)、随机存取存储器(random access memory，ram)、只读光盘(compact discread
‑
only memory，cd
‑
rom)、磁带、软盘和光数据存储设备等。
[0122]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来程序代码相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0123]
上述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许鹭清;田泽康;蒋文;危明;吴勇
技术所有人：易视腾科技股份有限公司
我是此专利的发明人

上一篇：一种古陶瓷电阻率测定方法与流程
上一篇：一种基于U型残差神经网络的细胞图像分割示踪方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。