本发明涉及深度学习,尤其涉及一种基于深度视觉特征的视频类型预测和推荐方法及系统。
背景技术:
1、如今,互联网技术蓬勃发展,观看网络视频已成为日常生活中重要的娱乐活动。观众面对着大量的视频信息。这给用户在搜索有趣的视频时带来了很多困难。
2、大多数现有的推荐模型只使用视频的文本描述信息进行推荐。文本描述信息包括视频描述和标题、摘要、演员、导演等。现有的视频推荐模型可以分为三类:基于内容、协同过滤(cf)和混合方法。基于内容的系统将推荐那些与用户喜欢的项目相似的项目。这种方法纯粹是基于用户配置文件中各项词条的相似性。基于协同过滤的方法可以找到具有相似兴趣的用户,并推荐这些用户最喜欢的词条。混合方法结合了基于内容和基于协同过滤的方法。大多数现有的混合方法都是基于文本描述信息的。
3、文本描述信息包含了视频标题、描述(情节、演员、类型和总结)、演员和导演等。这些都是从视频本身中获得的。但基于相似喜好的用户生成的词条来说是很少的。利用这些缺失和质量较差(例如,有时,这些文本描述信息只是为了吸引用户,视频可能会和所描述的文本相差很大)的文本描述信息进行视频类型预测以及视频推荐时,准确率较低。
技术实现思路
1、本发明提供的基于深度视觉特征的视频类型预测和推荐方法及系统,用于解决现有技术中存在的利用视频的文字描述内容进行视频类型预测及视频推荐的准确率低的问题。
2、本发明提供的一种基于深度视觉特征的视频类型预测和推荐方法,包括:
3、将多个第一视频帧分别对应的第一特征向量输入到目标长短时记忆网络,获取视频帧序列的目标视频类型,所述第一视频帧为测试集样本中的多个视频对应的视频帧,所述测试集样本是根据视频库中的多个视频确定的,所述视频帧序列为由第一预设数量个所述第一视频帧组成的序列;
4、获取所述视频库中的评分最高的第二预设数量个目标视频,并将所述目标视频推荐给用户,所述目标视频的视频类型与所述目标视频类型相同。
5、根据本发明提供的一种基于深度视觉特征的视频类型预测和推荐方法,所述将多个第一视频帧分别对应的第一特征向量输入到目标长短时记忆网络,获取视频帧序列的目标视频类型,包括:
6、将多个第一视频帧分别对应的第一特征向量输入到目标长短时记忆网络,获取所述视频帧序列在各个视频类型上的概率分布;
7、根据所述概率分布获取所述视频帧序列的所述目标视频类型。
8、根据本发明提供的一种基于深度视觉特征的视频类型预测和推荐方法,所述第一视频帧对应的第一特征向量的获取方式,包括:
9、将所述第一视频帧输入到目标残差网络,获取所述第一特征向量,所述目标残差网络根据训练后的预设残差网络确定的,所述预设残差网络是利用公共数据集训练的。
10、根据本发明提供的一种基于深度视觉特征的视频类型预测和推荐方法,所述获取所述视频库中的评分最高的第二预设数量个目标视频,并将所述目标视频推荐给用户,包括:
11、获取所述视频库中与所述目标视频类型相同的多个第一视频;
12、根据所述多个第一视频分别对应的基本信息,计算所述多个第一
13、视频分别对应的评分,所述基本信息至少包括视频的收藏信息、转发5信息及评论信息;
14、从所述多个第一视频中筛选出评分最高的第二预设数量个所述目标视频,并将所述目标视频推荐给所述用户。
15、根据本发明提供的一种基于深度视觉特征的视频类型预测和推
16、荐方法,所述目标长短时记忆网络的获取方式,包括:0将多个第二视频帧分别对应的第二特征向量输入到预设长短时
17、记忆网络中进行训练,直至所述预设长短时记忆网络收敛为止,所述第二视频帧为训练集样本中的视频对应的视频帧,所述训练集样本是根据所述视频库中的视频确定的;
18、根据收敛后的预设长短时记忆网络,得到所述目标长短时记忆网5络。
19、根据本发明提供的一种基于深度视觉特征的视频类型预测和推荐方法,所述多个第二视频帧对应的第二特征向量的获取方式,包括:
20、将所述多个第二视频帧输入到目标残差网络,获取所述第二特征向量。
21、0本发明还提供一种基于深度视觉特征的视频类型预测和推荐系
22、统,包括:类型预测模块以及视频推荐模块;
23、所述类型预测模块,用于将多个第一视频帧分别对应的第一特征向量输入到目标长短时记忆网络,获取视频帧序列的目标视频类型,
24、所述第一视频帧为测试集样本中的多个视频对应的视频帧,所述测试5集样本是根据视频库中的多个视频确定的,所述视频帧序列为由第一
25、预设数量个所述第一视频帧组成的序列;
26、所述视频推荐模块,用于获取所述视频库中的评分最高的第二预设数量个目标视频,并将所述目标视频推荐给用户,所述目标视频的视频类型与所述目标视频类型相同。
27、本发明还提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现如上述任一种所述基于深度视觉特征的视频类型预测和推荐方法。
28、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于深度视觉特征的视频类型预测和推荐方法。
29、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于深度视觉特征的视频类型预测和推荐方法。
30、本发明提供的基于深度视觉特征的视频类型预测和推荐方法及系统,利用视频的深度视觉特征,预测视频类型,并从视频库推荐评分最高且与预测的视频类型相同的多个视频给用户,相较于现有技术中基于视频的文本描述信息进行视频类型预测和视频推荐,提高了视频类型预测和视频推荐的准确率。
1.一种基于深度视觉特征的视频类型预测和推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于深度视觉特征的视频类型预测和推荐方法,其特征在于,所述将多个第一视频帧分别对应的第一特征向量输入到目标长短时记忆网络,获取视频帧序列的目标视频类型,包括:
3.根据权利要求1或2任一项所述的基于深度视觉特征的视频类型预测和推荐方法,其特征在于,所述第一视频帧对应的第一特征向量的获取方式,包括:
4.根据权利要求1所述的基于深度视觉特征的视频类型预测和推荐方法,其特征在于,所述获取所述视频库中的评分最高的第二预设数量个目标视频,并将所述目标视频推荐给用户,包括:
5.根据权利要求1所述的基于深度视觉特征的视频类型预测和推荐方法,其特征在于,所述目标长短时记忆网络的获取方式,包括:
6.根据权利要求5所述的基于深度视觉特征的视频类型预测和推荐方法,其特征在于,所述第二视频帧对应的第二特征向量的获取方式,包括:
7.一种基于深度视觉特征的视频类型预测和推荐系统,其特征在于,包括:类型预测模块以及视频推荐模块;
8.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述基于深度视觉特征的视频类型预测和推荐方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述基于深度视觉特征的视频类型预测和推荐方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于深度视觉特征的视频类型预测和推荐方法。