目标多媒体资源的获取方法、装置、电子设备和存储介质与流程

文档序号:26484205发布日期:2021-08-31 17:40阅读:来源:国知局

技术特征:

1.一种目标多媒体资源的获取方法,其特征在于,所述方法包括:

获取预设主题的初始主题词集;

对所述初始主题词集中的主题词进行筛选,得到所述预设主题的目标主题词集,所述目标主题词集为从所述初始主题词集中删除与所述预设主题非相关的主题词后得到的主题词集;

基于所述目标主题词集,对待处理多媒体资源进行主题匹配,得到所述预设主题对应的目标多媒体资源。

2.根据权利要求1所述的目标多媒体资源的获取方法,其特征在于,所述对所述初始主题词集中的主题词进行筛选,得到所述预设主题的目标主题词集包括:

确定所述初始主题词集中每个主题词对应的至少一个分类验证结果,所述分类验证结果为衡量所述主题词与所述预设主题间的相关程度的指标;

基于所述至少一个分类验证结果,对所述初始主题词集中的主题词进行筛选,得到所述目标主题词集。

3.根据权利要求2所述的目标多媒体资源的获取方法,其特征在于,所述至少一个分类验证结果包括每次主题词筛选对应的分类验证结果,所述基于所述至少一个分类验证结果,对所述初始主题词集中的主题词进行筛选,得到所述目标主题词集包括:

从所述每次主题词筛选对应的分类验证结果中确定目标分类验证结果,所述每次主题词筛选对应的分类验证结果为每次主题词筛选对应的当前主题词集中,每个主题词对应的分类验证结果,所述当前主题词集为基于每次主题词筛选的上一次主题词筛选的筛选结果得到的主题词集;

从所述初始主题词集中删除所述目标分类验证结果对应的主题词,得到目标相关主题词集;

在所述目标相关主题词集中的主题词数目小于等于预设数目,或所述目标相关主题词集中每个主题词对应的分类验证结果达到预设收敛阈值的情况下,将所述目标相关主题词集作为所述目标主题词集。

4.根据权利要求2或3所述的目标多媒体资源的获取方法,其特征在于,在所述至少一个分类验证结果包括每次主题词筛选对应的分类验证结果的情况下,所述确定所述初始主题词集中每个主题词对应的至少一个分类验证结果包括:

获取每次主题词筛选对应的当前主题词集;

对所述当前主题词集中的每个主题词执行遍历步骤,得到所述当前主题词集中每个主题词对应的分类验证结果;

所述遍历步骤包括:

确定当前遍历到的主题词与其他主题词间的第一相关度,所述其他主题词为所述当前主题词集中除当前遍历到的主题词以外的主题词;

确定所述其他主题词间的第二相关度;

根据所述第一相关度和所述第二相关度,得到所述当前遍历到的主题词对应的分类验证结果。

5.根据权利要求1所述的目标多媒体资源的获取方法,其特征在于,所述基于所述目标主题词集,对待处理多媒体资源进行主题匹配,得到所述目标主题词集的主题对应的目标多媒体资源包括:

基于所述目标主题词集中的主题词,在所述待处理多媒体资源中确定主题关联多媒体资源;

对所述预设主题和所述主题关联多媒体资源进行匹配,得到所述主题关联多媒体资源对应的主题匹配结果;

根据所述主题匹配结果,从所述主题关联多媒体资源中得到所述目标多媒体资源。

6.根据权利要求5所述的目标多媒体资源的获取方法,其特征在于,所述主题匹配结果包括主题相似度,所述对所述预设主题和所述主题关联多媒体资源进行匹配,得到所述主题关联多媒体资源的主题匹配结果,得到每个多媒体资源的主题匹配结果包括:

获取所述目标主题词集对应的主题特征信息;

获取所述主题关联多媒体资源对应的资源特征信息;

确定所述主题特征信息和所述资源特征信息间的主题相似度。

7.根据权利要求5所述的目标多媒体资源的获取方法,其特征在于,所述基于所述目标主题词集中的主题词,在所述待处理多媒体资源中确定主题关联多媒体资源包括:

获取所述目标主题词集中的主题词对应的第一频率,所述第一频率表征每个主题词在所述待处理多媒体资源中每个多媒体资源中出现的频率;

获取所述目标主题词集中的主题词对应的第二频率,所述第二频率表征每个主题词在所述待处理多媒体资源中出现的频率;

根据所述第一频率和所述第二频率,确定所述每个多媒体资源和所述每个主题词间的相关度权重;

根据所述相关度权重,对所述每个多媒体资源和所述每个主题词间的主题词相关度进行加权求和,得到所述每个多媒体资源和所述目标主题词集间的主题关联度;

根据所述主题关联度,从所述待处理多媒体资源中得到所述主题关联多媒体资源。

8.根据权利要求6所述的目标多媒体资源的获取方法,其特征在于,所述获取所述目标主题词集对应的主题特征信息包括:

获取所述目标主题词集中每个主题词的词特征信息;

根据所述目标主题词集中的主题词对应的第二频率,确定每个主题词的特征权重,所述第二频率表征每个主题词在所述待处理多媒体资源中出现的频率;

根据所述每个主题词的特征权重,对所述每个主题词的词特征信息进行加权求和,得到所述主题特征信息。

9.根据权利要求6所述的目标多媒体资源的获取方法,其特征在于,所述主题关联多媒体资源包括多个多媒体资源,所述获取所述主题关联多媒体资源对应的资源特征信息包括:

获取每个多媒体资源对应的初始资源特征信息;

确定与每个多媒体资源的关联主题词;

根据每个关联主题词对应的第三频率和所述关联主题词,确定每个多媒体资源的特征权重,所述第三频率表征每个关联主题词在所述待处理多媒体资源中出现的频率;

基于所述每个多媒体资源的特征权重,对每个多媒体资源对应的初始资源特征信息进行加权,得到所述资源特征信息。

10.根据权利要求1所述的目标多媒体资源的获取方法,其特征在于,所述方法还包括:

获取历史时间段内的多个多媒体资源;

获取与所述目标主题词集中每个主题词分别匹配的搜索词对应的多媒体资源搜索结果;

将所述历史时间段内的多个多媒体资源和所述多媒体资源搜索结果作为所述待处理多媒体资源。

11.根据权利要求1所述的目标多媒体资源的获取方法,其特征在于,所述方法还包括:

获取所述目标多媒体资源的多媒体资源质量信息;

比对所述多媒体资源质量信息和预设的多媒体资源质量指标,得到质量比对结果;

根据所述质量比对结果,对所述目标多媒体资源进行筛选,得到筛选后多媒体资源集。

12.一种多媒体资源的推荐方法,其特征在于,所述方法包括:

响应于所述目标对象对应的多媒体资源推荐指令,从多个预设主题中确定目标主题;

获取所述目标主题对应的多媒体资源集,所述目标主题对应的多媒体资源集为基于权利要求1到11任一项所述的目标多媒体资源的获取方法得到的多媒体资源集;

向所述目标对象推荐所述目标主题对应的多媒体资源集。

13.一种目标多媒体资源的获取装置,其特征在于,所述装置包括:

初始主题词集获取模块,被配置为执行获取预设主题的初始主题词集;

主题词筛选模块,被配置为执行对所述初始主题词集中的主题词进行筛选,得到所述预设主题的目标主题词集,所述目标主题词集为从所述初始主题词集中删除与所述预设主题非相关的主题词后得到的主题词集;

目标多媒体资源获取模块,被配置为执行基于所述目标主题词集,对待处理多媒体资源进行主题匹配,得到所述预设主题对应的目标多媒体资源。

14.根据权利要求13所述的目标多媒体资源的获取装置,其特征在于,所述主题词筛选模块包括:

分类验证结果获取单元,被配置为执行确定所述初始主题词集中每个主题词对应的至少一个分类验证结果,所述分类验证结果为衡量所述主题词与所述预设主题间的相关程度的指标;

主题词筛选单元,被配置为执行基于所述至少一个分类验证结果,对所述初始主题词集中的主题词进行筛选,得到所述目标主题词集。

15.根据权利要求14所述的目标多媒体资源的获取装置,其特征在于,所述至少一个分类验证结果包括每次主题词筛选对应的分类验证结果,所述主题词筛选单元包括:

目标分类验证结果确定单元,被配置为执行从所述每次主题词筛选对应的分类验证结果中确定目标分类验证结果,所述每次主题词筛选对应的分类验证结果为每次主题词筛选对应的当前主题词集中,每个主题词对应的分类验证结果,所述当前主题词集为基于每次主题词筛选的上一次主题词筛选的筛选结果得到的主题词集;

目标相关主题词集获取单元,被配置为珍惜从所述初始主题词集中删除所述目标分类验证结果对应的主题词,得到目标相关主题词集;

目标主题词集确定单元,被配置为执行在所述目标相关主题词集中的主题词数目小于等于预设数目,或所述目标相关主题词集中每个主题词对应的分类验证结果达到预设收敛阈值的情况下,将所述目标相关主题词集作为所述目标主题词集。

16.根据权利要求14或15所述的目标多媒体资源的获取装置,其特征在于,在所述至少一个分类验证结果包括每次主题词筛选对应的分类验证结果的情况下,所述分类验证结果获取单元包括:

当前主题词集获取单元,被配置为执行获取每次主题词筛选对应的当前主题词集;

主题词遍历单元,被配置为执行对所述当前主题词集中的每个主题词执行遍历步骤,得到所述当前主题词集中每个主题词对应的分类验证结果;

所述主题词遍历单元包括:

第一相关度确定单元,被配置为执行确定当前遍历到的主题词与其他主题词间的第一相关度,所述其他主题词为所述当前主题词集中除当前遍历到的主题词以外的主题词;

第二相关度确定单元,被配置为执行确定所述其他主题词间的第二相关度;

分类验证结果确定单元,被配置为执行根据所述第一相关度和所述第二相关度,得到所述当前遍历到的主题词对应的分类验证结果。

17.根据权利要求13所述的目标多媒体资源的获取装置,其特征在于,所述目标多媒体资源获取模块包括:

关联匹配单元,被配置为执行基于所述目标主题词集中的主题词,在所述待处理多媒体资源中确定主题关联多媒体资源;

主题匹配单元,被配置为执行对所述预设主题和所述主题关联多媒体资源进行匹配,得到所述主题关联多媒体资源对应的主题匹配结果;

目标多媒体资源获取单元,被配置为执行根据所述主题匹配结果,从所述主题关联多媒体资源中得到所述目标多媒体资源。

18.根据权利要求17所述的目标多媒体资源的获取装置,其特征在于,所述主题匹配结果包括主题相似度,所述主题匹配单元包括:

主题特征信息获取单元,被配置为执行获取所述目标主题词集对应的主题特征信息;

资源特征信息获取单元,被配置为执行获取所述主题关联多媒体资源对应的资源特征信息;

主题相似度确定单元,被配置为执行确定所述主题特征信息和所述资源特征信息间的主题相似度。

19.根据权利要求17所述的目标多媒体资源的获取装置,其特征在于,所述关联匹配单元包括:

第一频率获取单元,被配置为执行获取所述目标主题词集中的主题词对应的第一频率,所述第一频率表征每个主题词在所述待处理多媒体资源中每个多媒体资源中出现的频率;

第二频率获取单元,被配置为执行获取所述目标主题词集中的主题词对应的第二频率,所述第二频率表征每个主题词在所述待处理多媒体资源中出现的频率;

相关度权重确定单元,被配置为执行根据所述第一频率和所述第二频率,确定所述每个多媒体资源和所述每个主题词间的相关度权重;

主题关联度获取单元,被配置为执行根据所述相关度权重,对所述每个多媒体资源和所述每个主题词间的主题词相关度进行加权求和,得到所述每个多媒体资源和所述目标主题词集间的主题关联度;

关联资源获取单元,被配置为执行根据所述主题关联度,从所述待处理多媒体资源中得到所述主题关联多媒体资源。

20.根据权利要求18所述的目标多媒体资源的获取装置,其特征在于,所述主题特征信息获取单元包括:

词特征信息获取单元,被配置为执行获取所述目标主题词集中每个主题词的词特征信息;

词特征权重获取单元,被配置为执行根据所述目标主题词集中的主题词对应的第二频率,确定每个主题词的特征权重,所述第二频率表征每个主题词在所述待处理多媒体资源中出现的频率;

加权求和单元,被配置为执行根据所述每个主题词的特征权重,对所述每个主题词的词特征信息进行加权求和,得到所述主题特征信息。

21.根据权利要求18所述的目标多媒体资源的获取装置,其特征在于,所述主题关联多媒体资源包括多个多媒体资源,所述资源特征信息获取单元包括:

初始特征信息获取单元,被配置为执行获取每个多媒体资源对应的初始资源特征信息;

关联主题词获取单元,被配置为执行确定与每个多媒体资源的关联主题词;

资源特征权重获取单元,被配置为执行根据每个关联主题词对应的第三频率和所述关联主题词,确定每个多媒体资源的特征权重,所述第三频率表征每个关联主题词在所述待处理多媒体资源中出现的频率;

特征加权单元,被配置为执行基于所述每个多媒体资源的特征权重,对每个多媒体资源对应的初始资源特征信息进行加权,得到所述资源特征信息。

22.根据权利要求13所述的目标多媒体资源的获取装置,其特征在于,所述装置还包括:

历史资源获取模块,被配置为执行获取历史时间段内的多个多媒体资源;

搜索结果获取模块,被配置为执行获取与所述目标主题词集中每个主题词分别匹配的搜索词对应的多媒体资源搜索结果;

待处理多媒体资源获取模块,被配置为执行将所述历史时间段内的多个多媒体资源和所述多媒体资源搜索结果作为所述待处理多媒体资源。

23.根据权利要求13所述的目标多媒体资源的获取装置,其特征在于,所述装置还包括:

质量信息获取模块,被配置为执行获取所述目标多媒体资源的多媒体资源质量信息;

比对模块,被配置为执行比对所述多媒体资源质量信息和预设的多媒体资源质量指标,得到质量比对结果;

多媒体资源集筛选模块,被配置为执行根据所述质量比对结果,对所述目标多媒体资源进行筛选,得到筛选后多媒体资源集。

24.一种目标多媒体资源的推荐装置,其特征在于,所述装置包括:

目标主题确定模块,被配置为执行响应于所述目标对象对应的多媒体资源推荐指令,从多个预设主题中确定目标主题;

多媒体资源集获取模块,被配置为执行获取所述目标主题对应的多媒体资源集,所述目标主题对应的多媒体资源集为基于权利要求1到11任一项所述的目标多媒体资源的获取方法得到的多媒体资源集;

资源推荐模块,被配置为执行向所述目标对象推荐所述目标主题对应的多媒体资源集。

25.一种电子设备,其特征在于,包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的目标多媒体资源的获取方法或权利要求12所述的一种多媒体资源的推荐方法。

26.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至11中任一项所述的目标多媒体资源的获取方法或权利要求12所述的一种多媒体资源的推荐方法。

27.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至11任一项所述的目标多媒体资源的获取方法或权利要求12所述的一种多媒体资源的推荐方法。


技术总结
本公开关于一种目标多媒体资源的获取方法、装置、电子设备和存储介质,该方法可以获取预设主题的初始主题词集,对初始主题词集中的主题词进行筛选,从初始主题词集中删除与预设主题非相关的主题词,得到预设主题的目标主题词集。基于目标主题词集,对待处理多媒体资源进行主题匹配,可以得到预设主题对应的目标多媒体资源。该方法通过对初始主题词集中的主题词进行进一步的筛选,提高主题词与预设主题间的一致性,从而在基于目标主题词集对待处理多媒体资源进行主题匹配时,提高预设主题与目标多媒体资源的相关性,提高了主题匹配的准确性。

技术研发人员:王庆全;李明
受保护的技术使用者:北京达佳互联信息技术有限公司
技术研发日:2021.08.04
技术公布日:2021.08.31
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1