本申请实施例涉及人工智能,特别涉及一种内容标签的确定方法、装置、设备、介质及程序产品。
背景技术:
1、内容标签是指对指定内容进行高度概括的关键字或词,例如:对于视频来说,其内容标签可以是视频中出现的人名,剧名,曲名,物品,场景等,帮助观看者更加直接的了解视频内容。
2、相关技术中,对于视频标签的确定方法为基于检索的方法,需要根据预设标签建立相应的视频标签索引库;在实际确定指定视频帧对应的标签时,需要在视频标签索引库检索得到与指定视频帧相似度最高的目标视频帧,将目标视频帧对应的预设标签确定为指定视频帧的标签。
3、然而,相关技术中的标签确定方法仅通过图片相似度确定指定视频帧的标签,得到的标签的准确率较低。
技术实现思路
1、本申请实施例提供了一种内容标签的确定方法、装置、设备、介质及程序产品,能够提高内容标签的准确率,所述技术方案如下:
2、一方面,提供了一种内容标签的确定方法,所述方法包括:
3、获取目标内容的多个候选标签,所述多个候选标签对应有至少两种获取方式,所述至少两种获取方式是指基于至少两种不同的分析方式对所述目标内容进行分析得到候选标签的方式,所述候选标签包括在所述获取方式下对应的置信度分数;
4、获取所述目标内容对应的文本内容,所述文本内容是与所述目标内容相关联的文本数据;
5、获取所述多个候选标签分别对应的标签描述内容,所述标签描述内容用于对所述候选标签进行描述;
6、对所述多个候选标签分别对应的置信度分数进行特征提取,得到分数特征表示;以及对所述文本内容和所述标签描述内容进行特征提取,得到所述多个候选标签分别对应的关联特征表示,所述关联特征表示用于指示不同候选标签之间的关联关系;
7、基于所述分数特征表示和所述关联特征表示,从所述多个候选标签中确定所述目标内容对应的内容标签。
8、另一方面,提供了一种内容标签的确定装置,所述装置包括:
9、获取模块,用于获取目标内容的多个候选标签,所述多个候选标签对应有至少两种获取方式,所述至少两种获取方式是指基于至少两种不同的分析方式对所述目标内容进行分析得到候选标签的方式,所述候选标签包括在所述获取方式下对应的置信度分数;
10、所述获取模块,还用于获取所述目标内容对应的文本内容,所述文本内容是与所述目标内容相关联的文本数据;
11、所述获取模块,还用于获取所述多个候选标签分别对应的标签描述内容,所述标签描述内容用于对所述候选标签进行描述;
12、提取模块,用于对所述多个候选标签分别对应的置信度分数进行特征提取,得到分数特征表示;以及对所述文本内容和所述标签描述内容进行特征提取,得到所述多个候选标签分别对应的关联特征表示,所述关联特征表示用于指示不同候选标签之间的关联关系;
13、确定模块,用于基于所述分数特征表示和所述关联特征表示,从所述多个候选标签中确定所述目标内容对应的内容标签。
14、另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述实施例中任一所述内容标签的确定方法。
15、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上述实施例中任一所述的内容标签的确定方法。
16、另一方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述实施例中任一所述的内容标签的确定方法。
17、本申请实施例提供的技术方案带来的有益效果至少包括:
18、通过获取目标内容对应的文本内容以及目标内容的多个候选标签分别对应的标签描述内容,提取得到分数特征表示和关联特征表示,并对这二者进行联合分析,从而从多个候选标签中确定目标内容对应的内容标签。一方面,多个候选标签是基于至少两种不同的分析方式对目标内容进行分析得到的,增加了目标内容对应的候选标签的多样性,也提高了最终得到的内容标签的容错率;另一方面,整合了目标内容和候选标签本身的文本信息,充分利用了丰富的文本信息,且充分利用了候选标签之间的关联信息做决策,从而提高了最终得到内容标签的准确率。
1.一种内容标签的确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述文本内容和所述标签描述内容进行特征提取,得到所述多个候选标签分别对应的关联特征表示,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述文本拼接内容进行特征提取,得到所述多个候选标签分别对应的关联特征表示,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述文本拼接内容提取得到所述多个候选标签分别对应的标签文本特征表示,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述相似度分析结果包括所述文本拼接内容中拼接的所述文本内容对应的m个第一分句之间的语义相似度,m为正整数,m大于或者等于2;
7.根据权利要求6所述的方法,其特征在于,所述相似度分析结果包括所述文本拼接内容中拼接的所述标签描述内容对应的第二分句与所述m个第一分句之间的语义相似度;
8.根据权利要求3所述的方法,其特征在于,所述对所述多个候选标签中第i个候选标签和其他候选标签分别对应的标签文本特征表示进行关联度分析,得到所述第i个候选标签对应的关联特征表示,包括:
9.根据权利要求1所述的方法,其特征在于,所述对所述多个候选标签分别对应的置信度分数进行特征提取,得到分数特征表示,包括:
10.根据权利要求1至9任一所述的方法,其特征在于,所述基于所述分数特征表示和所述关联特征表示,从所述多个候选标签中确定所述目标内容对应的内容标签,包括:
11.根据权利要求10所述的方法,其特征在于,所述基于所述目标特征表示,从所述多个候选标签中确定所述目标内容对应的内容标签,包括:
12.一种内容标签的确定装置,其特征在于,所述装置包括:
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至11任一所述的内容标签的确定方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至11任一所述的内容标签的确定方法。
15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至11任一所述的内容标签的确定方法。