视频分类方法、装置、电子设备及存储介质与流程

文档序号：36218180发布日期：2023-11-30 09:47阅读：23来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及人工智能，尤其涉及视频分类方法、装置、电子设备及存储介质。

背景技术：

1、视频作为目前互联网最主要的内容形态之一，承载着网民大量的娱乐时长。每天数以万计的视频内容被生产和消费，如何理解这些视频内容是其被合理在平台上分发的前提。

2、相关技术中，对视频进行类别标注并用于对多分类模型的训练，从而利用训练后的多分类模型对待分类视频进行处理。但视频是一个融合图片、文本、音频等的多模态信息，针对视频的标注资源较为稀缺，从而模型训练效率较低且模型应用时的分类准确性不够高。

技术实现思路

1、本公开提供视频分类方法、装置、电子设备及存储介质，以至少解决相关技术中的问题。本公开的技术方案如下：

2、根据本公开实施例的第一方面，提供一种视频分类方法，包括：

3、获取待分类视频的视频特征信息和至少一个行业类别的目标特征信息，所述目标特征信息是对所述至少一个行业类别的属性信息进行特征表示和特征提取得到的；所述至少一个行业类别的属性信息由至少一个目标账号发布；所述目标账号是用于推送广告的账号；

4、对所述视频特征信息和每一行业类别对应的目标特征信息进行相似度计算，得到至少一个相似度结果；所述相似度结果指示所述待分类视频属于与所述目标特征信息对应的行业类别的概率；

5、基于所述至少一个相似度结果，确定所述待分类视频的类别信息，所述类别信息指示所述待分类视频所属的至少一个目标类别，所述目标类别为所述至少一个行业类别中的任意一个。

6、可选的，所述方法还包括：

7、获取所述至少一个目标账号的账号信息，所述账号信息包括各所述目标账号所属的行业类别、各所述目标账号所发布的产品信息和发布页面信息；

8、根据各所述目标账号所属的行业类别，对所述至少一个目标账号进行分组，得到至少一个账号集合；所述至少一个账号集合与所述至少一个行业类别一一对应；

9、对所述账号集合中各目标账号对应的所述产品信息和所述发布页面信息进行文本提取处理，得到与所述账号集合对应的所述行业类别的文本信息；

10、对所述文本信息进行切词处理，得到词序列；

11、对所述词序列进行统计分析处理，得到对应的所述行业类别的属性信息，所述属性信息为关键词序列。

12、可选的，所述对所述账号集合中各目标账号对应的所述产品信息和所述发布页面信息进行文本提取处理，得到与所述账号集合对应的所述行业类别的文本信息，包括：

13、对所述账号集合中各目标账号的所述产品信息中的文本进行提取处理，得到产品描述文本信息；

14、对所述账号集合中各目标账号的所述发布页面信息中的图像进行图像文字识别处理，得到第一页面文本信息；

15、对所述账号集合中各目标账号的所述发布页面信息中的文本进行提取处理，得到第二页面文本信息；

16、将所述产品描述文本信息、所述第一页面文本信息和所述第二页面文本信息作为所述行业类别的文本信息。

17、可选的，所述对所述词序列进行统计分析处理，得到对应的所述行业类别的属性信息，包括：

18、对所述词序列进行统计分析处理，确定所述词序列中各单词的频率指标数据；

19、根据各所述单词的频率指标数据，对所述词序列中的各所述单词进行筛选，得到所述属性信息。

20、可选的，所述方法还包括：

21、将各所述行业类别的属性信息输入语言表示模型，进行文本特征表示处理，得到各所述行业类别对应的初始特征信息；

22、将各所述行业类别对应的初始特征信息输入编码器-解码器模型，进行文本特征提取处理，得到各所述行业类别对应的目标特征信息，所述编码器-解码器模型基于自注意力机制构建。

23、可选的，所述所述基于所述至少一个相似度结果，确定所述待分类视频的类别信息，包括：

24、基于所述至少一个相似度结果，确定目标相似度结果，所述目标相似度结果为所述至少一个相似度结果中的最大值；

25、将所述目标相似度结果对应的行业类别作为所述待分类视频所属的所述目标类别。

26、可选的，所述基于所述至少一个相似度结果，确定所述待分类视频的类别信息，还包括：

27、获取预设的每一行业类别对应的分类下限阈值；

28、确定每一行业类别对应的分类下限阈值与每一行业类别对应的相似度结果之间的比较结果；

29、根据所述比较结果，确定所述至少一个目标类别，每一目标类别对应的相似度结果不低于每一目标类别对应的分类下限阈值。

30、根据本公开实施例的第二方面，提供一种视频分类装置，包括：

31、信息获取模块，被配置为执行获取待分类视频的视频特征信息和至少一个行业类别的目标特征信息，所述目标特征信息是对所述至少一个行业类别的属性信息进行特征表示和特征提取得到的；所述至少一个行业类别的属性信息由至少一个目标账号发布；所述目标账号是用于推送广告的账号；

32、相似度计算模块，被配置为执行对所述视频特征信息和每一行业类别对应的目标特征信息进行相似度计算，得到至少一个相似度结果；所述相似度结果指示所述待分类视频属于与所述目标特征信息对应的行业类别的概率；

33、类别信息确定模块，被配置为执行基于所述至少一个相似度结果，确定所述待分类视频的类别信息，所述类别信息指示所述待分类视频所属的至少一个目标类别，所述目标类别为所述至少一个行业类别中的任意一个。

34、可选的，所述装置还包括：

35、账号信息获取单元，被配置为执行获取所述至少一个目标账号的账号信息，所述账号信息包括各所述目标账号所属的行业类别、各所述目标账号所发布的产品信息和发布页面信息；

36、账号分组单元，被配置为执行根据各所述目标账号所属的行业类别，对所述至少一个目标账号进行分组，得到至少一个账号集合；所述至少一个账号集合与所述至少一个行业类别一一对应；

37、文本提取单元，被配置为执行对所述账号集合中各目标账号对应的所述产品信息和所述发布页面信息进行文本提取处理，得到与所述账号集合对应的所述行业类别的文本信息；

38、切词单元，被配置为执行对所述文本信息进行切词处理，得到词序列；

39、统计单元，被配置为执行对所述词序列进行统计分析处理，得到对应的所述行业类别的属性信息，所述属性信息为关键词序列。

40、可选的，所述文本提取单元包括：

41、第一提取子单元，被配置为执行对所述账号集合中各目标账号的所述产品信息中的文本进行提取处理，得到产品描述文本信息；

42、第二提取子单元，被配置为执行对所述账号集合中各目标账号的所述发布页面信息中的图像进行图像文字识别处理，得到第一页面文本信息；

43、第三提取子单元，被配置为执行对所述账号集合中各目标账号的所述发布页面信息中的文本进行提取处理，得到第二页面文本信息；

44、所述行业类别的文本信息包括所述产品描述文本信息、所述第一页面文本信息和所述第二页面文本信息。

45、可选的，所述统计单元包括：

46、频率统计子单元，被配置为执行对所述词序列进行统计分析处理，确定所述词序列中各单词的频率指标数据；

47、单词筛选子单元，被配置为执行根据各所述单词的频率指标数据，对所述词序列中的各所述单词进行筛选，得到所述属性信息。

48、可选的，所述装置还包括：

49、特征表示单元，被配置为执行将各所述行业类别的属性信息输入语言表示模型，进行文本特征表示处理，得到各所述行业类别对应的初始特征信息；

50、特征提取单元，被配置为执行将各所述行业类别对应的初始特征信息输入转换器模型，进行文本特征提取处理，得到各所述行业类别对应的目标特征信息，所述转换器模型基于自注意力机制构建。

51、可选的，所述类别信息确定模块包括：

52、第一筛选单元，被配置为执行基于所述至少一个相似度结果，确定目标相似度结果，所述目标相似度结果为所述至少一个相似度结果中的最大值；

53、第一分类单元，被配置为执行将所述目标相似度结果对应的行业类别作为所述待分类视频所属的所述目标类别。

54、可选的，所述类别信息确定模块还包括：

55、阈值获取单元，被配置为执行获取预设的每一行业类别对应的分类下限阈值；

56、比较单元，被配置为执行确定每一行业类别对应的分类下限阈值与每一行业类别对应的相似度结果之间的比较结果；

57、第二分类单元，被配置为执行根据所述比较结果，确定所述至少一个目标类别，每一目标类别对应的相似度结果不低于每一目标类别对应的分类下限阈值。

58、根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现本公开实施例第一方面中任一项所述的视频分类方法。

59、根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如本公开实施例第一方面中任一项所述的视频分类方法。

60、根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行时实现如本公开实施例第一方面中任一项所述的视频分类方法。

61、本公开的实施例提供的技术方案至少带来以下有益效果：

62、在本公开的实施例中，首先获取待分类视频的视频特征信息和至少一个行业类别的目标特征信息，其中目标特征信息是对至少一个行业类别的属性信息进行特征表示和特征提取得到的，属性信息是由至少一个目标账号发布，目标账号是用于推送广告的账号，也即是将至少一个目标账号发布的至少一个行业类别的属性信息作为视频分类中各行业类别的先验信息，并将至少一个行业类别的属性信息特征表示和特征提取后引入到对待分类视频的分类任务中，辅助分类模型对各行业类别的理解，减少人工进行行业分类和行业类别定义的操作，提升视频分类的效率；其次，根据视频特征信息和各行业类别对应的目标特征信息，进行相似度计算，得到至少一个相似度结果，相似度结果指示待分类视频属于与目标特征信息对应的行业类别的概率，从而可以基于至少一个相似度结果，确定待分类视频的类别信息，类别信息指示待分类视频所属的至少一个目标类别，目标类别为所述至少一个行业类别中的任意一个，也即是利用至少一个行业类别的目标特征信息作为分类参考依据，考察视频特征与至少一个行业类别的特征上的相似程度，优化了分类任务中的分类函数，能够快速且准确地对视频进行分类。

63、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴雪辉徐路
技术所有人：北京达佳互联信息技术有限公司
我是此专利的发明人

上一篇：一种畜牧自动饲喂系统的料箱的制作方法
上一篇：半导体装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。