一种视频数据采集方法、装置、芯片及终端与流程

文档序号：37182455发布日期：2024-03-01 12:42阅读：17来源：国知局

本发明涉及人工智能，特别是涉及一种视频数据采集方法、装置、芯片及存储介质。

背景技术：

1、随着互联网的发展，积累的数据爆炸增长，使得数据库中存在着海量的数据，这些数据中包含用户感兴趣的内容，也存在许多用户不感兴趣的内容，用户感兴趣的内容的数据量和数据库包含的数据量相比如同沧海一粟，造成了数据稀疏的问题，不利于进行数据查找、采集。

技术实现思路

1、基于此，本发明提供一种视频数据采集方法、装置、芯片及存储介质，可以解决数据稀疏的技术问题。

2、第一方面，提供一种视频数据采集方法，包括：

3、确定视频数据集中各视频数据的文本特征，所述视频数据集包括至少一个视频数据；

4、根据文本卷积神经网络从所述文本特征中提取所述视频数据集的各视频数据的视频特征；

5、根据用户特征与各视频特征从所述视频数据集中的确定视频数据组成偏好视频集；

6、根据用户交互历史节点的视频特征建立偏好特征；

7、基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分，并采集满足预设偏好评分的视频数据。

8、可选的，根据用户交互历史节点的视频特征建立偏好特征包括：

9、构建包含用户交互历史节点与行为边的异构图；

10、基于所述异构图建立用户与视频数据的多层低维表征向量；

11、结合所述用户与视频数据的多层低维表征向量，基于多层向量传播按照预设时间周期建立偏好特征。

12、可选的，基于多层向量传播按照预设时间周期建立偏好特征包括：

13、借助向量传播方法通过用户第一预设时间周期历史交互结点的表征向量进行建模得到长期偏好特征；

14、和/或，

15、借助向量传播方法，通过用户第二预设时间周期历史交互结点的表征向量进行建模得到短期偏好特征；

16、所述第一预设时间周期长于所述第二预设时间周期。

17、可选的，基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分，还包括：

18、拼接所述长期偏好特征和所述短期偏好特征；

19、利用拼接后的偏好特征，基于注意力网络的预测函数，对所述偏好视频集中的视频数据进行偏好评分。

20、可选的，文本特征包括视频数据的视频标题、视频标签和/或视频内容文本。

21、第二方面，提供一种视频数据采集装置，包括：

22、文本特征确定模块，用于确定视频数据集中各视频数据的文本特征，所述视频数据集包括至少一个视频数据，所述文本特征包括视频数据的视频标题、视频标签、视频内容文本；

23、视频特征提取模块，用于根据文本卷积神经网络从所述文本特征中提取所述视频数据集的各视频数据的视频特征；

24、偏好视频集确定模块，根据用户特征与各视频特征从所述视频数据集中的确定视频数据组成偏好视频集；

25、偏好特征建立模块，用于根据用户交互历史节点的视频特征建立偏好特征；

26、评分采集模块，用于基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分；

27、视频数据采集模块，用于采集满足预设偏好评分的视频数据。

28、可选的，偏好特征建立模块还包括：

29、异构图建立单元，用于构建包含用户交互历史节点与行为边的异构图；

30、表征向量建立单元，用于基于所述异构图建立用户与视频数据的多层低维表征向量；

31、偏好特征建立单元，用于结合所述用户与视频数据的多层低维表征向量，基于多层向量传播按照预设时间周期建立偏好特征。

32、可选的，偏好特征建立单元还包括：

33、长期偏好特征建立模块，用于借助向量传播方法通过用户第一预设时间周期历史交互结点的表征向量进行建模得到长期偏好特征；和/或，

34、短期偏好特征建立模块，用于借助向量传播方法，通过用户第二预设时间周期历史交互结点的表征向量进行建模得到短期偏好特征；

35、第一预设时间周期长于所述第二预设时间周期。

36、第三方面，提供一种芯片，包括第一处理器，用于从第一存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如上介绍的视频数据采集方法的各个步骤。

37、第四方面，提供一种终端，包括第二存储器、第二处理器以及存储在所述第二存储器中并可在所述第二处理器上运行的计算机程序，第二处理器执行所述计算机程序时实现如上介绍的视频数据采集方法的各个步骤。

38、上述视频数据采集方法、装置、芯片及存储介质，通过确定视频数据集中各视频数据的文本特征，视频数据集包括至少一个视频数据，根据文本卷积神经网络从文本特征中提取视频数据集的各视频数据的视频特征，根据用户特征与各视频特征从视频数据集中的确定视频数据组成偏好视频集，根据用户交互历史节点的视频特征建立偏好特征，基于偏好特征对偏好视频集中的各视频进行偏好评分，并采集满足预设偏好评分的视频数据。本发明通过先提取视频数据集中的视频特征，基于该视频特征和用户特征从视频数据集中确定偏好视频集，可以使得数据粘稠，之后再建立偏好特征基于此对偏好视频集中的各视频数据进行偏好评分，有助于数据查找、采集。

技术特征：

1.一种视频数据采集方法，其特征在于，包括：

2.如权利要求1所述的视频数据采集方法，其特征在于，所述根据用户交互历史节点的视频特征建立偏好特征包括：

3.如权利要求2所述的视频数据采集方法，其特征在于，所述基于多层向量传播按照预设时间周期建立偏好特征包括：

4.如权利要求3所述的视频数据采集方法，其特征在于，所述基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分，还包括：

5.如权利要求1至4任意一项所述的视频数据采集方法，其特征在于，所述文本特征包括视频数据的视频标题、视频标签和/或视频内容文本。

6.一种视频数据采集装置，其特征在于，包括：

7.如权利要求6所述的视频数据采集装置，其特征在于，所述偏好特征建立模块还包括：

8.如权利要求7所述的视频数据采集装置，其特征在于，偏好特征建立单元还包括：

9.一种芯片，其特征在于，包括：第一处理器，用于从第一存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如权利要求1至5任意一项所述的一种视频数据采集方法。

10.一种终端，其特征在于，包括第二存储器、第二处理器以及存储在所述第二存储器中并可在所述第二处理器上运行的计算机程序，其特征在于，所述第二处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的一种视频数据采集方法。

技术总结
本发明实施例公开了一种视频数据采集方法、装置、芯片及终端，通过确定视频数据集中各视频数据的文本特征，视频数据集包括至少一个视频数据，根据文本卷积神经网络从文本特征中提取视频数据集的各视频数据的视频特征，根据用户特征与各视频特征从视频数据集中的确定视频数据组成偏好视频集，根据用户交互历史节点的视频特征建立偏好特征，基于偏好特征对偏好视频集中的各视频进行偏好评分，并采集满足预设偏好评分的视频数据。本发明通过先提取视频数据集中的视频特征，基于该视频特征和用户特征从视频数据集中确定偏好视频集，可以使得数据粘稠，之后再建立偏好特征基于此对偏好视频集中的各视频数据进行偏好评分，有助于数据查找、采集。

技术研发人员：谢英娜,何文钦,何炜程,何炜骏
受保护的技术使用者：深圳市博锐高科科技有限公司
技术研发日：
技术公布日：2024/2/29

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢英娜,何文钦,何炜程,何炜骏
技术所有人：深圳市博锐高科科技有限公司
我是此专利的发明人

上一篇：语音识别方法、装置、电子设备和存储介质与流程
上一篇：一种给汤机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。