视频信息识别方法、装置以及计算机可读存储介质与流程

文档序号：36967541发布日期：2024-02-07 13:15阅读：来源：国知局

技术特征：

1.一种视频信息识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据每个语音聚类样本对所述多个语音片段数据进行聚类处理，得每个语音聚类样本类别对应的语音片段特征集，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据每一语音片段特征与所述语音聚类样本特征之间的特征距离进行聚类处理，得到每个语音聚类样本对应的语音片段特征集，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述多个特征距离值对当前的语音片段特征进行预聚类，得到每一语音聚类样本特征对应的初聚类语音特征集，包括：

5.根据权利要求1所述的方法，其特征在于，所述按照预设特征映射关系，建立所述语音片段特征集中语音片段特征与所述图像特征集中图像特征之间的特征匹配关系之前，还包括：

6.根据权利要求1所述的方法，其特征在于，所述按照预设特征映射关系，建立所述语音片段特征集中语音片段特征与所述图像特征集中图像特征之间的特征匹配关系，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述特征匹配关系，对所述图像特征集进行优化处理，得到优化后的目标图像特征集，包括：

8.根据权利要求1所述的方法，其特征在于，所述根据所述对象信息及信息时序关系对所述目标语音片段特征集及所述目标图像特征集进行信息标注，得到对象信息标注结果，包括：

9.一种视频信息识别装置，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8任一项所述的视频信息识别方法中的步骤。

技术总结
本申请公开了一种视频信息识别方法、装置以及计算机可读存储介质。通过获取待识别视频中的多个语音片段数据和多个视频帧数据；根据每个语音聚类样本类别对多个语音片段数据进行聚类处理，以及根据每个图像聚类样本类别对多个视频帧数据进行聚类处理；建立聚类得到的语音片段特征集中语音片段特征与图像特征集中图像特征之间的特征匹配关系；基于特征匹配关系，对图像特征集进行优化处理，以及，对语音片段特征集进行优化处理；提取待识别视频中的对象信息及信息时序关系，并根据对象信息及信息时序关系对优化后目标语音片段特征集和目标图像特征集进行信息标注，以确定待识别视频中的目标对象信息。以此，提高视频信息识别精确度。

技术研发人员：白宁
受保护的技术使用者：游密科技（深圳）有限公司
技术研发日：
技术公布日：2024/2/6

完整全部详细技术资料下载

当前第2页1 2