1.一种视频信息识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据每个语音聚类样本对所述多个语音片段数据进行聚类处理,得每个语音聚类样本类别对应的语音片段特征集,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据每一语音片段特征与所述语音聚类样本特征之间的特征距离进行聚类处理,得到每个语音聚类样本对应的语音片段特征集,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个特征距离值对当前的语音片段特征进行预聚类,得到每一语音聚类样本特征对应的初聚类语音特征集,包括:
5.根据权利要求1所述的方法,其特征在于,所述按照预设特征映射关系,建立所述语音片段特征集中语音片段特征与所述图像特征集中图像特征之间的特征匹配关系之前,还包括:
6.根据权利要求1所述的方法,其特征在于,所述按照预设特征映射关系,建立所述语音片段特征集中语音片段特征与所述图像特征集中图像特征之间的特征匹配关系,包括:
7.根据权利要求1所述的方法,其特征在于,所述基于所述特征匹配关系,对所述图像特征集进行优化处理,得到优化后的目标图像特征集,包括:
8.根据权利要求1所述的方法,其特征在于,所述根据所述对象信息及信息时序关系对所述目标语音片段特征集及所述目标图像特征集进行信息标注,得到对象信息标注结果,包括:
9.一种视频信息识别装置,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的视频信息识别方法中的步骤。