镜头分割方法
【专利摘要】本发明公开了一种镜头分割方法,包括步骤:A、提取视频中每一帧的尺度不变特征转换SIFT特征作为当前帧的特征,将所有特征聚类得到包含第一预设数量特征词的特征词典;B、计算相邻两帧之间的距离最大值,所述两帧之间的距离最大值大于预设阈值的位置为视频镜头分割的边界。应用本发明所述的镜头分割方法,有效地实现了对一段视频的镜头分割,较好的提取了视频数据中的镜头边界。
【专利说明】镜头分割方法
【技术领域】
[0001]本发明涉及图像处理【技术领域】,特别涉及一种镜头分割方法。
【背景技术】
[0002]随着信息传播工具的迅速发展,视频己经渐渐取代文本、图像成为人们日常生活中获取信息的一个主要途径,如何对这些视频进行有效的检索和识别已经成为互联网应用的一个重要问题。由于视频信息数据量大、分辨率统一、编码多种多样等特点,制约着基于视频内容检索的发展。因此,如何提高视频内容检测的准确度与效率,成为视频内容检索关注的问题。
[0003]为了对视频内容进行有效的组织,需要将视频分解为一个个基本单元,而一般认为视频的基本物理单元是镜头,一个镜头由一组摄像机连续拍摄得到的时间上连续的若干帧图像组成。镜头的自动分割是视频结构化的基础,也是视频分析和视频检索过程中的首要任务,镜头分割在基于内容的视频分析与检索的研究中具有重要地位,镜头分割的好坏将直接影响到更高一级的视频结构化以及后续视频检索的效果。
[0004]为了实现镜头分割,需要找出每个镜头边界,但是镜头边界之间存在突变型和连续渐变的情况,尤其对于连续渐变的情况难于处理。
[0005]因此亟需一种能够准确分割镜头的方法。
【发明内容】
[0006](一)要解决的技术问题
[0007]本发明要解决的技术问题是,针对上述缺陷,如何提供一种镜头分割方法,其能够准确的分割视频片段中的镜头。
[0008](二)技术方案
[0009]为解决上述技术问题,本发明提供了一种镜头分割方法,包括步骤:
[0010]A、提取视频中每一帧的尺度不变特征转换SIFT特征作为当前帧的特征,将所有特征聚类得到包含第一预设数量特征词的特征词典;
[0011]B、计算相邻两帧之间的距离最大值,所述两帧之间的距离最大值大于预设阈值的位置为视频镜头分割的边界。
[0012]其中,所述将所有特征聚类包括:
[0013]采用近邻传播算法将所有特征聚类。
[0014]其中,所述尺度不变特征转换SIFT特征为128维的向量。
[0015]其中,所述相邻两帧之间的距离由当前每个帧中的特征词与相邻帧特征词的距离最小值之和的平均值来计算;所述相邻两个特征词的距离由静态距离和动态距离构成,
[0016]所述相邻两个特征词的静态距离sim (W1, W2)的计算公式为sim (W1, W2)=I W1-W2 |2,其中W1, W2分别为两个特征词;
[0017]所述相邻两个特征词的动态距离md(i,j)的计算公式为
【权利要求】
1.一种镜头分割方法,其特征在于,包括步骤: A、提取视频中每一帧的尺度不变特征转换SIFT特征作为当前帧的特征,将所有特征聚类得到包含第一预设数量特征词的特征词典; B、计算相邻两帧之间的距离最大值,所述两帧之间的距离最大值大于预设阈值的位置为视频镜头分割的边界。
2.根据权利要求1所述的镜头分割方法,其特征在于,所述将所有特征聚类包括: 采用近邻传播算法将所有特征聚类。
3.根据权利要求1所述的镜头分割方法,其特征在于,所述尺度不变特征转换SIFT特征为128维的向量。
4.根据权利要求1所述的镜头分割方法,其特征在于,所述相邻两帧之间的距离由当前每个帧中的特征词与相邻帧特征词的距离最小值之和的平均值来计算;所述相邻两个特征词的距离由静态距离和动态距离构成, 所述相邻两个特征词的静态距离sim (WpW2)的计算公式为sim Cw1, w2) = W1-W2 |2,其中W1, W2分别为两个特征词; 所述相邻两个特征词的动态距离md(i,j)的计算公式为
5.根据权利要求1-4中任一项所述的镜头分割方法,其特征在于,所述计算相邻两帧之间的距离最大值具体包括: 将视频中连续的第二预设数量的帧组成滑动窗口,计算滑动窗口中相邻两帧之间的距离最大值。
6.根据权利要求5所述的镜头分割方法,其特征在于,还包括步骤: C、移动滑动窗口,返回步骤B。
【文档编号】G06T7/00GK103578094SQ201210254690
【公开日】2014年2月12日 申请日期:2012年7月20日 优先权日:2012年7月20日
【发明者】刘永进, 郭文静, 罗曦, 张金凯, 苏舟 申请人:清华大学