直方图的 特征值作为对应的视频的向量,记为v;统计训练视频词袋中出现的各个词汇的个数,并绘 制成直方图,将该直方图的特征值作为对应的视频的向量,记为q;
[0035] 步骤4.3:每一个测试视频对应一个视频向量v,每一个训练视频对应一个视频向 量q,得到用视频向量q、视频向量v表示的训练样本S和测试样本T。
[0036]优选地,所述步骤5包括:利用所述训练样本S训练支持向量机SVM分类器,得到训 练好的分类器记为SVM-1;具体地,使用fitcsvm函数处理训练样本S和确定的样本是正样本 还是负样本标签信息,得到MATLAB里面svmmodel类的SVM-1。
[0037]优选地,所述步骤6包括:利用SVM-1计算训练样本和测试样本的MoSIFT分数,计算
[0038]
?
[0039] 式中:a」表示SVM中第j个训练样本的估计参数,^表示第j个训练样本的标签,G (Xj,X)表示内积,Xj表示第j个训练样本的支持向量,X表示样本,b表示SVM估计参数。
[0040] 优选地,所述步骤7包括:
[0041 ]步骤7.1:将视频等分为1?份,取每份的第一帧,将所有取出来的帧的集合记为M7 [0042] 步骤7.2:提取M7中的CSD特征,具体地,用MPEG7FEX工具提取CSD特征,一帧的CSD 特征为一个向量,取维数为128,将一个视频的特征保存为一个文件,一帧的CSD特征保存为 这个文件中的一行,其中,一个视频的所有帧的特征称为包,一帧的特征称为示例。
[0043] 优选地,所述步骤8包括:
[0044] 步骤8.1:将所有训练视频中的正样本和负样本分别从1往上编上序号,每个样本 里面每一帧的CSD特征也从1往上编上序号;
[0045] 步骤8.2:对编号为1的正样本中的编号为1的示例开始依次对所有示例执行如下 处理:
[0046] 找到某示例在下一个编号的正样本中最近的示例i,将示例i和某示例链接,对示 例i执行如下处理:
[0048]
[0047]初始化 i1 = pilr,k = l 执行
[0049]
[0050] 式中表示被链接起来的第1个包的示例,k表示正在处理的是第k个包,ik表示被 链接起来的第k个包的示例,m表示正包的有m个,ED(pm k,)表示示例之间的欧氏距离, pmk表示前k个包的链接好的正示例的均值,表示第k个正包中的第ik个示例,arg ( ·)表 示找寻括号条件的参数,^4,表示t个正包中的第tt个示例;
[0051] 步骤8.3:某一个示例的链接的平均值记为u,则所有示例的链接的平均值的集合 记为P;
[0052] 步骤8.4:将训练视频中的所有负样本拼接为矩阵M8,即将所有的负包示例混合在 一起,每个示例为一行向量,得到矩阵Ms;
[0053] 步骤8.5:对矩阵Ms第一行至最后一行依次执行如下处理:
[0054]在矩阵M8某一行以下的所有行内找到距离该行最近的一行,并将距离该行最近的 一行与该行的下一行进行交换;
[0055]步骤8.6:将M8按行均分为k3份,每份纵向取平均,得到w,所有w的集合记为N;
[0056]步骤8.7:计算集合P中单个元素到N中全部元素的距离的和,取集合P中单个元素 到N中全部元素的距离的和最小的元素记为MP,即为最大动态密度点;计算公式如下:
[0057]
[0058]
[0059]式中:pmw表示pm中第W个值,pm表示不同的链接的均值的总集合,nnu表示第i个负 包示例均值。
[0060] 优选地,所述步骤9包括:根据训练样本的最大动态密度点MP计算测试样本的CSD 分数;计算公式如下:
[0061]
[0062] 式中:bit表示测试包的第i个示例;
[0063] 所述步骤10包括:所有训练样本和测试样本的MoSIFT分数和CSD分数拼成2维向量 w,训练样本的w的集合记为R,通过集合R训练SVM分类器。
[0064] 与现有技术相比,本发明具有如下的有益效果:
[0065] 1、本发明提供的基于MoSIFT和CSD特征的暴恐视频的检测方法能够有效检测出诸 如电视节目、网络视频中的暴力恐怖元素,精度高。
[0066] 2、本发明提供的基于MoSIFT和CSD特征的暴恐视频的检测方法与仅使用MoSIFT特 征进行检测的发明相比,其算法复杂度更小,因此检测速度快。
[0067] 3、本发明基于MoSIFT和CSD特征的暴恐视频的检测方法与仅使用CSD特征进行检 测的方法相比具有更好的准确性。
【附图说明】
[0068] 通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、 目的和优点将会变得更明显:
[0069] 图1为本发明提供的基于MoSIFT和CSD特征的暴恐视频检测方法的流程示意图。
【具体实施方式】
[0070] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术 人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术 人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明 的保护范围。
[0071] 具体地,如图1所示,根据本发明提供的基于MoSIFT和CSD特征的暴恐视频的检测 方法,包括如下步骤:
[0072] 步骤1:分别提取测试视频和训练视频的MoSIFT特征;
[0073]步骤2:对提取MoSIFT特征后的训练视频进行数量和维度削减;
[0074]步骤3:对数量和维度削减后的训练视频MoSIFT特征进行聚类,得到聚类中心矩 阵;
[0075]步骤4:根据聚类中心矩阵得到对应的聚类中心,利用所述聚类中心统计训练视频 和测试视频的词袋,得到训练样本和测试样本;
[0076] 步骤5:利用所述训练样本训练SVM分类器,得到分类器,记为SVM-1;
[0077] 步骤6:利用SVM-1在训练样本和测试样本上进行分类计算,计算得到分数,记为 MoSIFT 分数;
[0078] 步骤7:分别提取训练视频和测试视频的CSD特征;
[0079] 步骤8:利用均值动态密度点Mean Diversity Density,简称MDD方法,计算训练样 本的最大动态密度点MP;
[0080] 步骤9:根据训练样本的最大动态密度点MP计算训练样本和测试样本的CSD分数;
[0081] 步骤10:利用训练样本的MoSIFT分数和CSD分数训练SVM分类器,得到训练好的分 类器记为SVM-2;
[0082] 步骤11:利用SVM-2在测试样本的MoSIFT分数和CSD分数上,进行分类,进而完成对 测试视频进行分类。
[0083] 所述步骤1包括:
[0084]步骤1.1:将测试视频和训练视频拆分成帧;
[0085] 步骤1.2:处理前后相邻两帧,计算MoSIFT特征;
[0086]具体地,利用基于Opencv实现的MoSIFT算法,调用其中的MoSIFT类的构造函数,得 到前后连续两帧所具有的MoSIFT特征,并将所述MoSIFT特征保存为Opencv的Mat类型数据; [0087]步骤1.3:将一个训练视频的某帧和该帧的MoSIFT特征纵向拼接,得到相应的第一 特征矩阵,所述第一特征矩阵记为M 1;将一个测试视频的某帧和该帧的MoSIFT特征纵向拼 接,得到相应的第四特征矩阵,所述第四特征矩阵记为M4,处理完成所有视频,得