一种用于提高音频分类器的gdm特征选择方法

文档序号：6551150阅读：292来源：国知局

一种用于提高音频分类器的gdm特征选择方法
【专利摘要】本发明公开了一种用于提高音频分类器性能的GDM特征选择方法，对每一种音频类型c，c∈[1,C]，训练每种特征f的高斯混合模型Gfc；挑选第一个特征f1，对每一个特征，计算每两类别之间的分离度，选择第一个特征满足使所有类别之间的平均分离度最大；在选出第一个特征f1后，从待选择的特征集合中去掉特征f1，并找出f1对应的各个类别中分离度最小的两个类c1和c2；选择第二个特征f2，选择使得步骤三中找出的两个类c1和c2分离度最大的特征f2；在选出第二个特征f2后，从待选则特征集合中去掉特征f2，并用选出的特征f1和f2组成一个特征矢量，最终得到选出的特征为。本发明选出的特征子集能够使得最容易混淆的类别区分性最好，能够提高分类器整体的分类精度。
【专利说明】一种用于提高音频分类器的GDM特征选择方法

【技术领域】
[0001]本发明属于音频特征提取领域，尤其涉及一种用于提高音频分类器的GDM特征选择方法。

【背景技术】
[0002]音频特征，是影响音频分类器性能的另一关键因素。一段原始音频流本身仅仅是一种非语义符号表示和非结构化的二进制流，除了含有采样频率、量化精度以及编码方法等有限的信息外，本身并不包含明确的结构信息和语义信息。
[0003]人耳具有极强的分辨能力，给定一段音频流，不仅可以立即分辨出音频的类型，还能分辨出音频中说话人的情绪以及音乐的基调(兴奋或压抑等)等很难描述的声音特征。要使计算机能够具备像人耳一样对音频进行分类和识别的功能，首先需要将音频流从一系列的二值符号转变为能够反映不同音频类型之间差异的特征参数，即特征提取。特征提取是各种分类问题的基础。
[0004]根据特定问题和特定领域的性质，选择有明显区分能力的特征，是设计分类过程中非常关键的一部分。在有限训练样本的情况下，我们希望用尽可能少的特征设计具有良好通用性的分类器。
[0005]传统特征选择的算法基于使所有类别的平均离散程度最大(GMM based MeanSeparability Maximizat1n,简称GMSM)准则,这种特征选择算法的性能很容易受易分类别的影响。而实际上，多类音频分类器的性能除了受易分类别的影响外，更多的是受易混淆类别的影响，要提高分类器的性能，提高易混淆类别间的分类精度是问题的关键所在，因此，特征选择时，应该选取那些使得易混淆类别更容易区分的特征。

【发明内容】

[0006]本发明的目的在于提供一种用于提高音频分类器的GDM特征选择方法，旨在提高易混淆类别间的分类精度。
[0007]本发明是这样实现的，一种用于提高音频分类器的GDM特征选择方法的具体步骤如下:
[0008]步骤一、训练模型，对每一种音频类型C，c e [1，C]，训练每种特征f的高斯混合模型Gf。；
[0009]步骤二、挑选第一个特征，对每一个特征，计算每两类别之间的分离度，选择第一个特征满足使所有类别之间的平均分离度最大，即:
[0010]

【权利要求】
1.一种用于提高音频分类器的GDM特征选择方法，其特征在于，所述的用于提高音频分类器的GDM特征选择方法的具体步骤如下: 步骤一、训练模型，对每一种音频类型c，c e [1，C]，训练每种特征f的高斯混合模型Gfc ；步骤二、挑选第一个特征Π，对每一个特征，计算每两类别之间的分离度，选择第一个特征满足使所有类别之间的平均分离度最大，即:./; = arg max V V S1 (Gil, Gij);
步骤三、在选出第一个特征fi后，从待选择的特征集合中去掉特征fi，并找出fi对应的各个类别中分离度最小的两个类C1和C2,即:
步骤四、选择第二个特征f2，选择使得步骤三中找出的两个类C1和C2分离度最大的特征4，即:
步骤五、在选出第二个特征f2后，从待选则特征集合中去掉特征f2，并用选出的特征和f2组成一个特征矢量，迭代步骤三-步骤四，在迭代时，用下面的公式分别代替步骤三和步骤四中的两个公式，即:
其中，I表示迭代的次数；判断是否满足迭代截止条件，若1〈L，则返回步骤三，否则，停止迭代，得到选出的特征为:4，f2，…，fL。
2.如权利要求1所述的用于提高音频分类器的GDM特征选择方法，其特征在于，用于提高音频分类器的GDM特征选择方法的问题描述如下: 假设有C个音频类型，F种特征，要从中选出L个子特征，首先，对于每一种特征f，训练每一个类别的高斯混合模型GMMf。，c e [1，C]，第c类高斯混合分布的概率密度函数为:
其中,K表示混合分量的个数，?c = (Ji 1；..., Ji κ, θ 1；..., θ κ),表示模型的参数，π j,表示第i个混合分量的权重，满足约束条件
Qi= {μ” Σ^，表示第i个混合分?-1量的参数； P (Xl θ J为每一个高斯分量，其表达形式如下:
其中，μ i为D维的均值矢量，表示高斯分量的均值； Si SDXD的协方差矩阵；定义两个类别之间的分离度(Separability)为:
Sf (GMMfk, GMMfl) = dis (GMMfk, GMMfl) dis(.，.)表示两个高斯混合模型之间的距离，采用改进的对称距离度量K-L2距离，计算公式如下:
【文档编号】G06K9/62GK104077382SQ201410298526
【公开日】2014年10月1日申请日期:2014年6月27日优先权日:2014年6月27日
【发明者】王荣燕, 戎丽霞申请人:德州学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王荣燕;戎丽霞
技术所有人：德州学院
我是此专利的发明人

上一篇：一种特征匹配的方法、装置及图像识别设备的制作方法
上一篇：基于四元相位叠合模型的图像模糊度评估方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。