基于多频带信号重构的生态声音识别方法

文档序号:2826322阅读:211来源:国知局
基于多频带信号重构的生态声音识别方法
【专利摘要】本发明涉及一种基于多频带信号重构的生态声音识别方法,首先,使用OMP稀疏分解作第一阶段重构,保留前景声音的主体结构;其次,将前阶段分解的剩余分量按频带划分,根据前景声音和背景噪声的频率分布,对重构信号进行自适应补偿,完成第二阶段重构;最后,根据支撑集原子时频信息和频域信息提取复合抗噪特征,使用深信度网对生态声音在不同环境和信噪比情境下进行分类识别。本发明采用二次重构不仅能抑制噪声,并且提高了对前景声音的重构精度,在自然环境下具有较好的噪声鲁棒性。
【专利说明】基于多频带信号重构的生态声音识别方法
【技术领域】
[0001]本发明涉及一种基于多频带信号重构的生态声音识别方法。
【背景技术】
[0002]生态声音识别是对自然环境中各种声音信号进行抽取特征并作辨识。通过分析和识别环境中包含的音频信息,可以用于入侵监测、物种勘察等。在实际环境中,大量的非平稳噪声对声音识别产生干扰。因此,抗噪的生态声音识别具有重要的现实意义。
[0003]目前音频信号处理中,语音控制与说话人识别技术相对较多,而生态环境声音的研究相对较少。常用的是频域特征Mel频率倒谱系数(Mel-FrequencyCepstralCoefficients, MFCCs)以及时频域的短时傅立叶变换和小波变换等,结合高斯混合模型(GMM)或隐马尔科夫模型(HMM)进行识别分类。由于生态声音随机性较大且并非都是结构化的,所以以上方法对其不一定有效。为了解决上述问题,一些新的工作被提出,例如:Khunarsal等人提出利用声谱图模式匹配方法对短时环境声音结合KNN分类器进行识别;Zhang等人使用改进的MFCCs作为特征并使用GMM对昆虫声音分类识别;Lee等人使用谱图形态特征进行建模,对连续型鸟叫进行分类识别;Raju等人提取基音,共振峰和短时能量特征集并结合支持向量机(SVM)对包括猫狗狮子在内的19种动物声音进行分类识别。
[0004]用上述方法识别生态声音存在的常见问题在于,面对不确定结构的声音信号,设计合适的分类器较难。判别式模型如支持向量机(SVM)和传统的神经网络等,能够较好的对非线性可分类进行建模,但在高维特征及类别数量较多时,分类效果还不如GMM或HMM。此外,在噪声环境下,尤其是低信噪比时识别能力骤降。目前常用的去噪方法有谱减法,维纳滤波等。谱减去噪易引入音乐噪声从而导致信号失真。滤波去噪在获得信号和噪声统计特性的前提下可以实现最优滤波,但是在自然环境中噪声复杂多变,这些先验信息往往无法得到,所以应用范围较为有限。
[0005]基于匹配追踪(MatchingPursuit, MP)重构信号的去噪方法是利用声音的稀疏性,将信号分解重构进行自适应表示,并不需要先验的获得待检测信号和噪声的统计特性,因此能够适用于不同场景多种信号。然而在实际应用中,信号和噪声会发生重叠,尽可能的降低噪声是以增加信号失真为代价,所以去噪算法必须在降低噪声和信号失真之间进行权衡。然而,简单利用MP稀疏去噪也存在一定的局限性。MP分解过程中,从过完备字典空间搜索最优原子的计算复杂度较高。现有做法是限制字典大小,或通过智能算法在减少分解次数的同时尽量获得与原信号相关度高的原子。但是重构信号后的剩余分量中不全是噪音,还包括部分有效声音。若是单纯为了提高重构精度而增加分解次数,一方面增加了新的计算量,另一方面也无法抑制噪声,后续识别效果较差。

【发明内容】

[0006]有鉴于此,本发明的目的是提供一种基于多频带信号重构的生态声音识别方法。
[0007]本发明采用以下方案实现:一种基于多频带信号重构的生态声音识别方法,其特征在于,包括以下步骤:
[0008]SOl:分别对纯净声音和测试带噪声音进行OMP稀疏分解,对应输出纯净声音和测试带噪声音的重构信号和OMP特征;
[0009]S02:对纯净声音提取包括OMP特征在内的复合特征并进行DBN模型训练;
[0010]S03:提取测试带噪声音进行OMP稀疏分解后的残余信号的功率谱并进行多频带补偿;
[0011]S04:提取测试带噪声音进行OMP稀疏分解后的重构信号的功率谱,并结合所述步骤S03中进行多频带补偿后的残余信号的功率谱进行二次重构;
[0012]S05:对所述步骤S04中二次重构后的信号进行提取包括OMP特征在内的复合特征;
[0013]S06:对所述步骤S02中进行DBN模型训练后提取的复合特征和所述步骤S05中提取的包括OMP特征在内的符合特征进行DBN模型分类,输出测试带噪声音所属的生态声音类别。
[0014]在本发明一实施例中,假设待分解带噪声音信号f,长度为N,进行稀疏分解之前,首先构造过完备原子字典D= (gY) Y e r ,时频原子gY是Gabor原子,由参数组Y = (s, u, v, w)定义,平移因子u定义一个原子gY的中心位置,伸缩因子S,频率因子V和相位因子w定义其波形,其离散化时频参数Y = (s, u, V, w) = (aJ, paJ Δ u, ka_J Δ ν, 1八《0,其中,0〈」(1g2N,
【权利要求】
1.一种基于多频带信号重构的生态声音识别方法,其特征在于,包括以下步骤: 501:分别对纯净声音和测试带噪声音进行OMP稀疏分解,对应输出纯净声音和测试带噪声音的重构信号和OMP特征; 502:对纯净声音提取包括OMP特征在内的复合特征并进行DBN模型训练; 503:提取测试带噪声音进行OMP稀疏分解后的残余信号的功率谱并进行多频带补偿; 504:提取测试带噪声音进行OMP稀疏分解后的重构信号的功率谱,并结合所述步骤S03中进行多频带补偿后的残余信号的功率谱进行二次重构; 505:对所述步骤S04中二次重构后的信号进行提取包括OMP特征在内的复合特征; 506:对所述步骤S02中进行DBN模型训练后提取的复合特征和所述步骤S05中提取的包括OMP特征在内的符合特征进行DBN模型分类,输出测试带噪声音所属的生态声音类别。
2.根据权利要求1所述的基于多频带信号重构的生态声音识别方法,其特征在于,假设待分解带噪声音信号f,长度为N,进行稀疏分解之前,首先构造过完备原子字典D= (gY)Y e r,时频原子8¥是Gabor原子,由参数组Y = (s, u, v, w)定义,平移因子u定义一个原子gY的中心位置,伸缩因子S,频率因子V和相位因子W定义其波形,其离散化时频参数Y = (S,U,V, w) = (aJ, paJ Δ u, ka_J Δ v, i Δ w),其中,0〈j ^ 1g2N, 0 ^ p ^ N2_J+1,0 ^ k〈2J+1,0 ^ i ^ 12,a=2, Δ u=l/2, Δ V= , Δ w= π/6 ;所述步骤SOI具体步骤包括: 5011:初始化信号残差Rc/ =f,迭代次数k=l,最大迭代次数L ; 5012:从过完备原子字典D中选出第k次迭代与信号残差最为相关的原子gYk,
3.根据权利要求1所述的基于多频带信号重构的生态声音识别方法,其特征在于,所述提取包括OMP特征在内的复合特征具体方法为:提取包括OMP特征、MFCCs特征和基音特征的复合特征;其中,提取OMP特征的方法是利用OMP分解每一帧声音信号,获得表示该帧信号的支撑集前L个原子时频参数组中伸缩因子s和频率因子V的均值和标准差,构成4维OMP特征,
4.根据权利要求3所述的基于多频带信号重构的生态声音识别方法,其特征在于:选取MFCCs补充OMP特征使用,首先采用24阶Mel滤波器组,对重构信号作离散傅里叶变换后得到12维MFCCs静态特征,再加上对数能量作为其第13维特征。
5.根据权利要求3所述的基于多频带信号重构的生态声音识别方法,其特征在于:选取PITCH补充OMP特征使用,采用循环平均幅度差函数法获得每帧对应的I维PITCH特征。
6.根据权利要求1所述的基于多频带信号重构的生态声音识别方法,其特征在于:所述DBN模型训练包括两个步骤,第一步采用无监督逐层贪心的策略进行预训练,将已标记好的生态声音特征初始化DBN最底层的可见层节点的状态值,这样使得具体特征逐渐抽象化;第二步使用正确标注信息有监督的训练BP网络,并将修正信息自顶向下的传播至每一层RBM进行微调。
7.根据权利要求6所述的基于多频带信号重构的生态声音识别方法,其特征在于:RBM网络采用ContrastiveDivergence准则作为自训练策略,每层均由一个可视层V和隐层H组成,通过自底向上的层间加权连接组合多个RBM,用隐层单元的输出作为上层RBM可视层的输入,从而构建一个DBN框架,RBM包含三个参数,分别是可见层和隐层之间的权值W,以及各自偏置量b和C,因此对DBN分类器训练的过程转化为对RBM参数的求解,假设可视层和隐层的节点值分别为Vi和hp可视层V每一个节点置I的概率为
8.根据权利要求1所述的基于多频带信号重构的生态声音识别方法,其特征在于:前景声音在频谱上的分布并不是均匀的,为了确定其主频结构,将第一次重构得到的功率谱|Y’(A,j)|2平均划分为M个线性子频带,对声音帧λ,计算在频带i上的能量比例
9.根据权利要求1所述的基于多频带信号重构的生态声音识别方法,其特征在于:确定一个阈值Y,当能量比例超过阈值时,则子带i处于主频范围内,前景声音频率因子α (λ)设定较高的权重,而在主频范围之外,相应设定较低的权重,即,
【文档编号】G10L15/08GK103474066SQ201310472342
【公开日】2013年12月25日 申请日期:2013年10月11日 优先权日:2013年10月11日
【发明者】李应, 欧阳桢 申请人:福州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1