基于仿生小波变换的语音增强方法与流程

文档序号:24339723发布日期:2021-03-19 12:21阅读:297来源:国知局
基于仿生小波变换的语音增强方法与流程

本发明属于语音信号处理技术领域,涉及一种基于仿生小波变换的语音增强方法。



背景技术:

语音增强算法基本划分为四类方法,即参数方法、非参数方法、统计方法和其他方法。参数方法多利用语音生成模型的方式进行去噪,例如ar模型,提取模型其中的参数如基音周期、系数等,且往往会采用迭代方法。假如实际噪音或语音条件与模型存在的差距较大或模型参数的提取相对困难,那么这种方法很可能没有效果。非参数方法则不用从带噪语音信号中提取模型参数,因而约束条件比较少,所以非参数方法的使用范围较大,也因为限制比较少,可利用统计信息几乎没有,去噪效果通常不是最优化的。统计方法是基于语音和噪音统计特性的方法,通常需构建模型库,并需在训练过程中获得初始统计参数,同时它与语音识别系统紧密关联。其它方法,如小波滤波去噪法。

使用传统的语音增强算法对环境噪声进行去噪处理时,谱减法适用的信噪比范围相对较小,同时信噪比较低时对语音的可懂度损伤较大,且频谱相减会产生“音乐噪声”;维纳滤波法,对带噪语音增强后信噪比提高通常不明显;谐波增强方法,仅适用于平稳白噪声的去除,当噪声强度较大时,基音周期无法准确估计;mmse估计方法去噪,该方法的计算量相对较大,且语音频谱先验分布的求取在一定程度上由统计结果的代表性和重现性来决定。小波变换其自身拥有多分辨率分析、多尺度分析、低snr下仍有效去除噪声、对非平稳信号处理效果相对较好等优点,成为语音增强算法研究热点之一。目前,随着对小波变换语音增强算法的不断研究,小波变换仍还存在着某些缺陷:一是不能较好地反应人耳对信号幅度和频率的听觉特性;二是当语音信号与噪声信号于频谱上相互重叠时,噪声信号不一定会被全部分离出,且语音信号有时也会误被分离出;三是软阈值法过度光滑易让信号失真和硬阈值法去噪效果欠佳。

传统小波变换阈值去噪法,小波变换不能很好地反应人耳对信号幅度和频率的听觉特性;其次,软硬阈值算法中存在固定值偏移、函数不连续、无固定偏差、阈值处收缩效果不明显等特点,以及噪声阈值估计问题,假如阈值估计的较小,去噪算法很大程度上会失效,增强的语音信号中噪声大多会保留;阈值估计的较大,那么语音信号会被错当作噪声处理掉,重构信号时将出现的失真现象等缺点。而且当噪声与语音信号在频谱上相互重叠时,小波变换后噪声信号不一定会被全部分离出,语音信号也不一定会被全部保留。



技术实现要素:

本发明的目的是,为了降低噪声对语音信号的干扰,提高语音信号的信噪比,提出一种基于仿生小波变换的语音增强方法,实现语音信号的增强。

本发明的目的是由以下技术方案来实现的:一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,

1)所述构建仿生小波变换阈值函数

为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度,为此,采用硬阈值函数及软硬阈值折衷函数构造了一种新阈值函数,表达式为:

式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷;

①新阈值函数具有连续性

当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时

当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时

因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷;

②新阈值函数的渐进线为

当|wj,k|≥λ时,新阈值函数

当|wj,k|≥λ时,

由式(4)和(5)可知,而的阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷;

2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值

将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果,

在人工蜂群算法过程中,种群大小为sn,最大迭代次数为maxcycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,sn),在搜寻过程中,首先进行初始化种群:

式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,d}及k∈{1,2,…,n}是随机产生的,同时k≠i,

适应度值的表达式为:

其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比snr:

式中,n表示语音信号长度;y(t)和分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:

式中,fitnessi表示第i个解对应的适应度值,

当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,

xi,j=xminj+rand(0,1)(xmaxj-xminj)(10)

式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,d},然后采蜜蜂继续搜寻过程,重复循环上述过程;

人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:

人工蜂群算法实现步骤为:

(a)采用随机初始化的方法初始化种群,包括种群的大小sn,最大迭代次数(maxcycle)以及控制参数limit:

(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;

(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;

(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;

(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(maxcycle),并且标记此时的最优蜜源位置;

(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;

(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;

采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:

其中,σj为第j层噪声方差;n表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计;

3)所述基于构建新阈值函数和最优阈值实现语音信号去噪

采用分帧的方式处理输入的语音信号,将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数,对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:

式中,σ是噪声方差,n为语音信号长度,然而,现实操作中噪声方差的确定值是无法获取到的,因而,用式(14)来估计噪声方差值,

其中,mad表示平均绝对偏差(meanabsolutedeviation),对噪声方差值的求取,采用第1层分解获取的高频系数cd1,主要取噪声信号系数,其次,每一层可以分别取不同的阈值,即λj,

式中,σ为噪声方差,根据每一层,估计噪声方差:

式中,{dp,i,i=1,2…n/2}表示最高分辨率时的细节信号,基于人工蜂群算法的阈值估计,得:

对于阈值函数采用新阈值函数,进行阈值处理,阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。

本发明的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。

附图说明

图1为基于仿生小波变换阈值去噪方法流程图。

具体实施方式

下面利用附图和具体实施方式对本发明作进一步说明。

参照图1,本发明的基于仿生小波变换的语音增强方法,包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪。

1)所述构建仿生小波变换阈值函数方法

主要是为了解决传统的阈值函数包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度。为此,采用硬阈值函数及软硬阈值折衷函数构造一种新构造了一种新的新阈值函数,表达式为:

式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷。

①新阈值函数具有连续性

当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时

当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时

因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷。

②新阈值函数的渐进线为

当|wj,k|≥λ时,新阈值函数

当|wj,k|≥λ时,

由式(4)和(5)可知,而阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷。

2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值

在阈值去噪的过程中,阈值的如何选取是阈值去噪的核心问题之一,阈值的估计影响着最终对带噪语音信号的去噪效果。如果阈值估计较大,带噪语音信号中的原始语音信号很可能会被误判为噪声信号而被去除掉,导致去噪后语音信号失真严重;如果阈值估计较小,那么带噪语音信号中的噪声信号不能被清除干净,去噪后语音信号存在着大量的噪声信号,导致去噪效果下降。

将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取。采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果。

在人工蜂群算法过程中,种群大小为sn,最大迭代次数(maxcycle),控制参数为limit。在搜索过程中获得随机初始解xi(i=1,2,…,sn)。在搜寻过程中,首先进行初始化种群:

式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,d}及k∈{1,2,…,n}是随机产生的,同时k≠i。

适应度值的表达式为:

其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比snr:

式中,n表示语音信号长度;y(t)和分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:

式中,fitnessi表示第i个解对应的适应度值。

当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃。如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源。

xi,j=xminj+rand(0,1)(xmaxj-xminj)(10)

式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,d},然后采蜜蜂继续搜寻过程,重复循环上述过程。

人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:

人工蜂群算法实现步骤为:

(a)采用随机初始化的方法初始化种群,包括种群的大小sn,最大迭代次数(maxcycle)以及控制参数limit:

(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;

(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;

(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;

(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(maxcycle),并且标记此时的最优蜜源位置;

(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;

(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;

采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:

其中,σj为第j层噪声方差;n表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计。

3)所述基于构建的新阈值函数和最优阈值实现语音信号去噪

具体过程如下:采用分帧的方式处理输入的语音信号。将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数。对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:

式中,σ是噪声方差,n为语音信号长度。然而,现实操作中噪声方差的确定值是无法获取到的,因而,用下式来估计噪声方差值。

其中,mad表示平均绝对偏差(meanabsolutedeviation),对噪声方差值的求取,采用第1层分解获取的高频系数cd1,主要取噪声信号系数。其次,每一层可以分别取不同的阈值,即λj。

式中,σ为噪声方差。根据每一层,噪声方差可以这样估计:

式中,{dp,i,i=1,2…n/2}表示最高分辨率时的细节信号。基于人工蜂群算法的阈值估计,得:

对于阈值函数采用新阈值函数,进行阈值处理。阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。

本发明的软件程序依据自动化、网络和计算机处理技术编制,是本领域技术人员所熟悉的技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1