一种处于噪声条件下的数字助听器宽动态压缩算法
【技术领域】
[0001]本发明涉及语音信号处理技术领域,尤其涉及一种数字助听器宽动态压缩算法。
【背景技术】
[0002]在助听器的各类算法中,听力补偿算法是最基本最重要的一种算法。听力补偿算法的目的在于对声音进行压缩放大,将正常人的听力动态范围通过算法处理后映射到听力受损患者的听力动态范围内,并尽可能保持声音的辨识度和低失真度。助听器的使用环境中经常含有大量的噪声,所以在经动态压缩之前首先要经过语音去噪。
[0003]听力动态范围是指人耳对某一种频率的声音或某类声音从刚刚听见到对感到难以忍受的声强范围。所以可听声音域就是听阈到痛阈这一段区域,显然,听力损伤者跟正常人相比,整个可听声音域上的动态范围缩小。主要体现在一般正常人能听到较低的声音,听力损伤者无法听到。在助听器的算法中,听力补偿算法的目的是对声压级进行压缩放大,将正常人听力动态范围内的声音映射至听力受损患者听域内,并尽可能保持听觉舒适和提高声音的清晰度和辨识度。
[0004]听阈是指在某一频率范围内,一个人刚好能听到声音的声压级大小。其中SPL(声压级)的计算公式为:SPL(n) = 20 Ig (P (n)/Pref), P (η)为输入语音信号的能量,Pref为基准声压,大小等于20uPa。痛阈是指一个人所能接受的最大听力声压级大小。一般来说,听力受损患者的听阈比正常人的听阈值大,整个可听声音频域上的动态范围都缩小,其直接体现就是在某一频率范围内,正常人可以听到的较高或者较低的声音听力损伤患者都无法听到。为了对这一部分损失的听力进行补偿,使听力损伤患者能听到正常人的声音,助听器设计者提出了 “压缩”这个概念。
[0005]助听器设备通常处在噪声环境中,因此语音增强功能是非常必要的。一般的宽动态范围压缩算法而让输出声压级大小为0,这样就丢失了音频信号一部分的信息,同时也降低了可懂度和舒适度。
【发明内容】
[0006]为了解决现有技术中的问题,本发明提供了一种处于噪声条件下的数字助听器宽动态压缩算法,对“压缩”过程改进和优化,采用了线性压缩准则、舒适度准则、可懂度准则这三条准则用于约束宽动态压缩语音信号,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,并根据语言活动检测(VAD)算法对语音帧和非语音帧采取不同的处理方式。
[0007]本发明通过如下技术方案实现:
[0008]一种处于噪声条件下的数字助听器宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩的三条规则计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。
[0009]进一步地,所述步骤A中的语音增强算法为MEL域维纳滤波算法。
[0010]进一步地,所述步骤A包括以下步骤:步骤Al:对语音信号进行谱估计、功率谱密度平均、噪声估计、微纳滤波器系数计算;步骤A2:对步骤Al得到的滤波器系数在MEL域进行计算平滑,最终得到去噪之后的语音信号。
[0011]进一步地,步骤B包括以下步骤:步骤B1:确定宽动态压缩的三条规则:线性压缩准则、语音输出舒适准则、语音输出可懂度准则,并根据该准则进行计算:当噪声较小时,为了提高可懂度可以不启动去噪算法模块,当输出的语音声压级较大时,为了提高舒适度启动声音幅度控制模块,不管在什么环境下,都需要进行线性压缩,即从病人的听力区间范围线性的映射到正常人的听力区间范围中,所述三条规则中的线性准则是必选项,而其他两项是根据环境而定;步骤B2:反馈路径中的输入语音进行FFT变换,在频域中做边界扫描计笪并ο
[0012]进一步地,步骤C包括以下步骤:步骤Cl:根据语音活动检测VAD算法确定语音帧:采用双门限法端点检测,利用语音的短时能量和短时过零率这两个参数配合大量统计实验得到的阈值,高于该阈值即为语音帧,反之即为非语音帧。并计算语音信号频域子带带的声压级;步骤C2:根据步骤Dl中子带的声压级确定压缩段,进而确定各子带的增益,输出最终结果。压缩段的拐点分别是病人的听阈和痛阈,通过这两个值进行分段。
[0013]进一步地,步骤Cl包括以下步骤:步骤Cll:对语音信号进行预处理操作,分别进行分帧、预加重、加汉明窗;步骤C12:对步骤Cll得到的一帧语音信号进行快速傅里叶FFT变换得到频域信号。
[0014]进一步地,步骤C2包括以下步骤:步骤C21:根据得到的频带的声压级确定压缩段,进而计算相应的增益;步骤C22:用步骤C21得到的增益对步骤C12得到频域信号进行补偿,方法是频域信号与相应的增益相乘;步骤C23:对步骤C22得到的补偿信号进行反快速傅里叶IFFT变换得到最终结果。
[0015]本发明的有益效果是:传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
【附图说明】
[0016]图1是病人和正常人分别在各频率点的听阈与痛阈水平曲线图;
[0017]图2是本发明的宽动态压缩算法的流程图。
【具体实施方式】
[0018]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0019]附图1是病人和正常人分别在各频率点的听阈与痛阈水平曲线图,听力损失大概是50dB。其中THhiS病人的听阈,ULhi为病人的痛阈;THn为正常人的听阈,ULn为正常人的痛阈。正常人的听阈水平和痛阈水平为一定的,因为性别原因可能会有所差异;但是听力损失患者的听阈水平和痛阈水平却是因个体不同而差别迥异,所以我们的算法都是针对各个病人的不同情况而定制的。
[0020]附图2是本发明的宽动态压缩算法的流程图:1)根据语音增强算法进行滤波处理;2)启动WDRC算法;3)反馈路径的估算;4)根据VAD算法判断语音帧和非语音帧;5)将时域信号经过FFT变换成频域信号;6)计算频域每帧信号的声压级,判断该频带声压级属于哪个压缩段并计算该频带的增益;7)将原频带频域信号乘以增益,最后经过IFFT变换得到最终结果。
[0021]以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
【主权项】
1.一种处于噪声条件下的数字助听器宽动态压缩算法,其特征在于,所述宽动态压缩算法包括以下步骤: 步骤A:根据语音增强算法,输出去噪之后的语音信号; 步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出; 步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提尚?目噪比。
2.根据权利要求1所述的宽动态压缩算法,其特征在于:所述步骤A中的语音增强算法为MEL域维纳滤波算法。
3.根据权利要求2所述的宽动态压缩算法,其特征在于:所述步骤A包括以下步骤: 步骤Al:对语音信号进行谱估计、功率谱密度平均、噪声估计、微纳滤波器系数计算; 步骤Α2:对步骤Al得到的滤波器系数在MEL域进行计算平滑,最终得到去噪之后的语音信号。
4.根据权利要求1所述的宽动态压缩算法,其特征在于:步骤B包括以下步骤: 步骤B1:确定宽动态压缩的三条规则:线性压缩准则、语音输出舒适准则、语音输出可懂度准则,并根据该准则进行计算:当噪声较小时,为了提高可懂度可以不启动去噪算法模块,当输出的语音声压级较大时,为了提高舒适度启动声音幅度控制模块,不管在什么环境下,都需要进行线性压缩,即从病人的听力区间范围线性的映射到正常人的听力区间范围中,所述三条规则中的线性准则是必选项,而其他两项是根据环境而定; 步骤Β2:反馈路径中的输入语音进行FFT变换,在频域中做边界扫描计算。
5.根据权利要求1所述的方法,其特征在于,步骤C包括以下步骤: 步骤Cl:根据语音活动检测VAD算法确定语音帧:采用双门限法端点检测,利用语音的短时能量和短时过零率这两个参数配合大量统计实验得到的阈值,高于该阈值即为语音帧,反之即为非语音帧;并计算语音信号频域子带带的声压级; 步骤C2:根据步骤Dl中子带的声压级确定压缩段,进而确定各子带的增益,输出最终结果。
6.根据权利要求5所述的方法,其特征在于,步骤Cl包括以下步骤: 步骤Cll:对语音信号进行预处理操作,分别进行分帧、预加重、加汉明窗; 步骤C12:对步骤Cll得到的一帧语音信号进行快速傅里叶FFT变换得到频域信号。
7.根据权利要求5所述的方法,其特征在于,步骤C2包括以下步骤: 步骤C21:根据得到的频带的声压级确定压缩段,进而计算相应的增益; 步骤C22:用步骤C21得到的增益对C12得到频域信号进行补偿,方法是频域信号与相应的增益相乘; 步骤C23:对步骤C22得到的补偿信号进行反快速傅里叶IFFT变换得到最终结果。
【专利摘要】本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
【IPC分类】H04R25-00
【公开号】CN104703108
【申请号】CN201510066821
【发明人】刘明, 王明江, 曾伟浩, 蒋贤慧, 王兆阳, 张健, 曹彬
【申请人】哈尔滨工业大学深圳研究生院
【公开日】2015年6月10日
【申请日】2015年2月6日