一种适用于数字助听器的移频压缩方法
【技术领域】
[0001] 本发明设及助听器技术,尤其设及一种适用于数字助听器的移频压缩方法。
【背景技术】
[0002] 移频压缩算法是数字助听器中最重要的算法之一,特别是对那些感音神经性听力 损失患者。助听器主要是对语音进行放大(singleormultichannels),然而,对于感音 神经性听力损失患者来说,他们一般低频损失比较小,但高频损失很高。当损失达到60~ 70地或者W上时,如果仅仅是对高频进行补偿,是不能够满足需求的。其原因如下;(1)目 前一般助听器振幅放大增益和频带宽度受到麦克风和扬声器性能的限制,补偿增益一般只 能达到60化左右。(2)患者在高频处损失达到60地W上时,可听范围很狭窄,如图1所示 为一位病人的特征频段的听阔与痛域图,可W发现,患者在4kW下频段约有40~75化的 可听范围,而高频仅有15~30化的范围。(3)与语音中辅音的声学物理特性相关,清辅音 中绝大部分中屯、频率位于地hzW上,由于助听器在高频很难达到20地W上的增益,而有 35%的重要语音集中在2化ZW上,仅仅通过放大很难提高患者对言语理解。(4)声学上的 扩散掩蔽特性,该种特性决定了低频声音对高频声有更多的掩蔽性,由于低频放大而高频 放不大,导致元音对辅音的掩蔽性,言语辨别下降。
[0003] 但是,人耳对声音的分辨能力并不是依靠绝对频率,而是频率的相对比率,对于那 些深重度感音神经性患者,虽然高频损失严重,但其低频的残余听力范围还是比较大的。现 有可行的方法通常是把高频语音压缩到低频处,W提高患者的可听频率范围。
[0004] 早期的研究主要是单纯的进行频率压缩、等比例与非线性方式,该样却很大程度 上改变了语音的清晰度与可懂度,同时压缩之后的语音能量大大改变,也影响了患者对语 音的辨识。基于该两点的考虑,本发明根据不同频段语音所占能量与可懂度之间的关系,提 出一种基于能量守恒的适用于数字助听器的移频压缩方法,可较好的解决上述问题。
【发明内容】
[0005] 基于此,有必要针对现有技术存在的上述问题,提供一种适用于数字助听器的移 频压缩方法,W解决现有技术存在的问题。
[0006] 一种适用于数字助听器的移频压缩方法,其包括如下步骤:
[0007]S101、确定患者的高频损失程度,获得需要压缩频率范围和目标频率范围;
[0008]S103、对语音进行预处理;
[0009]S105、根据所述需要压缩频率范围和目标频率范围,算出压缩比P,W压缩率 (P+1)进行频率信号压缩;
[0010] S107、对称处理,进行N点IFFT变换;
[0011] S109、变换回来的语音与上一帖信号重叠相加,输出的信号进行自动增益补偿。
[0012] 本发明一较佳实施方式中,步骤S103中,语音的采样频率为16化Z、每帖16ms、帖 移为8ms、FFT大小为N,在FFT处理之前,进行hamming加窗处理。
[0013] 本发明一较佳实施方式中,步骤S109中,首先计算前L帖的平均声压级,再根据输 出的语音声压级。
[0014] 本发明一较佳实施方式中,进一步包括对输出的语音声压级进行如下处理:首先 统计前L帖的平均增益值gain_pre,然后用公式gam_0Ut= 3*沪"'"_jwe+ (l-€')*巧?m_〇; 计算,作为当前帖输出的声压级补偿增益。
[0015] 本发明一较佳实施方式中,对gain_pre的更新如下;
[0016] 沪_乃/-(' =九*沪_户'-(' + 0 -九)*沪,其中,gain_o是补偿后语音声压级的 补偿增益,gain_out是平滑之后的补偿增益。
[0017] 本发明一较佳实施方式中,步骤S109中,当SPL_ori小于患者的听域,则无需进行 能量补偿,认为不是语音;当SPL_ori大于患者的听域,则进行能量补偿。
[0018] 相较于现有技术,本发明提供的适用于数字助听器的移频压缩方法既保留了目标 频段的语音信息,又能够将需要压缩的高频频段进行压缩,较好的提高了语音的辨识度与 可懂度,同时也补偿了由于移频导致的语音能量损失。
【附图说明】
[0019] 图1为一位病人的特征频段的听阔与痛域图;
[0020] 图2为本发明提供的适用于数字助听器的移频压缩方法的流程图;
[0021] 图3为f;h为3化Z所得到的语音时域图;
[0022] 图4为本发明一实施例中所述适用于数字助听器的移频压缩方法的工作流程图;
[0023] 图5为本发明构建的基于频率与语音能量W及其可懂度之间的关系图;
[0024] 图6为原语音经过传统方法与采用本发明提供的所述适用于数字助听器的移频 压缩方法所获得的语音结果的对比图;
[00巧]图7为传统方法与本发明提供的所述适用于数字助听器的移频压缩方法的光谱 对比图。
【具体实施方式】
[0026] 为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中 给出了本发明的较佳实施方式。但是,本发明可许多不同的形式来实现,并不限于本文 所描述的实施方式。相反地,提供该些实施方式的目的是使对本发明的公开内容理解的更 加透彻全面。
[0027] 需要说明的是,当元件被称为"固定于"另一个元件,它可W直接在另一个元件上 或者也可W存在居中的元件。当一个元件被认为是"连接"另一个元件,它可W是直接连接 到另一个元件或者可能同时存在居中元件。本文所使用的术语"垂直的"、"水平的"、"左"、 "右及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
[0028] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的 技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具 体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语"及/或"包括一个或多 个相关的所列项目的任意的和所有的组合。
[0029] 请参阅图1,本发明提供本发明提供一种适用于数字助听器的移频压缩方法,其 包括如下步骤;SlOl、确定患者的高频损失程度,获得需要压缩频率范围和目标频率范围;S103、对语音进行预处理;S105、根据所述需要压缩频率范围和目标频率范围,算出压缩比 P,W压缩率(P+1)进行频率信号压缩间07、对称处理,进行N点IFFT变换间09、变换回来 的语音与上一帖信号重叠相加,输出的信号进行自动增益补偿。
[0030] 研究表明,语音信号的频率与语音能量W及该频率处的可懂度有如表1所示的关 系。
[0031] 表1 ;频率与语音能量和可懂度的关系
[0032]
[0033] 从表1中可W看出,语音的能量主要集中在125hz~2000hz的低频部分,占93% 左右;而化hz~祉hz的高频部分的语音可懂度占60%W上,特别是化hz~祉hz的高频 部分,语音能量只占了 2%左右,可懂度却达到了 25%,所W高频部分的语音对语音理解有 很大的作用,其中500hz~2000hz语音尤为重要。另据许伟等人的研究(许伟,曾新吾,粪 昌超,不同带宽和采样频率语音可懂度的实验研究[A],2008年全国声学学术会议论文集 [C],2008年),利用《电声产品主观评价用节目源》国家标准CD中的语音,进行不同频率重 采样获得测试源,通过8人试听的主观判断结果,对0~化hz语音进行分段滤波,考查不同 频段缺失对语音质量的影响,发现在语音内容完全可懂的要求下,语音频率的最低上限应 取在化hz,最高下限处于3(K)hz;同时,语音采样频率高于化hz时,对语音质量没有明显影 响,采样频率在化hz~地hz语音质量下降明显,但完全可懂,当采样频率低于地hz时,语 义理解变得较为困难。
[0034] 由W上研究分析可知,在进行移频压缩过程中,300hz~化hz的语音特别重要,是 不能够被破坏的,化hz~化hz的语音应尽量保留。本发明中,对于目标频率的选择,一个是 基于患者高频损伤程度,一个是基于频率与语音能量W及其可懂度之间的关系(发明人构 建的一种折算关系)。
[00巧]本发明提供的适用于数字助听器的移频压缩方法为非线性移频压缩方法,其改进 还在于对能