一种适用于数字助听器的移频压缩方法

文档序号：8925668阅读：948来源：国知局

一种适用于数字助听器的移频压缩方法
【技术领域】
[0001] 本发明设及助听器技术，尤其设及一种适用于数字助听器的移频压缩方法。
【背景技术】
[0002] 移频压缩算法是数字助听器中最重要的算法之一，特别是对那些感音神经性听力损失患者。助听器主要是对语音进行放大（singleormultichannels),然而，对于感音神经性听力损失患者来说，他们一般低频损失比较小，但高频损失很高。当损失达到60~ 70地或者W上时，如果仅仅是对高频进行补偿，是不能够满足需求的。其原因如下；（1)目前一般助听器振幅放大增益和频带宽度受到麦克风和扬声器性能的限制，补偿增益一般只能达到60化左右。（2)患者在高频处损失达到60地W上时，可听范围很狭窄，如图1所示为一位病人的特征频段的听阔与痛域图，可W发现，患者在4kW下频段约有40~75化的可听范围，而高频仅有15~30化的范围。（3)与语音中辅音的声学物理特性相关，清辅音中绝大部分中屯、频率位于地hzW上，由于助听器在高频很难达到20地W上的增益，而有 35%的重要语音集中在2化ZW上，仅仅通过放大很难提高患者对言语理解。（4)声学上的扩散掩蔽特性，该种特性决定了低频声音对高频声有更多的掩蔽性，由于低频放大而高频放不大，导致元音对辅音的掩蔽性，言语辨别下降。
[0003] 但是，人耳对声音的分辨能力并不是依靠绝对频率，而是频率的相对比率，对于那些深重度感音神经性患者，虽然高频损失严重，但其低频的残余听力范围还是比较大的。现有可行的方法通常是把高频语音压缩到低频处，W提高患者的可听频率范围。
[0004] 早期的研究主要是单纯的进行频率压缩、等比例与非线性方式，该样却很大程度上改变了语音的清晰度与可懂度，同时压缩之后的语音能量大大改变，也影响了患者对语音的辨识。基于该两点的考虑，本发明根据不同频段语音所占能量与可懂度之间的关系，提出一种基于能量守恒的适用于数字助听器的移频压缩方法，可较好的解决上述问题。

【发明内容】

[0005] 基于此，有必要针对现有技术存在的上述问题，提供一种适用于数字助听器的移频压缩方法，W解决现有技术存在的问题。
[0006] 一种适用于数字助听器的移频压缩方法，其包括如下步骤：
[0007]S101、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围；
[0008]S103、对语音进行预处理；
[0009]S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比P，W压缩率 (P+1)进行频率信号压缩；
[0010] S107、对称处理，进行N点IFFT变换；
[0011] S109、变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿。
[0012] 本发明一较佳实施方式中，步骤S103中，语音的采样频率为16化Z、每帖16ms、帖移为8ms、FFT大小为N，在FFT处理之前，进行hamming加窗处理。
[0013] 本发明一较佳实施方式中，步骤S109中，首先计算前L帖的平均声压级，再根据输出的语音声压级。
[0014] 本发明一较佳实施方式中，进一步包括对输出的语音声压级进行如下处理：首先统计前L帖的平均增益值gain_pre，然后用公式gam_0Ut= 3*沪"'"_jwe+ (l-€')*巧?m_〇; 计算，作为当前帖输出的声压级补偿增益。
[0015] 本发明一较佳实施方式中，对gain_pre的更新如下；
[0016] 沪_乃/-(' =九*沪_户'-(' + 0 -九）*沪，其中，gain_o是补偿后语音声压级的补偿增益，gain_out是平滑之后的补偿增益。
[0017] 本发明一较佳实施方式中，步骤S109中，当SPL_ori小于患者的听域，则无需进行能量补偿，认为不是语音；当SPL_ori大于患者的听域，则进行能量补偿。
[0018] 相较于现有技术，本发明提供的适用于数字助听器的移频压缩方法既保留了目标频段的语音信息，又能够将需要压缩的高频频段进行压缩，较好的提高了语音的辨识度与可懂度，同时也补偿了由于移频导致的语音能量损失。
【附图说明】
[0019] 图1为一位病人的特征频段的听阔与痛域图；
[0020] 图2为本发明提供的适用于数字助听器的移频压缩方法的流程图；
[0021] 图3为f；h为3化Z所得到的语音时域图；
[0022] 图4为本发明一实施例中所述适用于数字助听器的移频压缩方法的工作流程图；
[0023] 图5为本发明构建的基于频率与语音能量W及其可懂度之间的关系图；
[0024] 图6为原语音经过传统方法与采用本发明提供的所述适用于数字助听器的移频压缩方法所获得的语音结果的对比图；
[00巧]图7为传统方法与本发明提供的所述适用于数字助听器的移频压缩方法的光谱对比图。
【具体实施方式】
[0026] 为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是，本发明可许多不同的形式来实现，并不限于本文所描述的实施方式。相反地，提供该些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
[0027] 需要说明的是，当元件被称为"固定于"另一个元件，它可W直接在另一个元件上或者也可W存在居中的元件。当一个元件被认为是"连接"另一个元件，它可W是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语"垂直的"、"水平的"、"左"、 "右及类似的表述只是为了说明的目的，并不表示是唯一的实施方式。
[0028] 除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本发明。本文所使用的术语"及/或"包括一个或多个相关的所列项目的任意的和所有的组合。
[0029] 请参阅图1，本发明提供本发明提供一种适用于数字助听器的移频压缩方法，其包括如下步骤；SlOl、确定患者的高频损失程度，获得需要压缩频率范围和目标频率范围；S103、对语音进行预处理；S105、根据所述需要压缩频率范围和目标频率范围，算出压缩比 P，W压缩率（P+1)进行频率信号压缩间07、对称处理，进行N点IFFT变换间09、变换回来的语音与上一帖信号重叠相加，输出的信号进行自动增益补偿。
[0030] 研究表明，语音信号的频率与语音能量W及该频率处的可懂度有如表1所示的关系。
[0031] 表1 ;频率与语音能量和可懂度的关系
[0032]
[0033] 从表1中可W看出，语音的能量主要集中在125hz~2000hz的低频部分，占93% 左右；而化hz~祉hz的高频部分的语音可懂度占60%W上，特别是化hz~祉hz的高频部分，语音能量只占了 2%左右，可懂度却达到了 25%，所W高频部分的语音对语音理解有很大的作用，其中500hz~2000hz语音尤为重要。另据许伟等人的研究（许伟，曾新吾，粪昌超，不同带宽和采样频率语音可懂度的实验研究[A]，2008年全国声学学术会议论文集 [C]，2008年），利用《电声产品主观评价用节目源》国家标准CD中的语音，进行不同频率重采样获得测试源，通过8人试听的主观判断结果，对0~化hz语音进行分段滤波，考查不同频段缺失对语音质量的影响，发现在语音内容完全可懂的要求下，语音频率的最低上限应取在化hz，最高下限处于3(K)hz;同时，语音采样频率高于化hz时，对语音质量没有明显影响，采样频率在化hz~地hz语音质量下降明显，但完全可懂，当采样频率低于地hz时，语义理解变得较为困难。
[0034] 由W上研究分析可知，在进行移频压缩过程中，300hz~化hz的语音特别重要，是不能够被破坏的，化hz~化hz的语音应尽量保留。本发明中，对于目标频率的选择，一个是基于患者高频损伤程度，一个是基于频率与语音能量W及其可懂度之间的关系（发明人构建的一种折算关系）。
[00巧]本发明提供的适用于数字助听器的移频压缩方法为非线性移频压缩方法，其改进还在于对能

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭朝阳;王新安;张国新;赵志良;罗香香;薛峰杰;王丹;
技术所有人：深圳市微纳集成电路与系统应用研究院;北京大学深圳研究生院;
我是此专利的发明人

上一篇：基于曲线压缩实现的宽动态范围压缩方法和系统的制作方法
上一篇：用于估计目标和噪声谱方差的多传声器方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。