基于曲线压缩实现的宽动态范围压缩方法和系统的制作方法
【技术领域】
[0001] 本发明设及数字信号技术领域,尤其设及一种基于曲线压缩实现的宽动态范围压 缩方法和系统。
【背景技术】
[0002] 在助听器的各类算法中,听力补偿算法是最基本、最重要的一种算法。听力补偿算 法的目的在于对声音进行压缩放大,将正常人的听力动态范围通过算法处理后,映射到听 力受损患者的听力动态范围内,并尽可能保持声音的辨识度和低失真度。
[0003] 如图1所示,病人和正常人听阔和痛阔听力曲线图,反映某一病人和正常人分别 在各频率点的听阔与痛阔水平。听力损失大概是50地,其中,THm为病人的听阔,化M为病 人的痛阔;TH。为正常人的听阔,UL。为正常人的痛阔。
[0004] 正常人的听阔水平和痛阔水平为一定的,由于性别原因可能会有所差异;但是,听 力损失患者的听阔水平和痛阔水平却是因个体不同而差别迴异。
[0005] 听阔是指,在某一频率范围内,一个人刚好能听到声音的声压级大小;痛阔是指, 一个人所能接受的最大听力声压级大小。一般来说,听力受损患者的听阔比正常人的听阔 值大,整个可听声音频域上的动态范围都缩小,其直接体现就是在某一频率范围内,正常人 可W听到的较高或者较低的声音听力损伤患者都无法听到。
[0006] 为对该一部分损失的听力进行补偿,使听力损伤患者能听到正常人的声音,助听 器设计者提出了 "压缩"该一概念。如图2所示,为一典型的宽动态压缩声压补偿后的I/O 图。其中,沿输入输出顺序分别为线性放大区,直线压缩区,输出限制区。
[0007] 一般的,宽动态范围压缩算法在听阔到痛阔中间采用直线压缩的方式,该处理方 法虽然也能将正常人听力动态范围映射到听力受损患者的听力动态范围之内,但却不能很 好地响应听力受损患者对补偿后的声音的反馈。有些患者可能觉得声音放大地超出自己的 预期,又有些患者可能会觉得声音放大地达不到自己的预期。简而言之,直线压缩的方式不 够灵活,达不到最佳用户体验。
【发明内容】
[000引有鉴于此,本发明提供一种基于曲线压缩实现的宽动态范围压缩方法和系统,解 决直线压缩方式不够灵活的缺点,使处理结果更理想。
[0009] 本发明实施例提供一种基于曲线压缩实现的宽动态范围压缩方法,包括;S1、对输 入的音频时域信号进行快速傅立叶变换,得到频域序列;S2、对所述频域序列进行多通道宽 动态范围压缩,划分为多个子频率带;S3、计算所述多子频率带的频域信号的平均声压值, 确定输入声压级;S4、根据输入声压级计算输出声压级;S5、根据所述输入声压级和输出声 压级计算幅值增益值;S6、对幅值进行逆傅立叶变,输出时域信号。
[0010] 本发明实施例还提供一种基于曲线压缩实现的宽动态范围系统,包括:快速傅立 叶变换模块,用于对输入的音频时域信号进行快速傅立叶变换,得到频域序列;多通道宽动 态范围压缩模块,用于对所述频域序列进行多通道宽动态范围压缩,划分为多个子频率带; 第一计算模块,用于计算所述多个子频率带的频域信号的平均声压值,确定输入声压级;第 二计算模块,用于根据输入声压级计算输出声压级;第=计算模块,用于根据所述输入声压 级和输出声压级计算幅值增益值;逆傅立叶变换模块,用于对幅值进行逆傅立叶变换,输出 时域信号。
[0011] 本发明的基于曲线压缩实现的宽动态范围采用曲线压缩的方式,增加曲线压缩因 子该一可配置的参数来达到声压级压缩,实现了一般宽动态范围压缩算法补偿声音的功 能,同样很好地解决了直线压缩方式不够灵活的缺点,使得处理结果更理想,使用户有更好 的体验。
【附图说明】
[0012] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 W根据该些附图获得其他的附图。
[0013] 图1是现有的病人和正常人听阔和痛阔听力曲线图;
[0014] 图2是现有的宽动态压缩声压补偿后的输入输出图。
[0015] 图3是根据本发明一实施例的宽动态压缩声压补偿后的输入输出图;
[0016] 图4是根据本发明一实施例的宽动态范围方法的流程图;
[0017]图5是根据本发明一实施例的宽动态范围系统的结构示意图。 具体实施例
[0018] 下面结合附图和具体实施例对本发明的技术方案作进一步更详细的描述。显然, 所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实 施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都 应属于本发明保护的范围。
[0019] 本发明提出一种基于曲线压缩实现的宽动态范围压缩方法,采用曲线压缩的方 式,增加曲线压缩因子该一可配置的参数来达到声压级压缩。如图3所示,其中,b2表示正 常直线压缩方式,bl表示曲线弥补用户觉得补偿不足的弊处,b3表示曲线弥补用户觉得补 偿超过预期的弊处。
[0020] 该宽动态范围压缩方法中,输入离散时域信号x[n],经过分帖,汉明加窗, FFT(pastFourierTransformation,快速傅立叶变换)变换到频域内的信号,再通过求解 7通道内的增益,在宽动态范围压缩(WideDynamicRangeCompression,WDRC)处理后,再 经过IFFT(InverseFastFourierTransformation,逆傅立叶变换)将频域信号转换为时域 信号,输出X' (n)。
[0021] 如图4所示,本实施例提供一种基于曲线压缩实现的宽动态范围压缩方法,包括:
[0022] 步骤S1、对输入的音频时域信号进行FFT,得到频域序列;
[002引具体地,对输入的音频时域信号X(n),n= 0~127,进行FFT,得到频域序列X㈱,N= 0 ~127。
[0024]S2、对所述频域序列进行多通道宽动态范围压缩,划分为多个子频率带;
[0025] 优选地,多通道为8通道,每一通道频率带的频域信号增益为统一值。本发明实施 例取fO= 62Hz,n= 12甜Z,f2 = 250Hz,f3 = 500Hz,f4 =lOOOHz,巧=2000Hz,f6 = 4000Hz,f7 = 8000Hz。
[0026]S3、计算所述多个子频率带的频域信号的平均声压值,确定输入声压级;
[0027] 所述平均声压值
[002引
[0029] 其中,X(k)为落在一频率带内的频域信号,m为落在该段频率带内的信号个数,N 为FFT的采样点数,Pref为基准声压。
[0030] 在平均声压值计算之前还包括计算输入信号的平均能量P(n) =X2化);w及计算 瞬时声压SP(n) = 201g(P(n)/Puf),其中,健康人耳听觉感受有极宽的动态范围,可达0~ 140 地。
[0031] 如用帕斯卡(Pa)来表达声音,须处理小至20uPa,大至2, 000, 000,OOOPa的数字。 如此一来,用化来表达声音或噪音会颇为不便,较简单的做法是用一个对数标度来表达声 音的响亮度。此处,W10作为基数,为避免化来表达声音