一种音频扩音反馈抑制方法、系统、计算机及存储介质与流程

文档序号:33537935发布日期:2023-03-22 08:48阅读:50来源:国知局
一种音频扩音反馈抑制方法、系统、计算机及存储介质与流程

1.本技术涉及音频处理技术领域,特别是涉及一种音频扩音反馈抑制方法、系统、计算机及存储介质。


背景技术:

2.在现代音频应用领域,扩声系统是其中不可或缺的一环。例如,在大型会音频扩音反馈抑制场、多媒体教室、音乐表演现场等都需要配备不同的扩声系统,而随着音频处理技术的进一步发展,便携通信设备、助听器等产品中扩声系统的应用也越发广泛。
3.由于现实中的声音信息在传递过程中信号强度会不断减小,因此为了信息能正常地传递,就需要使用扩声系统增大信号的强度。一般情况下,扩声系统基本是由声音传感器、功率放大器及扬声器构成,通过声音传感器对声音进行拾取,通过功率放大器进行一定程度的系统增益后,通过扬声器发出,以完成扩声。
4.但通过功率放大器及扬声器扩声后的声音,通常也会被声音传感器再次拾取,当增益过大且满足一定的相位条件时,将导致扩音系统失去稳定,引发啸叫现象,而啸叫现象将大大影响人们对声音的听觉感官,且啸叫现象严重干扰了音频设备的正常工作,甚至会损伤音频设备。


技术实现要素:

5.本技术实施例提供了一种音频扩音反馈抑制方法、系统、计算机及存储介质,以解决现有技术中因扩声系统产生啸叫,而影响听者的听觉感官,且容易影响音频设备的正常工作,甚至造成音频设备损伤的技术问题。
6.第一方面,本技术实施例提供了一种音频扩音反馈抑制方法,包括以下步骤:通过原始音频获取初始信号,并对所述原始音频进行扩音处理,以获取输出音频;获取并解析实时音频,以得到实时信号,通过所述实时信号及所述初始信号判定是否进行增益抑制;对所述输出音频进行啸叫检测,判断所述输出音频是否存在啸叫风险;若存在啸叫风险,则对所述输出音频进行反馈抑制。
7.进一步地,所述通过原始音频获取初始信号,并对所述原始音频进行扩音处理,以获取输出音频的步骤包括:将原始音频的时域信号转换为频域信号,以获取初始信号;按预设增益对所述原始音频进行扩音增益,以获取输出音频。
8.进一步地,所述获取并解析实时音频,以得到实时信号,通过所述实时信号及所述初始信号判定是否进行增益抑制的步骤包括:获取实时音频,将所述实时音频的时域信号转换为频域信号,以获取实时信号;判断所述实时信号与所述初始信号之间的突变阀值是否超过预设阀值;若所述突变阀值超过所述预设阀值,则判定需要进行增益抑制。
9.进一步地,所述对所述输出音频进行啸叫检测,判断所述输出音频是否存在啸叫风险步骤包括:对所述输出音频进行预处理,以获取所述输出音频的功率谱;选取所述功率谱内较大的频点作为啸叫频点;计算所述输出音频的信号在所述啸叫频点处的波动取值;对所述波动取值进行阈值判决,若所述波动取值小于所述阈值,则判定存在啸叫风险。
10.进一步地,所述对所述输出音频进行预处理,以获取所述输出音频的功率谱的步骤具体为:通过离散傅里叶变换求得所述输出音频的功率谱,其计算公式为:,其中,p(i,g)表示第i帧信号在频率g处的功率谱,nc表示每帧数据长度,in
yd
表示每帧数据移动长度,h(m)表示长度为nc的窗函数,l、x、j及e为计算参数。
11.进一步地,所述计算所述输出音频的信号在所述啸叫频点处的波动取值的步骤包括:通过以下公式计算所述输出音频中过去r帧信号在所述啸叫频点处的平坦度参数:,其中,表示啸叫频点的频率,表示信号在频率处的平坦度参数,表示过去r帧信号在频率处功率谱的几何平均,表示过去r帧信号在频率处功率谱的算数平均;通过对若干个所述平坦度参数求方差以获取所述波动取值。
12.进一步地,所述波动取值的计算公式为:,其中,表示波动取值,q表示信号帧,j、n均为计算参数。
13.第二方面,本技术实施例提供了一种音频扩音反馈抑制系统,应用于上述的音频扩音反馈抑制方法,所述系统包括:获取模块,用于通过原始音频获取初始信号,并对所述原始音频进行扩音处理,以获取输出音频;第一处理模块,用于获取并解析实时音频,以得到实时信号,通过所述实时信号及所述初始信号判定是否进行增益抑制;判断模块,用于对所述输出音频进行啸叫检测,判断所述输出音频是否存在啸叫风险;第二处理模块,用于若存在啸叫风险,则对所述输出音频进行反馈抑制。
14.第三方面,本技术实施例提供了一种计算机设备,包括存储器、处理器以及存储在
所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的音频扩音反馈抑制方法。
15.第四方面,本技术实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的音频扩音反馈抑制方法。
16.相比于相关技术,本发明的有益效果在于:在获取所述初始信号后,可将所述初始信号作为标定的判断值,放大器对所述原始音频以一定的增益值进行扩音并通过扬声器播放,此时,声音传感器仍不断在获取实时音频,通过判断所述实时音频的实时信号与所述初始信号之间的差异,可对增益值进行一定程度的控制,避免增益超过环境允许的界线,进而一次规避啸叫产生,在扬声器对所述输出音频进行播放前,解析所述输出音频,通过判断其是否仍存在啸叫风险,从而二次规避啸叫的产生,通过双重抑制,可有效的规避啸叫现象的发生概率,进而避免发生啸叫影响人们对所述输出音频的听觉感官及对音频设备的损伤。
17.本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。
附图说明
18.图1为本发明第一实施例中音频扩音反馈抑制方法的流程图;图2为本发明第二实施例中音频扩音反馈抑制方法的流程图;图3为本发明第三实施例中音频扩音反馈抑制系统的结构框图;如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
19.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
20.显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
21.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
22.请参阅图1,本发明第一实施例提供的音频扩音反馈抑制方法,所述方法包括以下:步骤s10:通过原始音频获取初始信号,并对所述原始音频进行扩音处理,以获取
输出音频;扩音系统一般通过声音传感器对声音进行接收,并形成所述原始音频,放大器对所述原始音频以一定的增益值进行扩音,形成所述输出音频,扬声器通过获取所述输出音频后,将其进行播放,以使人们通过扩音系统听到扩音后的声音。通过获取所述初始信号,可将所述初始信号作为标定的判断值,以便对声音传感器后续接收到的声音进行初判定。
23.步骤s20:获取并解析实时音频,以得到实时信号,通过所述实时信号及所述初始信号判定是否进行增益抑制;可以理解地,在完成所述原始音频的接收后,声音传感器仍不断在获取实时音频,在完成实时音频的获取后,若直接将所述实时音频通过放大器进行扩音播放,则很有可能因重复接收所述输出音频而产生啸叫风险,通过判断所述实时音频的实时信号与所述初始信号之间的差异,可对放大器的增益值进行一定程度的控制,避免增益超过环境允许的界线,进而一次规避啸叫产生。
24.步骤s30:对所述输出音频进行啸叫检测,判断所述输出音频是否存在啸叫风险;啸叫的漏检会导致啸叫不能得到及时有效的抑制,而误检会因错误陷波而滤除未产生啸叫的频率成分,从而导致语音信号的失真,影响扩声系统的性能,在扬声器对所述输出音频进行播放前,可对所述输出音频进行啸叫检测,避免一次规避中漏判定而导致仍产生啸叫的情况。
25.通过判断其是否仍存在啸叫风险,从而二次规避啸叫的产生,通过双重抑制,可有效的规避啸叫现象的发生概率,进而避免发生啸叫影响人们对所述输出音频的听觉感官及对音频设备的损伤。
26.步骤s40:若存在啸叫风险,则对所述输出音频进行反馈抑制;通过双重抑制,可有效的规避啸叫现象的发生概率,进而避免发生啸叫影响人们对所述输出音频的听觉感官及对音频设备的损伤。
27.请参阅图2,本发明第二实施例提供的音频扩音反馈抑制方法,所述方法包括以下步骤:步骤s100:将原始音频的时域信号转换为频域信号,以获取初始信号;时域是描述数学函数或物理信号对时间的关系,一个信号的时域波形可以表达信号随着时间的变化,其是实际存在的域。而时域通常用来测量、分析或评估产品的性能。频域是描述信号在频率方面特性时用到的一种坐标系,在电子学、控制系统工程及统计学中,频域图显示了在一个频率范围内每个给定频带内的信号量。其是客观存在的域,遵循特定的规则,将时域信号转换为频域信号,可对其进行数学范畴内的计算及对比。
28.步骤s101:按预设增益对所述原始音频进行扩音增益,以获取输出音频;在获取原始音频后,通过扩音系统对原始音频以预设增益进行扩音,可使所述原始音频的音量得到放大,放大音量后的所述原始音频即为所述输出音频。
29.步骤s102:获取实时音频,将所述实时音频的时域信号转换为频域信号,以获取实时信号;与所述原始音频的解析同理,在扩音系统完成所述输出音频的播放后,声音传感器并未停止工作,仍在不间断的获取声音数据,以形成所述实时音频,此时,需对所述实时音频进行解析,通过时域与频域的转换,将其转变为方便分析计算的所述实时信号。
30.步骤s103:判断所述实时信号与所述初始信号之间的突变阀值是否超过预设阀值;步骤s104:若所述突变阀值超过所述预设阀值,则判定需要进行增益抑制;可以理解地,所述实时信号可能为正常的声音,也可能是经过所述扩音系统放大后的所述输出音频再次被声音传感器拾取,因此,通过判断所述实时信号与所述初始信号之间的突变阀值,可一定程度的区分所述实时信号的分类,通过预先设定所述预设阀值,在所述突变阀值未超过所述预设阀值时,将其判定为声音传感器拾取正常的声音,放大器按所述预设增益正常进行声音的放大,但若所述突变阀值超过所述预设阀值,则将其判定为重复拾取扩音后的声音,此时若仍以所述预设增益进行扩音,则很容易使所述实时音频的增益超过环境允许的界线,进而导致系统趋向于失稳,甚至产生啸叫,此时,触发所述增益抑制,对所述预设增益进行相应程度的抑制,可从源头上规避啸叫的产生,满足用户的体验需求。
31.步骤s105:对所述输出音频进行预处理,以获取所述输出音频的功率谱;具体地,所述对所述输出音频进行预处理,以获取所述输出音频的功率谱的步骤具体为:通过离散傅里叶变换求得所述输出音频的功率谱,其计算公式为:,其中,p(i,g)表示第i帧信号在频率g处的功率谱,nc表示每帧数据长度,in
yd
表示每帧数据移动长度,h(m)表示长度为nc的窗函数,l、x、j及e为计算参数。
32.步骤s106:选取所述功率谱内较大的频点作为啸叫频点;步骤s107:计算所述输出音频的信号在所述啸叫频点处的波动取值;通过以下公式计算所述输出音频中过去r帧信号在所述啸叫频点处的平坦度参数:,其中,表示啸叫频点的频率,表示信号在频率处的平坦度参数,表示过去r帧信号在频率处功率谱的几何平均,表示过去r帧信号在频率处功率谱的算数平均;通过对若干个所述平坦度参数求方差以获取所述波动取值。
33.对于平稳噪声信号,理想情况下其功率谱不会随时间而发生变化,此时功率谱的几何平均与算术平均相等;否则,几何平均将一直小于算数平均,及平坦度参数的取值范围为小于0。通常情况下,同噪声相比,语音信号的功率谱的波动更大,平坦度参数更低,进一步地,啸叫成分是在所述啸叫频点处能量随时间不断增加的单频窄带信号,在所述啸叫频点处的功率谱具有相同的变化特性,而通常情况下,语音信号的功率谱具有更大的非平稳特性。因此,可利用所述波动取值来区分语音和啸叫。
34.获取所述功率谱后,在所述功率谱内选择较大的频点作为所述啸叫频点后,通过所述啸叫频点计算过去r帧信号在所述啸叫频点处功率谱的几何平均和算数平均,几何平
均的计算公式为:,算数平均的计算公式为:,进而通过所述平坦参数计算公式获取所述平坦度参数,以所述平坦度参数计算若干个信号帧q的所述平坦度参数的方差,即可得到所述波动取值,所述波动取值的计算公式为:,其中,表示波动取值,q表示信号帧,j、n均为计算参数。可以理解地,i表示信号。
35.语音信号为非平稳信号,频率处功率谱随着时间不断变化,则频率处的平坦度参数具有较大的波动性,因此,语音信号的平坦度参数取值较大。而啸叫信号功率谱在啸叫频点处具有相同的变化特性,因此具有相同的平坦度参数,但啸叫信号在啸叫频点处的所述波动取值具有较小的波动性。因此,啸叫信号的所述波动取值较小,进而可通过此手段进行啸叫风险的检测。
36.步骤s108:若存在啸叫风险,则对所述输出音频进行反馈抑制。
37.在本实施例中,通过自适应滤波器完成反馈抑制工作,自适应滤波器为使用自适应算法来改变滤波器的参数和结构的滤波器,其系数是由自适应算法更新的时变系数,即其系数自动连续地适应于给定信号,以获得期望响应。自适应滤波器的最重要的特征就在于它能够在未知环境中有效工作,并能够跟踪输入信号的时变特征,以输入和输出信号的统计特性的估计为依据,采取特定算法自动地调整滤波器系数,使其达到最佳滤波特性。
38.请参阅图3,本发明第三实施例提供了一种音频扩音反馈抑制系统,该系统应用于上述实施例中所述音频扩音反馈抑制方法,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
39.所述系统包括:获取模块10,用于通过原始音频获取初始信号,并对所述原始音频进行扩音处理,以获取输出音频;所述获取模块10包括:第一转换单元,用于将原始音频的时域信号转换为频域信号,以获取初始信号;增益单元,用于按预设增益对所述原始音频进行扩音增益,以获取输出音频;第一处理模块20,用于获取并解析实时音频,以得到实时信号,通过所述实时信号及所述初始信号判定是否进行增益抑制;所述第一处理模块20包括:第二转换单元,用于获取实时音频,将所述实时音频的时域信号转换为频域信号,
以获取实时信号;第一分析单元,用于判断所述实时信号与所述初始信号之间的突变阀值是否超过预设阀值;抑制单元,用于若所述突变阀值超过所述预设阀值,则判定需要进行增益抑制;判断模块30,用于对所述输出音频进行啸叫检测,判断所述输出音频是否存在啸叫风险;所述判断模块30包括:处理单元,用于对所述输出音频进行预处理,以获取所述输出音频的功率谱;选取单元,用于选取所述功率谱内较大的频点作为啸叫频点;计算单元,用于计算所述输出音频的信号在所述啸叫频点处的波动取值;第二分析单元,用于对所述波动取值进行阈值判决,若所述波动取值小于所述阈值,则判定存在啸叫风险;第二处理模块40,用于若存在啸叫风险,则对所述输出音频进行反馈抑制。
40.本发明还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述技术方案中所述的音频扩音反馈抑制方法。
41.本发明还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述技术方案中所述的音频扩音反馈抑制方法。
42.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
43.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1