一种音频信号增益控制方法、装置、设备及存储介质与流程

文档序号:24398482发布日期:2021-03-27 00:01阅读:126来源:国知局
一种音频信号增益控制方法、装置、设备及存储介质与流程

1.本发明实施例涉及语音交互技术,尤其涉及一种音频信号增益控制方法、装置、设备及存储介质。


背景技术:

2.语音交互系统在车载场景的应用是继语音交互在智能音箱等家居场景的应用后,又一重要的应用场景,车载环境下为了让驾驶员在驾驶时能够集中注意力,提高车载环境下语音识别的准确性显得尤为重要。
3.现有技术中为了提高语音识别的准确性,对麦克风收录的音频信号进行降噪以及回音消除等一系列的处理,但在上述处理完成后仍然会有一些残余的干扰噪声,例如,干扰噪声可能是后排乘客的声音或者未消除掉的车载喇叭播放的声音等,这些残余的干扰噪声可能会对车载语音识别系统的语音识别准确性造成很大的影响。


技术实现要素:

4.本发明实施例提供一种音频信号的增益控制方法、装置、设备及存储介质,根据当前缓存的音频帧的信号能量值,来确定增益控制类型,以对最先缓存的音频帧进行与当前的增益控制类型匹配的增益控制处理,实现放大语音信号的同时,抑制剩余干扰和噪声,提高语音识别成功率。
5.第一方面,本发明实施例提供了一种音频信号的增益控制方法,所述方法包括:
6.实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中;
7.实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型;
8.当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
9.第二方面,本发明实施例还提供了一种音频信号的增益控制装置,所述装置包括:
10.音频信号存储模块,用于实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中;
11.增益控制类型确定模块,用于实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型;
12.增益控制处理模块,用于当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
13.第三方面,本发明实施例还提供了一种电子设备,包括:
14.一个或多个处理器;
15.存储器,用于存储一个或多个程序;
16.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现本发明任意实施例提供的音频信号的增益控制方法。
17.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的音频信号的增益控制方法。
18.本发明实施例的技术方案,实时采集音频信号,并将音频信号按照音频帧的形式依次存储于音频信号缓存区中,同时,实时根据音频信号缓存区中当前缓存的各音频帧的信号能量,确定增益控制类型,当确定满足音频帧累计参考条件时,从音频信号缓存区获取最先缓存的音频帧,进行与当前的增益控制类型匹配的增益控制处理,实现了通过连续监测音频帧的信号能量值,来进行音频信号增益的调整,能够放大语音信号并抑制剩余干扰和噪声信号,提高了语音识别成功率。
附图说明
19.图1a是本发明实施例一中的一种音频信号的增益控制方法的流程图;
20.图1b是本发明实施例一中的音频信号的增益控制方法在一个完整的语音识别系统中的作用位置示意图;
21.图2a是本发明实施例二中的一种音频信号的增益控制方法的流程图;
22.图2b是本发明实施例二中的音频信号的增益控制方法中确定增益控制类型的流程图;
23.图3a是本发明实施例三中的一种音频信号的增益控制方法的流程图;
24.图3b是本发明实施例三中音频信号的增益控制方法的原理流程图;
25.图4是本发明实施例四中的一种音频信号的增益控制装置的结构示意图;
26.图5是本发明实施例五提供的一种设备的结构示意图。
具体实施方式
27.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
28.实施例一
29.图1a为本发明实施例一中的一种音频信号的增益控制方法的流程图,本实施例的技术方案适用于根据当前音频帧的信号能量值,对音频信号缓存区中存储的音频帧进行增益控制处理的情况,该方法可以由音频信号的增益控制装置执行,该装置可以由软件和/或硬件来实现,并可以集成在各种通用计算机设备中。
30.如图1b所示,本申请所提供的音频信号增益控制方法作用于整个音频信号处理管线的尾端,也就是说,在对麦克风接收到的音频信号进行降噪和回声消除等处理后,仍有一些参与的干扰噪声,这些干扰噪声可以使后排乘客的声音或者未消除干净的车载喇叭播放出的声音等,为了避免这些干扰噪声被语音识别模块识别,影响语音识别效果,采用本发明实施例所提供的音频信号的增益控制方法,对经过降噪和回声消除的音频信号进行进一步处理,并将处理后的音频信号输入至语音识别模块进行语音识别。
31.音频信号的增益控制方法具体包括如下步骤:
32.步骤110、实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音
频信号缓存区中。本实施例中,为接收到的音频信号建立设定时长的音频信号缓存区,用于缓存接收到的音频信号,以实现对音频信号缓存区中的音频帧进行相应的增益控制处理。示例性的,可以建立长度为80毫秒的音频信号缓存区,设定每一个音频帧的长度为10毫秒,则当前音频信号缓存区中可以存储8个音频帧。
33.步骤120、实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型。
34.本实施例中,音频信号的增益控制是使音频信号缓存区中音频帧的控制增益随着存入音频信号缓存区的音频帧能量大小而自动调整的方法,其最终目的是放大用户输入的语音信号,抑制噪声信号,因此,可以将增益控制类型分为放大音频帧信号和抑制音频帧信号。
35.本发明实施例中的技术方案可以应用于单麦车载音频信号处理系统,即可以应用于车辆只搭载一个麦克风的场景,通过实时获取当前缓存的音频帧,并进一步采用设定方式计算当前缓存的音频帧的信号能量,最终通过音频帧的信号能量来确定增益控制的类型,实现通过持续监测接收到的音频帧的信号能量来判断所接收到的音频信号属于语音信号还是噪声信号,并针对音频信号类型选择对应的增益控制类型。示例性的,增益控制类型可以是通过提高增益放大语音信号或者通过降低增益抑制噪声信号。
36.步骤130、当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
37.本实施例中,当确定满足音频帧累计参考条件时,通过与当前增益控制类型匹配的增益控制处理方式,对之前已经存储到音频信号缓存区中的音频帧进行处理。示例性的,当音频信号缓存区中已经存储了8个音频帧时,通过在缓存过程中,对前8个音频帧以及当前缓存的第9个音频帧的信号能量的持续监测,确定前1~9个音频帧的属于语音信号,则确定当前的益控制类型为通过提高增益放大语音信号,并进一步对音频信号缓存区中的第1个音频帧进行与当前的增益控制类型匹配的增益控制处理,最终将经过增益控制处理后的第1个音频帧进行输出;当检测到第10个音频帧依然属于语音信号时,对当前音频信号缓存区中的第1个音频帧(相当于将第1个音频帧发送出去之前的第2个音频帧)进行与当前的增益控制类型匹配的增益控制处理,依次类推,直至完成所有音频帧的输出。
38.可选的,所述音频帧累计参考条件,包括:
39.所述音频信号缓存区中缓存有累计参考数量的音频帧,或者所述音频信号缓存区中不再缓存有新的音频帧。
40.本可选的实施例中,对音频帧累计参考条件进行了限定,包括音频缓存区中缓存有累计参考数量的音频帧,或者当麦克风停止音频信号采集,音频信号缓存区中不再缓存有新的音频帧。由于本实施例中的技术方案需要根据信号能量大小对输入至音频信号缓存区中的音频帧进行累计分类统计,确定增益控制类型,最终将最先缓存的音频帧,进行与当前增益控制类型匹配的增益控制处理,因此,在音频录入开始阶段,需要对输入至音频信号缓存区的音频帧进行累计统计,直到音频信号缓存区的音频帧达到设定数量,才开始对之前输入的音频帧进行增益控制处理。示例性的,当音频信号缓存区中存储有8个音频帧时,开始采用相应的增益控制类型对当前音频信号缓存区中存储的第1个音频帧进行增益控制处理,并将处理后的音频帧输出。可以理解的是,在音频录入结束阶段,当不再缓存新的音
频帧时,从所述音频信号缓存区按照存储的先后顺序获取依次获取音频帧,进行与当前的增益控制类型匹配的增益控制处理,完成音频信号缓存区中所有音频帧的增益控制处理并输出,示例性的,在设定时间段内(例如,3秒)没有新的音频帧输入至音频信号缓存区,则直接对音频信号缓存区中剩余音频帧进行增益控制处理,此时的增益值可选取为预设的固定值,例如,增益值为1。
41.可选的,在从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理之后,还包括:
42.将音频信号缓存区中经过增益控制处理的音频帧输入至语音识别模块。
43.本可选的实施例中,为了提高语音识别的准确率,首先将接收到的音频信号存储至音频信号缓存区,再对其中的音频帧依次进行增益控制处理,最终将经过增益控制处理的音频帧输入至语音识别模块进行语音识别,以根据用户输入的语音信号执行相应操作。
44.本发明实施例的技术方案,通过实时采集音频信号,并将音频信号按照音频帧的形式依次存储于音频信号缓存区中,同时,实时根据音频信号缓存区中当前缓存的各音频帧的信号能量,确定增益控制类型,当确定满足音频帧累计参考条件时,从音频信号缓存区获取最先缓存的音频帧,进行与当前的增益控制类型匹配的增益控制处理,实现了通过连续监测音频帧的信号能量值,来进行音频信号增益的调整,能够放大语音信号并抑制剩余干扰和噪声信号,提高了语音识别成功率。
45.实施例二
46.图2a为本发明实施例二中的一种音频信号的增益控制方法的流程图,本实施例在上述实施例的基础上进一步细化,提供了实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型的具体步骤。下面结合图2a对本发明实施例二提供的一种音频信号的增益控制方法进行说明,包括以下步骤:
47.步骤210、实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中。
48.步骤220、实时获取所述音频信号缓存区中当前缓存的一个新的音频帧,并计算所述新的音频帧的信号能量。
49.本实施例中,为了持续监测接收到的音频帧属于语音信号还是噪声信号,每次要将一个新的音频帧存储至音频信号缓存区时,都要获取当前缓存的音频帧,并计算其信号能量,以根据设定的音频信号的设定规则,通过信号能量判断当前音频帧的类型。
50.步骤230、判断所述信号能量是否大于或等于全局能量阈值,并根据判断结果,更新与所述音频信号缓存区匹配的高能量帧计数结果以及低能量帧计数结果。
51.其中,全局能量阈值是采用基于能量的语音活动检测(voice activity detection,vad)方法计算得到的,具体可以是采用vad方法估计出干扰段,然后取均方根作为全局能量阈值。高能量帧计数结果和低能量帧计数结果分别表示信号能量值大于全局能量阈值的音频帧的累计个数以及信号能量值小于全局能量阈值的音频帧的累计个数。
52.本实施例中,通过与全局能量阈值进行比较,将接收到的音频帧分为两类,第一类为信号能量大于或等于全局能量阈值的音频帧,采用高能量帧计数器进行计数,第二类为信号能量小于全局能量阈值的音频帧,采用低能量帧计数器进行计数,每当有新的音频帧缓存至音频信号缓存区,都对其对应的计数器数值进行更新。
53.可选的,根据判断结果,更新与所述音频信号缓存区匹配的高能量帧计数结果以及低能量帧计数结果,包括:
54.在确定所述判断结果为所述信号能量大于或等于所述全局能量阈值时,对所述高能量帧计数结果进行累加;如果确定累加后结果超过第一阈值,则将所述低能量帧计数结果设置为设定初始值;
55.在确定所述判断结果为所述信号能量小于全局能量阈值时,对所述低能量帧计数结果进行累加;如果确定累加后结果超过第二阈值,则将所述高能量帧计数结果设置为设定初始值。
56.本可选的实施例中,提供了一种根据当前音频帧的信号能量和全局能量阈值进行比较的结果,对计数器数值进行更新的方式,具体的,如图2b所示,如果当前音频帧的信号能量p大于或等于全局能量阈值a,则将高能量帧计数器h的数值加1,并将更新后的高能量帧计数器数值h与预先设定的第一阈值b进行比较,当更新后的高能量帧计数器数值h大于第一阈值b时,将低能量帧计数器l置零;如果当前音频帧的信号能量p小于全局能量阈值a,则将低能量帧计数器的数值l加1,并将更新后的低能量帧计数器数值l与预先设定的第二阈值c进行比较,当更新后的低能量帧计数器数值l大于第二阈值c时,将高能量帧计数器h置零。示例性的,第一阈值b可以设置为8,第二阈值c可以设定为15。
57.步骤240、根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型。
58.本实施例中,为了实现根据连续多个音频帧的信号能量值,确定音频信号类型,并进一步根据音频信号类型确定增益控制类型,在步骤230更新高能量帧计数结果以及低能量帧计数结果的基础上,根据计数器的计数结果,确定增益控制类型。示例性的,当高能量帧计数结果大于第一阈值,则表示有8个音频帧的信号能量都高于全局能量阈值,则确定该段音频信号属于语音信号,则确定增益控制类型为通过提高增益放大语音信号。
59.可选的,根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型,包括:
60.如果确定所述高能量帧计数结果超过所述第一阈值,则确定所述增益控制类型为放大音频帧信号;
61.如果确定所述低能量帧计数结果超过所述第二阈值,则确定所述增益控制类型为抑制音频帧信号;
62.如果确定所述高能量帧计数结果未超过所述第一阈值,或者确定所述低能量帧计数结果未超过所述第二阈值,则确定所述增益控制类型为保持音频帧信号不变。
63.本可选的实施例中,提供了一种根据高能量帧计数结果以及低能量帧计数结果,确定增益控制类型的方式,具体的,如果判断得到高能量帧计数结果超过第一阈值,则确定本段音频信号属于语音信号,从而进一步确定增益控制类型为放大音频帧信号;如果确定所能量帧计数结果超过第二阈值,则确定本段音频信号属于噪声信号,从而进一步确定增益控制类型为抑制音频帧信号;如果当前音频帧能量高于全局能量阈值,但高能量帧计数结果未超过第一阈值,或者当前音频帧能量低于全局能量阈值,但低能量帧计数结果未超过第二阈值,则确定增益控制类型为保持音频帧信号不变。
64.具体的,如图2b所示,如果当前音频帧的信号能量p大于或等于全局能量阈值a,且
更新后的高能量帧计数器数值h大于第一阈值b时,即执行流程图左支路步骤时,确定增益控制类型为通过提高增益放大音频信号;如果当前音频帧的信号能量p小于全局能量阈值a,且更新后的低能量帧计数器数值l大于第二阈值c时,即执行流程图右支路步骤时,确定增益控制类型为通过降低增益抑制音频信号;如果当前音频帧能量p高于全局能量阈值a,但高能量帧计数结果h未超过第一阈值b,或者当前音频帧能量p低于全局能量阈值a,但低能量帧计数结果l未超过第二阈值c,即左右支路条件都不满足时,则确定增益控制类型为保持音频帧信号不变。
65.步骤250、当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
66.本实发明施例的技术方案,首先实时采集音频信号,并将音频信号按照音频帧的形式依次存储于音频信号缓存区中,然后计算当前缓存的一个音频帧的信号能量值,并根据信号能量值与全局能量阈值的比较结果,更新高能量帧计数结果以及低能量帧计数结果,最终根据更新后的计数结果确定增益控制类型,并从音频信号缓存区获取最先缓存的音频帧,进行与当前的增益控制类型匹配的增益控制处理,能够根据连续监测音频帧的能量,实现对语音信号和噪声信号的区分,以准确的对不同信号进行不同的增益控制处理,避免因剩余噪声干扰导致语音识别失败的情况。
67.实施例三
68.图3a为本发明实施例三中的一种音频信号的增益控制方法的流程图,本实施例在上述实施例的基础上,进一步进行细化,提供了根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型之后的具体步骤。下面结合图3a对本发明实施例三中的一种音频信号的增益控制方法进行说明,包括以下步骤:
69.步骤310、实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中。
70.步骤320、实时获取所述音频信号缓存区中当前缓存的一个新的音频帧,并计算所述新的音频帧的信号能量。
71.可选的,实时获取所述音频信号缓存区中当前缓存的一个新的音频帧,并计算所述新的音频帧的信号能量,包括:
72.根据当前缓存的一个新的音频帧,使用公式:p(t)=αx2(t)+(1-α)x2(t-1),计算所述新的音频帧的信号能量;
73.其中,p(t)表示当前缓存的第t个音频帧的信号能量,α是常数,x(t)表示第t帧音频信号,t表示音频信号的帧数。
74.本可选的实施例中,提供了一种具体的计算各缓存到音频信号缓存区的音频帧的信号能量的具体方法,通过当前音频帧与前一音频帧的音频帧信号,以及设定常数值关系,计算当前输入音频信号缓存区中的音频帧的能量,具体公式如下:
75.p(t)=αx2(t)+(1-α)x2(t-1)
76.其中,p(t)表示当前缓存的第t个音频帧的信号能量,α是常数,x(t)表示第t帧音频信号,t表示当前音频帧的帧数。示例性的,α取值为0.98。
77.步骤330、判断所述信号能量是否大于或等于全局能量阈值,并根据判断结果,更新与所述音频信号缓存区匹配的高能量帧计数结果以及低能量帧计数结果。
78.步骤340、根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型。
79.步骤350、根据与所述增益控制类型对应的高能量帧计数结果或低能量帧计数结果,确定与所述增益控制类型对应的增益调整值。
80.本实施例中,在确定增益控制类型后,采用增益控制类型对应的增益调整值计算方法,根据高能量帧计数结果或低能量帧计数结果,计算增益调整值。
81.可选的,根据与所述增益控制类型对应的高能量帧计数结果或低能量帧计数结果,确定与所述增益控制类型对应的增益调整值,包括:
82.在确定所述增益控制类型为放大音频帧信号时,使用公式:计算所述增益调整值;
83.其中,gain是放大增益值,a是增益放大系数,h是所述高能量帧计数结果,b是所述第一阈值。
84.可选的,根据与所述增益控制类型对应的高能量帧计数结果或低能量帧计数结果,确定与所述增益控制类型对应的增益调整值,包括:
85.在确定所述增益控制类型为抑制音频帧信号时,使用公式:gain=0.95
(l-c)
,计算所述增益调整值;
86.其中,gain是抑制增益值,l是所述低能量帧计数结果,c是所述第二阈值。
87.上述两个可选的实施例中,分别提供了根据增益控制类型对应的高能量帧计数结果以及低能量帧计数结果,确定与增益控制类型对应的增益调整值的具体方式,当增益控制类型为放大音频帧信号时,使用公式:计算所述增益调整值;当增益控制类型为抑制音频帧信号时,使用公式:gain=0.95
(l-c)
,计算所述增益调整值。通过上述计算方法可以实现增益的平滑调节,避免音频信号发生突变,对语音信号造成的失真影响小。
88.步骤360、从所述音频信号缓存区获取最先缓存的音频帧,使用与当前的所述增益控制类型对应的增益调整值,对获取的所述音频帧进行增益控制处理。
89.本实施例中,在得到与增益控制类型对应的增益调整值后,通过增益调整值对存储于音频信号缓存区的音频帧进行增益控制处理。示例性的,将当前增益调整值与之前设定数量的音频帧信号相乘,得到进行增益处理后的音频帧。示例性的,将增益调整值作用于当前音频信号缓存区相对于当前帧数早设定帧数(例如,8帧)的音频数据,具体计算公式如下:
90.out(t-d)=gain(t)
×
x(t-d)
91.其中,t表示音频帧的帧数,即当前音频帧为第t帧,out(t-d)是比当前音频帧早d帧的音频帧经过增益控制处理后的音频帧信号,gain(t)是根据当前音频帧计算出的增益调整值,x(t-d)是比当前音频帧早d帧的音频帧。
92.如图3b所示,本实施例中所提供的音频信号的增益控制方法具体为,将根据当前音频帧计算得到的增益调整值作用于当前音频信号缓存区中相对于当前帧数早d帧的音频帧上,并将经过增益控制处理的音频信号发送至语音识别模块。
93.本实施例的技术方案,在根据高能量帧计数结果以及低能量帧计数结果,确定增
益控制类型之后,根据与增益控制类型对应的高能量帧计数结果或低能量帧计数结果,通过设定公式,计算与增益控制类型对应的增益调整值,最终在确定满足音频帧累计参考条件时,从音频信号缓存区获取最先缓存的音频帧,进行与当前的增益控制类型匹配的增益控制处理,实现了将与增益控制类型对应的增益调整值延时作用于音频信号缓存区中存储的音频帧上,平滑放大语音信号,或抑制噪声信号,对语音信号造成的失真小,提高语音识别成功率。
94.实施例四
95.图4为本发明实施例四提供的一种音频信号的增益控制装置的结构示意图,该音频信号的增益控制装置,包括:音频信号存储模块410、增益控制类型确定模块420和增益控制处理模块430。
96.音频信号存储模块410,用于实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中;
97.增益控制类型确定模块420,用于实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型;
98.增益控制处理模块430,用于当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
99.本发明实施例的技术方案,通过实时采集音频信号,并将音频信号按照音频帧的形式依次存储于音频信号缓存区中,同时,实时根据音频信号缓存区中当前缓存的各音频帧的信号能量,确定增益控制类型,当确定满足音频帧累计参考条件时,从音频信号缓存区获取最先缓存的音频帧,进行与当前的增益控制类型匹配的增益控制处理,实现了通过连续监测音频帧的信号能量值,来进行音频信号增益的调整,能够放大语音信号并抑制剩余干扰和噪声信号,提高了语音识别成功率。
100.可选的,所述增益控制类型确定模块420,包括:
101.信号能量计算单元,用于实时获取所述音频信号缓存区中当前缓存的一个新的音频帧,并计算所述新的音频帧的信号能量;
102.计数结果更新单元,用于判断所述信号能量是否大于或等于全局能量阈值,并根据判断结果,更新与所述音频信号缓存区匹配的高能量帧计数结果以及低能量帧计数结果;
103.增益控制类型确定单元,用于根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型。
104.可选的,所述计数结果更新单元,具体用于:
105.在确定所述判断结果为所述信号能量大于或等于所述全局能量阈值时,对所述高能量帧计数结果进行累加;如果确定累加后结果超过第一阈值,则将所述低能量帧计数结果设置为设定初始值;
106.在确定所述判断结果为所述信号能量小于全局能量阈值时,对所述低能量帧计数结果进行累加;如果确定累加后结果超过第二阈值,则将所述高能量帧计数结果设置为设定初始值。
107.可选的,所述增益控制类型确定单元,具体用于:
108.如果确定所述高能量帧计数结果超过所述第一阈值,则确定所述增益控制类型为
放大音频帧信号;
109.如果确定所述低能量帧计数结果超过所述第二阈值,则确定所述增益控制类型为抑制音频帧信号;
110.如果确定所述高能量帧计数结果未超过所述第一阈值,或者确定所述低能量帧计数结果未超过所述第二阈值,则确定所述增益控制类型为保持音频帧信号不变。
111.可选的,所述增益控制类型确定模块420,还包括:
112.增益调整值确定单元,用于在根据所述高能量帧计数结果以及低能量帧计数结果,确定增益控制类型之后,根据与所述增益控制类型对应的高能量帧计数结果或低能量帧计数结果,确定与所述增益控制类型对应的增益调整值;
113.相应的,所述增益控制处理模块430,具体用于:
114.从所述音频信号缓存区获取最先缓存的音频帧,使用与当前的所述增益控制类型对应的增益调整值,对获取的所述音频帧进行增益控制处理。
115.可选的,所述音频信号的增益控制装置,还包括:
116.音频帧输入模块,用于在从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理之后,将音频信号缓存区中经过增益控制处理的音频帧输入至语音识别模块。
117.可选的,所述增益调整值确定单元,具体用于:
118.在确定所述增益控制类型为放大音频帧信号时,使用公式:计算所述增益调整值;
119.其中,gain1是放大增益值,a是增益放大系数,h是所述高能量帧计数结果,b是所述第一阈值。
120.可选的,所述增益调整值确定单元,具体用于:
121.在确定所述增益控制类型为抑制音频帧信号时,使用公式:gain2=0.95
(l-c)
,计算所述增益调整值;
122.其中,gain2是抑制增益值,l是所述低能量帧计数结果,c是所述第二阈值。
123.可选的,所述信号能量计算单元,具体用于:
124.根据当前缓存的一个新的音频帧,使用公式:p(t)=αx2(t)+(1-α)x2(t-1),计算所述新的音频帧的信号能量;
125.其中,p(t)表示当前缓存的第t个音频帧的信号能量,α是常数,x(t)表示第t帧音频信号,t表示音频信号的帧数。
126.可选的,所述音频帧累计参考条件,包括:
127.所述音频信号缓存区中缓存有累计参考数量的音频帧,或者所述音频信号缓存区中不再缓存有新的音频帧。
128.本发明实施例所提供的音频信号的增益控制装置可执行本发明任意实施例所提供的音频信号的增益控制方法,具备执行方法相应的功能模块和有益效果。
129.实施例五
130.图5为本发明实施例五提供的一种电子设备的结构示意图,如图5所示,该电子设备包括处理器50和存储器51;设备中处理器50的数量可以是一个或多个,图5中以一个处理
器50为例;设备中的处理器50和存储器51可以通过总线或其他方式连接,图5中以通过总线连接为例。
131.存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种音频信号的增益控制方法对应的程序指令/模块(例如,音频信号的增益控制装置中的音频信号存储模块410、增益控制类型确定模块420和增益控制处理模块430)。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的音频信号的增益控制方法。
132.该方法包括:
133.实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中;
134.实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型;
135.当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
136.存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
137.实施例六
138.本发明实施例六还提供一种其上存储有计算机程序的计算机可读存储介质,所述计算机程序在由计算机处理器执行时用于执行一种音频信号的增益控制方法,该方法包括:
139.实时采集音频信号,并将所述音频信号按照音频帧的形式依次存储于音频信号缓存区中;
140.实时根据所述音频信号缓存区中当前缓存的各所述音频帧的信号能量,确定增益控制类型;
141.当确定满足音频帧累计参考条件时,从所述音频信号缓存区获取最先缓存的音频帧,进行与当前的所述增益控制类型匹配的增益控制处理。
142.当然,本发明实施例所提供的包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的音频信号的增益控制方法中的相关操作。
143.通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设
备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
144.值得注意的是,上述一种音频信号的增益控制装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
145.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1