音频数据的增益控制方法及装置的制造方法
【专利说明】
【技术领域】
[0001]本发明涉及音频信号处理技术,尤其涉及一种音频数据的增益控制方法及装置。【【背景技术】】
[0002]随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用程序。有些应用程序中会涉及语音识别服务,例如,微信中的语音输入功能,搜索应用中的语音助手,等。
[0003]然而,在语音识别服务中,通常要求采集的音频数据的幅度数值大于或等于一定的识别阈值,一旦音频数据的幅度数值小于该识别阈值,则识别性能就会大大降低。因此,亟需提供一种音频数据的增益控制方法及装置,以将待识别音频数据的幅度数值控制在识别阈值之上,避免语音识别性能的降低。
【
【发明内容】
】
[0004]本发明从多个方面提供一种音频数据的增益控制方法及装置,用以将待识别音频数据的幅度数值控制在识别阈值之上,避免语音识别性能的降低。
[0005]本发明的一方面,提供一种音频数据的增益控制方法,包括:
[0006]获取第N帧音频数据和所述第N帧音频数据的VAD信息,N为大于Μ的整数,Μ为大于或等于1的整数;
[0007]根据期望幅度数值和所述第Ν帧音频数据,获得所述第Ν帧音频数据的期望增益;
[0008]根据所述第Ν帧音频数据的VAD信息、所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息、所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益;
[0009]利用所述控制增益,对所述第Ν帧音频数据进行增益控制处理。
[0010]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述第Ν帧音频数据的VAD信息、所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息、所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益,包括:
[0011]根据所述第Ν帧音频数据的VAD信息,确定所述第Ν帧音频数据是否为语音帧;
[0012]若所述第Ν帧音频数据为语音帧,对所述第Ν帧音频数据的VAD信息和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息进行运算处理,以获得运算结果;
[0013]若所述运算结果满足预先设置的控制条件,根据所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益。
[0014]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述第N帧音频数据的期望增益和所述第N帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益,包括:
[0015]根据所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,选择Ρ个最小的期望增益,Ρ为大于1且小于或等于Μ的奇数,对所述Ρ个最小的期望增益进行中值滤波处理,以获得所述第Ν帧音频数据的最小增益;
[0016]若所述第Ν帧音频数据的最小增益小于最小增益值,利用所述第Ν帧音频数据的最小增益更新所述最小增益值;
[0017]若所述第Ν帧音频数据的最小增益大于或等于所述最小增益值,维持所述最小增益值,并记录所述最小增益值的持续时间;
[0018]根据所述最小增益值,获得所述第Ν帧音频数据的控制增益。
[0019]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述若所述第Ν帧音频数据的最小增益大于或等于所述最小增益值,维持所述最小增益值,并记录所述最小增益值得持续时间之后,还包括:
[0020]若所述最小增益值的持续时间大于最小增益跟踪窗长的Κ1倍,Κ1为大于0且小于1的数值,且所述第Ν帧音频数据的最小增益小于最小增益暂时值,利用所述第Ν帧音频数据的最小增益更新所述最小增益暂时值;
[0021]若所述最小增益值的持续时间大于最小增益跟踪窗长的Κ2倍,Κ2为大于Κ1的数值,利用所述最小增益暂时值更新所述最小增益值,并将所述最小增益值的持续时间设置为最小增益跟踪窗长的Κ1倍,将所述最小增益暂时值恢复为初始值。
[0022]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述最小增益值,获得所述第Ν帧音频数据的控制增益,包括:
[0023]根据增益平滑因子、所述第Ν-l帧音频数据的控制增益和所述最小增益值,获得所述第Ν帧音频数据的控制增益。
[0024]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益,还包括:
[0025]若所述第Ν帧音频数据的最小增益大于或等于所述最小增益值的Κ3倍,Κ3为指定数值,将所述最小增益值,作为所述第Ν帧音频数据的控制增益。
[0026]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用所述控制增益,对所述第Ν帧音频数据进行增益控制处理,包括:
[0027]若所述第Ν帧音频数据的控制增益小于或等于所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益中最小期望增益,利用所述控制增益,对所述第Ν帧音频数据进行增益控制处理;
[0028]若所述第Ν帧音频数据的控制增益大于所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益中最小期望增益,利用所述最小期望增益,对所述第Ν帧音频数据进行增益控制处理。
[0029]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述第N帧音频数据的VAD信息、所述第N帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息、所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益,还包括:
[0030]若所述第Ν帧音频数据为噪声帧,利用对所述第Ν-l帧音频数据进行增益控制处理的增益,对所述第Ν帧音频数据进行增益控制处理。
[0031]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述第Ν帧音频数据的VAD信息、所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息、所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益,还包括:
[0032]若所述运算结果不满足预先设置的控制条件,利用对所述第Ν-l帧音频数据进行增益控制处理的增益,对所述第Ν帧音频数据进行增益控制处理。
[0033]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
[0034]获取第Q帧音频数据和所述第Q帧音频数据的VAD信息,Q为小于或等于Μ的整数;
[0035]利用增益初始值,对所述第Q帧音频数据进行增益控制处理。
[0036]本发明的另一方面,提供一种音频数据的增益控制装置,包括:
[0037]获取单元,用于获取第Ν帧音频数据和所述第Ν帧音频数据的VAD信息,Ν为大于Μ的整数,Μ为大于或等于1的整数;
[0038]期望增益获得单元,用于根据期望幅度数值和所述第Ν帧音频数据,获得所述第Ν帧音频数据的期望增益;
[0039]控制增益获得单元,用于根据所述第Ν帧音频数据的VAD信息、所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息、所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益;
[0040]控制单元,用于利用所述控制增益,对所述第Ν帧音频数据进行增益控制处理。
[0041]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制增益获得单元,具体用于
[0042]根据所述第Ν帧音频数据的VAD信息,确定所述第Ν帧音频数据是否为语音帧;
[0043]若所述第Ν帧音频数据为语音帧,对所述第Ν帧音频数据的VAD信息和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的VAD信息进行运算处理,以获得运算结果;
[0044]若所述运算结果满足预先设置的控制条件,根据所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,获得所述第Ν帧音频数据的控制增益。
[0045]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制增益获得单元,具体用于
[0046]根据所述第Ν帧音频数据的期望增益和所述第Ν帧音频数据之前相邻的Μ帧音频数据中每帧音频数据的期望增益,选择Ρ个最小的期望增益,Ρ为大于1且小于或等于Μ的奇数,对所述ρ个最小的期望增益进行中值滤波处理,以获得所述第N帧音频数据的最小增益;
[0047]若所述第N帧音频数据的最小增益小于最小增益值,利用所述第N帧音频数据的最小增益更新所述最小增益值;
[0048]若所述第N帧音频数据的最小增益大于或等于所述最小增益值,维持所述最小增益值,并记录所述最小增益值的持续时间;以及
[0049]根据所述最小增益值,获得所述第N帧音频数据的控制增益。
[0050]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制增益获得单元,还用于
[0051]若所述最小增益值的持续时间大于最小增益跟踪窗长的K1倍,K1为大于0且小于1的数值,且所述第N帧音频数据的最小增益小于最小增益暂时值,利用所述第N帧音频数据的最小增益更新所述最小增益暂时值;
[0052]若所述最小增益值的持续时间大于最小增益跟踪窗长的K2倍,K2为大于K1的数值,利用所述最小增益暂