专利名称:音频暂态信号的检测方法
技术领域:
本发明涉及数字移动通信领域,特别是涉及一种音频暂态信号的检测 方法。
背景技术:
暂态信号是一种特殊的音频信号,它多存在于有敲打乐器的的音频序 列中,例如,连续的敲锣打鼓产生的信号可以称之为暂态信号。它的特殊
性在于,如果采用常规的变换编码方法例如MDCT等,对其进行编解码的 话,由于量化噪声的存在,会产生预回声现象。预回声现象则是人耳不能 忍受的一种听觉上的失真。现有技术中虽然已经有两类经典的技术对暂态 信号进行有效的编解码,但是,运算开销都相对常规的变换编解码的方法 要大得多。
为了能够对暂态信号进行有效的编解码,对暂态信号进行准确的检测 是非常重要的。感知熵是一种经典的暂态信号检测方法。它能有效的进行 频域中的暂态信号检测,但是由于其要用到多点的FFT (傅立叶变换), 所以计算较为复杂。
发明内容
本发明要解决的技术问题是提供一种音频暂态信号的检测方法,能够 快速从时域中检测出音频暂态信号。
为解决上述技术问题,本发明的音频暂态信号的检测方法是采用如下技术方案实现的,首先,在每帧音频信号中分别求出突变指数以及最大加
权能量两个特征信号;然后根据设定的门限值进行门限判决;
先判断最大加权能量是否大于门限值,如果大于则该帧音频信号为暂
态信号;否则再判断突变指数是否大于门限值,如果大于则判定该帧音频
信号为暂态信号,否则为稳态信号。
由于采用本发明的方法,在进行暂态信号检测时不需要多点的FFT,
所以计算过程简单,能够快速的在音频序列中检测出暂态信号。
下面结合附图与具体实施方式
对本发明作进一步详细的说明-图1是本发明的暂态信号检测框图; 图2是图1中的门限判决框图。
具体实施例方式
参见图l所示,本发明的音频暂态信号检测方法具体实现的过程是
对于输入的每帧音频信号,在得到输入音频信号采样点x1,x2,...,xN以后, 将所有采样点的信号均匀的分成L段。在每一段采样点的信号中,首先计
算每段采样点的信号的能量,称为子段信号能量E1。<formula>formula see original document page 5</formula>其中,A1是表示第I段信号含有的采样点。
然后,再计算每段采样点的信号A1中,绝对值最大的前M个点(M可 以取任意一个大于l整数)。将绝对值求平均值,可以得到子段信号峰值
PMi.if =丄》;c, l,M,鬆树值最大的fjM傾样点集合
计算子段信号峰值if还可以采用其它方法,如求M个最大值的中值,
或者加权平均值等。
最后,求得整个采样点的信号输入帧的平均能量&。
! =1
根据上述计算所得到的三组参数子段信号能量&、子段信号峰值 iT、输入帧的平均能量&,以及一个码率自适应的权重参数表(可以采 用现有技术中任意一种码率自适应权重参数表)进行暂态信号检测。
首先,使用每一个子段信号峰值/r和前一个子段信号能量^参数,
计算如下的突变指数
/〖-i,"2,3,…,丄
五M
从物理意义上解释,子段信号峰值if和前一子段信号能量A参数比 值越大,意味着信号在这个子段出现瞬变,产生了一个类似冲击的现象,
即暂态信号现象。在计算子段信号峰值iT时,选取M个绝对值最大的点,
其目的是为了保证检测在如下两种情况下的鲁棒性
a) 在出现毛刺类伪暂态现象的时候,即子段信号有一个特别大的值 (野值)的时候,用M个绝对值最大的点平均值可以让子段信号的峰值降
下来,得到一个鲁棒的子段信号峰值。
b) 在子段信号末端出现暂态现象的时候,这一个子段其实是近似稳 态的,如果认为其为暂态的话,会带来不必要的计算量增加。
然后,再计算最大加权能量,即子段信号能量A乘以一个系数r(力j'^az^)得到加权的子段信号能量£,'=吖&>"^^,其与平均能量A的 比值。
所述的系数r ("^We)是一组经验值,是根据音频编解码的码率 来自适应调整的(即,对应不同的码率,所取的经验值不一样),选自码 率自适应权重参数表。
根据计算所得的突变指数以及最大加权能量进行门限判决
首先计算最大加权能量是否大于某个门限,艮P-
如果大于则判定为该帧音频信号需要进行暂态信号的编解码处理,即 认为是暂态信号。否则再判断突变指数/,r是否超过门限,艮口
max /〖> T2
如果大于则判定该音频信号为暂态信号,否则为稳态信号,即不用进 行暂态信号的编解码处理。
在进行门限判决时可以采用任意一种模式分类方法(给定输入特征), 例如采用神经网络分类器进行门限判决。
权利要求
1、一种音频暂态信号的检测方法,其特征在于首先,在每帧音频信号中分别求出突变指数以及最大加权能量两个特征信号;然后根据设定的门限值进行门限判决;先判断最大加权能量是否大于门限值,如果大于则该帧音频信号为暂态信号;否则再判断突变指数是否大于门限值,如果大于则判定该帧音频信号为暂态信号,否则为稳态信号。
2、 根据权利要求1所述的音频暂态信号的检测方法,其特征在于 所述突变指数和最大加权能量的计算方法是,对于输入的每帧音频信号, 在得到输入音频信号采样点Xt、 X2、……Xw以后,将所有采样信号均匀的 分成L段,在每一段信号中分别求出子段信号能量&、子段信号峰值if 、 以及每帧音频信号的平均能量所述突变指数等于每一个子段信号峰值iT和前一个子段信号能量 &;的比值,SP:<formula>formula see original document page 2</formula>所述最大加权能量等于加权的子段信号能量与平均能量&的比值, 其中,加权的子段信号能量等于每个子段信号能量A乘以选自码率自适 应权重参数表的一个系数。
3、 根据权利要求2所述的音频暂态信号的检测方法,其特征在于所述子段信号能量A等于£/= Z 、2其中,4表示第7段信号含有的采样点。
4、 根据权利要求2所述的音频暂态信号的检测方法,其特征在于-所述子段信号峰值iT的计算方法是,在每段采样信号中选取绝对值最大 的前#个点,f为任意一个大于1的整数;对选定的i/个绝对值最大的点 采用求平均值、求中值、或加权平均值的方法得到子段信号峰值iT。
5、 根据权利要求2所述的音频暂态信号的检测方法,其特征在于-所述每帧音频信号的平均能量^等于五o^Z!《。
全文摘要
本发明公开了一种音频暂态信号的检测方法,首先,在每帧音频信号中分别求出突变指数以及最大加权能量两个特征信号;然后根据设定的门限值进行门限判决;先判断最大加权能量是否大于门限值,如果大于则该帧音频信号为暂态信号;否则再判断突变指数是否大于门限值,如果大于则判定该帧音频信号为暂态信号,否则为稳态信号。本发明能够快速从时域中检测出音频暂态信号。适用于数字移动通信领域。
文档编号G10L11/00GK101308651SQ20071004077
公开日2008年11月19日 申请日期2007年5月17日 优先权日2007年5月17日
发明者张本好, 林福辉, 黄鹤云 申请人:展讯通信(上海)有限公司