生成舒适噪声的制作方法

文档序号:8269906阅读:473来源:国知局
生成舒适噪声的制作方法
【技术领域】
[0001] 所提出的技术大体上涉及生成舒适噪声(CN),并具体地涉及生成舒适噪声控制参 数。
【背景技术】
[0002] 在用于会话语音的编码系统中,使用非连续发射(DTX)来增加编码效率是常见 的。这是由在会话语音(例如,当一个人正在讲话时,另一个人正在听)中嵌入的大量暂停 来激励的。通过使用DTX,语音编码器可以平均仅在约50%的时间是活跃的。具有该特征的 编解码器的示例是3GPP自适应多速率窄带(AMR NB)编解码器和ITU-T G. 718编解码器。
[0003] 在DTX操作中,在正常编解码模式中对活跃帧进行编码,而使用舒适噪声对活跃 区域之间的不活跃信号周期进行表示。信号描述参数被提取并用编码器进行编码并且在静 默插入描述符(SID)帧中向解码器发送。与用于活跃语音编码模式的帧速率和比特率相 比,以减小的帧速率和降低的比特率来发送SID帧。在SID帧之间不发送关于信号特征的 信息。由于较低的SID速率,因此与活跃信号帧编码相比,舒适噪声只能表示相对稳定的性 质。在解码器中,接收到的参数被解码并用于表征舒适噪声。
[0004] 对于高质量DTX操作,S卩,在不降级语音质量的情况下,检测输入信号中语音的周 期是重要的。这是通过使用语音活跃检测器(VAD)或者声音活跃检测器(SAD)来完成的。 图1示出了通用的VAD的框图,其分析数据帧(5-30ms,这取决于实现)中的输入信号,并产 生针对每个帧的活跃判决。
[0005] 在初始语音检测器12中通过将由特征提取器10估计的当前帧的特征与由背景 估计块14根据先前输入帧估计的背景特征进行比较来做出初始的活跃判决(初始VAD判 决)。大于指定阈值的差值导致活跃的初始判决。在延迟附加块16中,基于过去的初始判 决对初始判决进行扩展,以形成最终的活跃判决(最终VAD判决)。使用延迟的主要原因是 为了减小在语音段中中间和后端削波的风险。
[0006] 对于基于线性预测(LP)的语音编解码器(例如G. 718),使用与活跃帧的表示类似 的表示对包络和帧能量进行建模是合理的。这一点是有利的,其原因在于可以通过在DTX 操作中的不同模式之间的公共功能来降低编解码器的存储要求和复杂度。
[0007] 对于这种编解码器,舒适噪声可以用其LP系数(也称为自回归(AR)系数)以及 LP剩余部分的能量来表示,即作为LP模型的输入给出参考音频段的信号。在解码器中,在 激励生成器中生成剩余信号作为随机噪声,通过CN参数对随机噪声进行成型以形成舒适 噪声。
[0008] LP系数通常通过根据下式计算加窗音频段x[n],n = 0, . . .,N-1的自相关r[k] 而获得:
【主权项】
1. 一种生成舒适噪声"CN"控制参数的方法,其特征在于, 在具有预定大小(M)的缓冲器(200)中存储(SI;la)静默插入描述符"SID"帧和活跃 延迟帧的CN参数(q^,gO; 基于所存储的CN参数的寿命以及剩余能量来确定(S2,lb,2)与SID帧有关的CN参数 子集(Qs,Es); 使用(S3,3,4)所确定的CN参数子集(QS,ES)来确定跟随在活跃信号帧之后的第一SID帧"第一SID"的CN控制参数(qi,ED。
2. 根据权利要求1所述的方法,其特征在于, 针对SID帧和活跃延迟帧,用新的CN参数(存,/))来更新(la)所述缓冲器(200); 针对活跃非延迟帧,基于连续的活跃非延迟帧的数量PA来更新(lb)所存储的CN参数 的寿命受限子集(QK,EK)的大小K; 基于剩余能量从所述寿命受限子集(QK,EK)中选择(2)所述CN参数子集(QS,ES); 根据所述CN参数子集(Qs,Es)来确定(3)代表CN参数(呑,/?); 用经解码的CN参数(^jSiD,罵;来对所述代表CN参数(q, /7)进行内插。
3. 根据权利要求2所述的方法,其特征在于,针对活跃非延迟帧,根据下式来更新(lb) 所述寿命受限子集(QK,EK)的大小K: K=K0-n对于n?y彡pa<(n+1) ?y 其中 KQ是所述缓冲器(200)中存储的SID帧和活跃延迟帧的CN参数的数量, y是预定常数, n是非负整数。
4. 根据权利要求2或3所述的方法,其特征在于,通过仅包括满足下式的CN参数,从所 述寿命受限子集(QK,EK)中选择(2)所述CN参数子集(QS,ES): 馬t 〈瓦£ + 匕对于k=kQ,…,kK_i 其中 <:是最新存储的剩余能量, YdPy2分别是被认为表示从活跃帧向不活跃帧过渡时的噪声的剩余能量的预定的 下限和上限, 心,...,kK_i被分类使得k^与最新存储的CN参数相对应并且kK_i与最早存储的CN参 数相对应。
5. 根据权利要求2、3或4所述的方法,其特征在于,根据所述CN参数子集(Qs,Es)来 确定⑶代表CN参数问,亙,其中, q是所述CN参数子集(QS,ES)中的矢量集合Qs的中值矢量,所述中值矢量表示自回归 "AR"系数,以及 f是所选择的CN参数子集(QS,ES)中的剩余能量集合^的加权平均剩余能量。
6. 根据权利要求5所述的方法,其特征在于,所述中值矢量奋将所述AR系数表示为线 谱对。
7. -种用于生成舒适噪声"CN"控制参数的计算机程序,包括当在计算机(60)上运行 时使所述计算机执行以下操作的计算机可读代码单元: 在具有预定大小(M)的缓冲器(200)中存储(66 ;S1 ;la)静默插入描述符"SID"帧和 活跃延迟帧的cn参数((^,五丨勹; 基于所存储的CN参数的寿命以及剩余能量来确定(68 ;S2 ;lb,2)与SID帧有关的CN参数子集(Qs,Es); 使用(68 ;S3 ;3,4)所确定的CN参数子集(Qs,Es)来确定跟随在活跃信号帧之后的第 一SID帧"第一SID"的CN控制参数(qi,ED。
8. -种计算机程序产品,包括计算机可读介质和存储在所述计算机可读介质上的根据 权利要求7所述的计算机程序。
9. 一种用于生成舒适噪声"CN"控制参数的舒适噪声控制器(50),其特征在于, 具有预定大小(M)的缓冲器(200),被配置为:存储SID帧和活跃延迟帧的CN参数 W); 子集选择器(50A;54,300),被配置为:基于所存储的CN参数的寿命以及剩余能量来确 定与静默插入描述符"SID"帧有关的CN参数子集(QS,ES); 舒适噪声控制参数提取器(50B;400,500)被配置为:使用所确定的CN参数子集(Qs,Es)来确定跟随在活跃信号帧之后的第一SID帧"第一SID"的CN控制参数(qi,EJ。
10. 根据权利要求9所述的控制器(50),其特征在于, SID和延迟帧缓冲器更新器(52),被配置为:针对SID帧和活跃延迟帧,用新的CN参数 (仓,左)来更新所述缓冲器(200); 非延迟帧缓冲器更新器(54),被配置为:针对活跃非延迟帧,基于连续的活跃非延迟 帧的数量?&来更新所存储的CN参数的寿命受限子集(QK,EK)的大小K; 缓冲器元素选择器(300),被配置为:基于剩余能量从所述寿命受限子集(QK,EK)中选 择所述CN参数子集(QS,ES); 舒适噪声参数估计器(400),被配置为:根据所述CN参数子集(QS,ES)来确定(3)代表CN参数(夺,互); 舒适噪声参数内插器(500),被配置为:用经解码的CN参数(^STO,i^/D)来对所述代 表CN参数C夺,进行内插。
11. 根据权利要求10所述的控制器(50),其特征在于,所述缓冲器元素选择器(300) 被配置为:针对活跃非延迟帧,根据下式更新所述寿命受限子集(QK,EK)的大小K: K=K0-n对于n?y彡pa<(n+1) ?y其中 KQ是所述缓冲器(200)中存储的SID帧和活跃延迟帧的CN参数的数量, y是预定常数,n是非负整数。
12. 根据权利要求10或11所述的控制器(50),其特征在于,所述缓冲器元素选择器 (300)被配置为:通过仅包括满足下式的CN参数,从所述寿命受限子集(QK,EK)中选择所述 CN参数子集(QS,ES): 土'上-7i< 纪 < 五X+ /2 对于k=k〇,? ??,kH其中 是最新存储的剩余能量, YdPy2分别是被认为表示从活跃帧向不活跃帧过渡时的噪声的剩余能量的预定的 下限和上限, 心,...,kK_i被分类使得k^与最新存储的CN参数相对应并且kK_i与最早存储的CN参 数相对应。
13. 根据权利要求10、11或12所述的控制器(50),其特征在于,所述舒适噪声参数估 计器(400)被配置为:根据所述CN参数子集(QS,ES)来确定代表CN参数0,!,其中, q是所述CN参数子集(QS,ES)中的矢量集合Qs的中值矢量,所述中值矢量表示自回归 "AR"系数,以及 f是所选择的CN参数子集(QS,ES)中的剩余能量集合^的加权平均剩余能量。
14. 一种解码器(100),包括根据前述权利要求9-13中任一项所述的舒适噪声控制器 (50) 〇
15. -种网络节点(80),包括根据权利要求14所述的解码器(100)。
16. -种网络节点(80),包括根据前述权利要求9-13中任一项所述的舒适噪声控制器 (50) 〇
17. 根据前述权利要求14-16中任一项所述的网络节点(80),其中网络节点是移动终 端。
【专利摘要】描述了用于生成CN(舒适噪声)控制参数的舒适噪声控制器(50)。具有预定大小的缓冲器(200)被配置为:存储SID(静默插入描述符)帧和活跃延迟帧的CN参数。子集选择器(50A)被配置为:基于存储的CN参数的寿命以及剩余能量来确定与SID帧有关的CN参数子集。舒适噪声控制参数提取器(50B)被配置为:使用所确定的CN参数子集来确定跟随在活跃信号帧之后的第一SID帧的CN控制参数。
【IPC分类】G10L19-012, G10L19-07, G10L25-78
【公开号】CN104584120
【申请号】CN201380043927
【发明人】托马斯·詹森·托夫特戈德
【申请人】瑞典爱立信有限公司
【公开日】2015年4月29日
【申请日】2013年5月7日
【公告号】CA2884471A1, EP2823479A1, EP2823479B1, EP2927905A1, US20150235648, WO2014040763A1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1