语音信号带宽扩展装置及方法
【专利摘要】本发明公开了一种语音信号带宽扩展装置,该装置在进行语音信号带宽扩展时,利用余弦平移调制法生成全频带宽带激励信号、使用隐马尔科夫模型估计宽带谱包络参数。该装置降低了重建宽带信号的谱失真,并保证了重建宽带信号频谱的连贯性。同时,本发明还公开了一种语音信号带宽扩展方法。
【专利说明】语音信号带宽扩展装置及方法
【技术领域】
[0001]本发明涉及语音通信【技术领域】,特别是涉及一种语音信号带宽扩展装置以及一种语音信号带宽扩展方法。
【背景技术】
[0002]当前通信网络传输的语音是带宽限制在300?3400Hz窄带语音,窄带语音在声音质量、清晰度和可懂度方面次于8000Hz带宽的宽带语音。在许多重要的应用场合,语音高频分量尤其显得重要,如在可视电话、电话会议之类的应用中,宽带语音会增加参与人员的临场感觉,更好的理解他人的发言;对听力有障碍的人来说,高频辅音的缺乏是他们使用电话有困难的主要原因。由于宽带语音对于窄带语音的优越性,所以对窄带语音进行谱扩展,得到相应宽带语音的带宽扩展技术显得非常有意义。
[0003]带宽扩展算法通常基于线性源滤波器生成模型,该算法模型分成独立的两步:一步是估计宽带谱包络,另一步是估计宽带激励信号,宽带语音信号由宽带激励信号通过宽带谱包络滤波器滤波生成。带宽扩展的关键就是如何利用窄带信号估计宽带谱包络和宽带激励信号。
[0004]带宽扩展算法对宽带谱包络估计一般通过提取窄带信号的特征参数然后与预先存储的宽带参数相匹配来估计得到。目前的谱包络估计算法主要有基于矢量量化的带宽扩展算法、非线性映射法、高斯混合模型算法(Gaussian mixture model,GMM)。矢量量化法使用语音编码中的矢量量化技术将语音信号的特征参数空间分割为若干用码本表示的区域,由于算法在码本训练时无法考虑信号的高低带之间的统计特性,不能实现最优的搜索和分类,估计的宽带谱失真比较大。高斯混合模型算法使用统计理论中的混合高斯函数来描述语音信号的特征参数的分布情况,并基于混合高斯函数估高带谱包络,解决了码本映射法存在的问题,但其最大的问题是算法描述语音信号时间上帧间相关动态特性能力差,没有考虑信号帧间特征矢量的连续性,重建信号的频谱有跳变。
[0005]当前,带宽扩展算法对宽带激励信号的估计方法以谱折叠、白噪声激励、谐波噪声模型最为典型。谱折叠将窄带激励信号在频域做镜像折叠得到高带激励信号,但产生的宽带激励信号在3400?4600Hz频带会出现频谱空洞。白噪声激励算法利用随机白噪声作高带激励信号,算法虽然简单,但它破坏了语音信号的谐波结构,对于强浊音信号,重建的宽带语音信号会出现人耳可闻的噪声。谐波噪声模型算法对语音信号进行清音/浊音分类,然后根据分类结果分别用白噪声/谐波作为高带激励信号,但是算法依赖基频估计和清音/浊音分类的准确性,不准确的估计会使重建的语音信号失真并且出现噪声,并且算法的运算复杂度比较高。
【发明内容】
[0006]基于此,有必要针对传统的宽带谱包络估计存在谱失真比较大、重建信号的频谱有跳变等问题,提供一种宽带谱包络估计精度高的语音信号带宽扩展装置。[0007]同时,还提供一种语音信号带宽扩展方法。
[0008]一种语音信号带宽扩展装置,包括:
[0009]宽带谱包络估计模块,连接窄带语音信号源,用于通过隐马尔科夫模型估计窄带语音信号的宽带谱包络参数;
[0010]宽带线性预测系数计算模块,连接所述宽带谱包络估计模块,用于接收所述宽带谱包络参数并将所述宽带谱包络参数转换为宽带线性预测系数;
[0011]预处理模块,连接所述窄带语音信号源,用于对所述窄带语音信号源进行预处理获取频带受限的宽带语音信号;
[0012]分析滤波模块,分别连接所述预处理模块和所述宽带线性预测系数计算模块,用于通过所述宽带线性预测系数对所述频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号;
[0013]激励扩展模块,连接所述分析滤波模块,用于对所述频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号;
[0014]合成滤波模块,分别连接所述宽带线性预测系数计算模块和所述激励扩展模块,用于通过所述宽带线性预测系数对所述全频带的宽带激励信号进行合成滤波获取全频带的宽带语音信号。
[0015]在其中一个实施例中,所述宽带谱包络估计模块包括:
[0016]特征参数提取单元,连接所述窄带语音信号源,用于提取所述窄带语音信号的窄带特征参数;
[0017]隐马尔科夫模型统计单元,连接所述特征参数提取单元,用于接收所述窄带特征参数并根据隐马尔科夫模型计算状态条件后验概率;
[0018]宽带线谱频率系数计算单元,连接所述隐马尔科夫模型统计单元和所述宽带线性预测系数计算模块,通过先验宽带矢量码本和所述状态条件后验概率,并基于软判决准则计算所述窄带语音信号的宽带线谱频率系数并将所述宽带线谱频率系数发送给所述宽带线性预测系数计算模块。
[0019]在其中一个实施例中,所述激励扩展模块包括:
[0020]余弦频移调制单元,连接所述分析滤波模块,用于接收所述频带受限的宽带激励信号并对所述频带受限的宽带激励信号进行余弦频移调制获得所述频带受限的宽带激励信号的高频部分;
[0021]加法器单元,连接所述分析滤波模块、所述余弦频移调制单元和所述合成滤波模块,用于将所述频带受限的宽带激励信号和所述频带受限的宽带激励信号的高频部分进行加法运算获得全频带的宽带激励信号,并将所述全频带的宽带激励信号发送给所述合成滤波模块。
[0022]在其中一个实施例中,所述激励扩展模块还包括高通滤波单元,所述高通滤波单元分别连接所述余弦频移调制单元和所述加法器单元,用于对所述频带受限的宽带激励信号的高频部分进行高通滤波,并将所述高通滤波后的频带受限的宽带激励信号的高频部分发送给所述加法器单元。
[0023]在其中一个实施例中,所述激励扩展模块还包括延迟单元,所述延迟单元分别连接所述分析滤波模块和所述加法器单元,用于接收所述频带受限的宽带激励信号并对所述频带受限的宽带激励信号进行与所述高通滤波所产生的延迟相应的延迟,并将所述延迟后的频带受限的宽带激励信号发送给所述加法器单元。
[0024]一种语音信号带宽扩展方法,包括如下步骤:
[0025]根据隐马尔科夫模型估计窄带语音信号的宽带谱包络参数;
[0026]通过所述宽带谱包络参数计算宽带线性预测系数;
[0027]对所述窄带语音信号进行预处理获取频带受限的宽带语音信号;
[0028]通过所述宽带线性预测系数对所述频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号;
[0029]对所述频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号;
[0030]通过所述宽带线性预测系数对所述全频带宽带激励信号进行合成滤波获取全频带的宽带语音信号。
[0031]在其中一个实施例中,所述步骤根据隐马尔科夫模型估计窄带语音信号的宽带谱包络参数具体包括如下步骤:
[0032]获取所述窄带语音信号的窄带特征矢量X ;
[0033]根据所述窄带特征 矢量X和隐马尔科夫模型计算状态条件后验概率P (Si IX),其中,X为观察顺序集,Si为隐马尔科夫模型的状态;
[0034]从先验宽带矢量码本中获取第i个状态对应的宽带谱包络参数矢量免,i =1,2,…,,Ns, Ns为隐马尔科夫模型的状态数;
[0035]基于最小均方差的状态软判决准则、根据所述状态条件后验概率P (Si IX)和所述宽带谱包络参数矢量.计算宽带线谱频率系数7 5w =Σλ/Κ5ψ)。
[0036]在其中一个实施例中,所述根据所述窄带特征矢量X和隐马尔科夫模型计算状态条件后验概率P(S1n) |X(m))的步骤具体包括如下步骤:
[0037]获取观察顺序集X (m), X (m) = {x(l),x(2),..., x (m)},其中,m 为观察时刻,x (m)为第m时刻所观察到的窄带特征矢量,X(m)为观察到第m时刻时以前所有观察到的窄带特征矢量X的集合;
[0038]根据隐马尔科夫模型和贝叶斯定理计算所述状态条件后验概率P (Si (m) IX (m))=P (X (m) I Si (m)).(m), i = (1,2,...,Ns),其中,Si (m)为在 m 时刻隐马尔科夫模型的状态,P(S1n) I X(m))表示观察顺序为X(m)的条件下,在m时刻出现状态Si的概率,P (X (m) I Si (m))为隐马尔科夫模型的观察概率,(m) = P (Si (m),x (I),..., x (m_l)),(m)为状态Si (m)和m时刻过去状态观察特征矢量的联合先验概率密度。
[0039]在其中一个实施例中,所述基于最小均方差的状态软判决准则为:
|xj),其中,Y为原始宽带谱包络参数,5;为估计的宽带谱包络参数,所述基于
最小均方差的状态软判决准则采用连续的特征分量估计宽带谱包络参数。
[0040]在其中一个实施例中,所述对所述频带受限的宽带激励信号进行激励扩展获取所述全频带宽带激励信号的步骤具体包括如下步骤:
[0041]对所述频带受限的宽带激励信号进行余弦频移调制获取所述频带受限的宽带激励信号的高频部分;[0042]对所述频带受限的宽带激励信号的高频部分和所述频带受限的宽带激励信号进行加法运算获取所述全频带宽带激励信号。
[0043]在其中一个实施例中,还包括对所述频带受限的宽带激励信号的高频部分进行高通滤波的步骤。
[0044]在其中一个实施例中,还包括对进行加法运算的所述频带受限的宽带激励信号进行延迟的步骤,所述延迟与所述高通滤波产生的延迟保持一致。
[0045]上述语音信号带宽扩展装置及方法,宽带谱包络估计模块基于隐马尔科夫模型计算窄带语音信号的宽带谱包络参数,并通过宽带谱包络参数计算宽带线性预测系数,对窄带语音信号进行预处理获取频带受限的宽带语音信号,并通过宽带线性预测系数对频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号,通过激励扩展模块对频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号,合成滤波模块基于宽带线性预测系数构成的合成滤波器对宽带激励信号进行合成滤波得到宽带语音信号。通过基于隐马尔科夫模型计算宽带谱包络,能够得到连贯的宽带谱包络,提高了宽带谱包络估计的精度,降低了重建宽带信号的谱失真。
【专利附图】
【附图说明】
[0046]图1为本发明一实施例的语音信号带宽扩展装置模块图;
[0047]图2为本发明另一实施例的语音信号带宽扩展装置模块图;
[0048]图3为本发明一实施例的语音信号带宽扩展方法流程图;
[0049]图4为图3所示实施例步骤SllO的流程图;
[0050]图5为图4所示实施例步骤SI 14的流程图;
[0051]图6为图3所示实施例步骤S150的流程图;
[0052]图7为图3所示实施例步骤S180的流程图。
【具体实施方式】
[0053]一种语音信号带宽扩展装置以及一种语音信号带宽扩展方法,在进行语音信号带宽扩展时,通过使用基于隐马尔科夫模型代替传统的估计算法估计宽带谱包络,提高了估计算法中重建信号的宽带谱包络的连贯性,提高了宽带谱包络估计的精度,降低了重建宽带语音信号的谱失真。
[0054]下面结合附图和实施例对本发明一种语音信号带宽扩展装置以及一种语音信号带宽扩展方法进行进一步详细的说明。
[0055]图1所示,为本发明一实施例的语音信号带宽扩展装置模块图。
[0056]一种语音信号带宽扩展装置,通过基于隐马尔科夫模型估计窄带语音信号的宽带谱包络并通过估计窄带语音信号的宽带激励信号获取重建宽带语音信号。
[0057]语音信号的带宽扩展包括关键的两个步骤,一是估计宽带谱包络,另一步是估计宽带激励信号。如果宽带谱包络估计精度不高会造成重建的宽带语音信号谱失真大,甚至引入人耳可闻的噪声。上述语音信号带宽扩展装置,在进行语音带宽扩展时基于隐马尔科夫模型进行宽带谱包络估计,提高了估计算法中重建信号的宽带谱的连贯性,提高了宽带谱估计的精度,并有效降低谱失真。[0058]上述窄带语音信号是指带宽限制在0.3~3.4千赫兹的语音信号,宽带语音信号是指带宽8千赫兹的语音信号。窄带语音在声音质量、清晰度和可懂度方面次于8千赫兹带宽的宽带语音。
[0059]参考图1,一种语音信号带宽扩展装置,包括宽带谱包络估计模块110、宽带线性预测系数计算模块130、预处理模块150、分析滤波模块170、激励扩展模块180以及合成滤波模块190。
[0060]上述宽带谱包络估计模块110连接窄带语音信号源(图未示),宽带线性预测系数计算模块130分别连接宽带谱包络估计模块110的信号输出端和分析滤波模块170和合成滤波模块190的信号输入端,预处理模块150连接窄带语音信号源(图未示),分析滤波模块170连接预处理模块150的信号输出端,激励扩展模块180分别连接分析滤波模块170和合成滤波模块190。
[0061]宽带谱包络估计模块110接受窄带语音信号的输入,计算窄带语音信号的宽带线谱频率系数(Line Spectrum Frequency, LSF)。宽带线性预测系数计算模块130将上述线谱频率系数(LSF)转换为宽带线性预测系数(Linear Predictive Coefficient7LPC),并将宽带线性预测系数(LPC)发送给分析滤波模块170和合成滤波模块190。同时预处理模块150对窄带语音信号源进行预处理获取频带受限的宽带语音信号,分析滤波模块170通过宽带线性预测系数对频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号,激励扩展模块180对频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号并将上述全频带的宽带激励信号发送给合成滤波模块190,合成滤波模块190通过宽带线性预测系数对全频带的宽带激励信号进行合成滤波获取全频带的宽带语音信号。
[0062]线性预测分析(Linear Predictive Analysis, LPA)的基本思想是语音信号的每个取样值能够用过去若干个取样值的线性组合(预测值)来逼近,通过使实际语音信号取样值和线性预测值之间的均方差最小,来决定唯一的一组预测器系数。这里的预测器系数就是线性组合中所用的加权系数。
[0063]线性预测分析一般借助线性预测误差滤波器来实现。线性预测误差滤波器的传递函数A (Z)为
【权利要求】
1.一种语音信号带宽扩展装置,其特征在于,包括: 宽带谱包络估计模块,连接窄带语音信号源,用于通过隐马尔科夫模型估计窄带语音信号的宽带谱包络参数; 宽带线性预测系数计算模块,连接所述宽带谱包络估计模块,用于接收所述宽带谱包络参数并将所述宽带谱包络参数转换为宽带线性预测系数; 预处理模块,连接所述窄带语音信号源,用于对所述窄带语音信号源进行预处理获取频带受限的宽带语音信号; 分析滤波模块,分别连接所述预处理模块和所述宽带线性预测系数计算模块,用于通过所述宽带线性预测系数对所述频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号; 激励扩展模块,连接所述分析滤波模块,用于对所述频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号; 合成滤波模块,分别连接所述宽带线性预测系数计算模块和所述激励扩展模块,用于通过所述宽带线性预测系数对所述全频带的宽带激励信号进行合成滤波获取全频带的宽带语音信号。
2.根据权利要求1所述的语音信号带宽扩展装置,其特征在于,所述宽带谱包络估计模块包括: 特征参数提取单元,连接所述窄带语音信号源,用于提取所述窄带语音信号的窄带特征参数; 隐马尔科夫模型统计单元,连接所述特征参数提取单元,用于接收所述窄带特征参数并根据隐马尔科夫模型计算状态条件后验概率; 宽带线谱频率系数计算单元,连接所述隐马尔科夫模型统计单元和所述宽带线性预测系数计算模块,通过先验宽带矢量码本和所述状态条件后验概率,并基于软判决准则计算所述窄带语音信号的宽带线谱频率系数并将所述宽带线谱频率系数发送给所述宽带线性预测系数计算模块。
3.根据权利要求1所述的语音信号带宽扩展装置,其特征在于,所述激励扩展模块包括: 余弦频移调制单元,连接所述分析滤波模块,用于接收所述频带受限的宽带激励信号并对所述频带受限的宽带激励信号进行余弦频移调制获得所述频带受限的宽带激励信号的闻频部分; 加法器单元,连接所述分析滤波模块、所述余弦频移调制单元和所述合成滤波模块,用于将所述频带受限的宽带激励信号和所述频带受限的宽带激励信号的高频部分进行加法运算获得全频带的宽带激励信号,并将所述全频带的宽带激励信号发送给所述合成滤波模块。
4.根据权利要求3所述的语音信号带宽扩展装置,其特征在于,所述激励扩展模块还包括高通滤波单元,所述高通滤波单元分别连接所述余弦频移调制单元和所述加法器单元,用于对所述频带受限的宽带激励信号的高频部分进行高通滤波,并将所述高通滤波后的频带受限的宽带激励信号的高频部分发送给所述加法器单元。
5.根据权利要求4所述的语音信号带宽扩展装置,其特征在于,所述激励扩展模块还包括延迟单元,所述延迟单元分别连接所述分析滤波模块和所述加法器单元,用于接收所述频带受限的宽带激励信号并对所述频带受限的宽带激励信号进行与所述高通滤波所产生的延迟相应的延迟,并将所述延迟后的频带受限的宽带激励信号发送给所述加法器单元。
6.一种语音信号带宽扩展方法,其特征在于,包括如下步骤: 根据隐马尔科夫模型估计窄带语音信号的宽带谱包络参数; 通过所述宽带谱包络参数计算宽带线性预测系数; 对所述窄带语音信号进行预处理获取频带受限的宽带语音信号; 通过所述宽带线性预测系数对所述频带受限的宽带语音信号进行分析滤波获取频带受限的宽带激励信号; 对所述频带受限的宽带激励信号进行激励扩展获取全频带的宽带激励信号; 通过所述宽带线性预测系数对所述全频带宽带激励信号进行合成滤波获取全频带的宽带语首?目号。
7.根据权利要求6所述的语音信号带宽扩展方法,其特征在于,所述步骤根据隐马尔科夫模型估计窄带语音信号的宽带谱包络参数具体包括如下步骤: 获取所述窄带语音信号的窄带特征矢量X ; 根据所述窄带特征矢量X和隐马尔科夫模型计算状态条件后验概率P (Si IX),其中,X为观察顺序集,Si为隐马尔科夫模型的状态; 从先验宽带矢量码本中获取第i个状态对应的宽带谱包络参数矢量Λ,i =1,2,- ,Ns, Ns为隐马尔科夫模型的状态数; 基于最小均方差的状态软判决准则、根据所述状态条件后验概率P (Si IX)和所述宽带
谱包络参数矢量-计算宽带线谱频率系数
8.根据权利要求7所述的语音信号带宽扩展方法,其特征在于,所述根据所述窄带特征矢量X和隐马尔科夫模型计算状态条件后验概率P(S1n) |X(m))的步骤具体包括如下步骤: 获取观察顺序集X (m), X (m) = {x(l), X (2),…,x (m)},其中为观察时刻,x (m)为第m时刻所观察到的窄带特征矢量,X(m)为观察到第m时刻时以前所有观察到的窄带特征矢量X的集合; 根据隐马尔科夫模型和贝叶斯定理计算所述状态条件后验概率P(S1n) |X(m))=P(x(m) Isi(IH)).(m), i = (I, 2,..., Ns),其中,Si(Hi)为在 m 时刻隐马尔科夫模型的状态,P(S1n) X(m))表示观察顺序为X(m)的条件下,在m时刻出现状态Si的概率,P (X (m) I Si (m))为隐马尔科夫模型的观察概率,(m) = P (Si (m),x (I),..., x (m_l)),(m)为状态Si (m)和m时刻过去状态观察特征矢量的联合先验概率密度。
9.根据权利要求7所述的语音信号带宽扩展方法,其特征在于,所述基于最小均方差的状态软判决准则为
10.根据权利要求6所述的语音信号带宽扩展方法,其特征在于,所述对所述频带受限的宽带激励信号进行激励扩展获取所述全频带宽带激励信号的步骤具体包括如下步骤: 对所述频带受限的宽带激励信号进行余弦频移调制获取所述频带受限的宽带激励信号的高频部分; 对所述频带受限的宽带激励信号的高频部分和所述频带受限的宽带激励信号进行加法运算获取所述全频带宽带激励信号。
11.根据权利要求10所述的语音信号带宽扩展方法,其特征在于,还包括对所述频带受限的宽带激励信号的高频部分进行高通滤波的步骤。
12.根据权利要求11所述的语音信号带宽扩展方法,其特征在于,还包括对进行加法运算的所述频带受限的宽带激励信号进行延迟的步骤,所述延迟与所述高通滤波产生的延迟保持一致 。
【文档编号】G10L19/04GK104036781SQ201310069828
【公开日】2014年9月10日 申请日期:2013年3月5日 优先权日:2013年3月5日
【发明者】张勇, 刘轶 申请人:深港产学研基地, 深港产学研基地产业发展中心