专利名称:修正音频信号的方法及装置的制作方法
技术领域:
本发明涉及通信技术领域,尤其涉及一种修正音频信号的方法及装置。
背景技术:
变换域编码是当今音频编码标准普遍采用的压缩技术之一,属于频域编 码,通过降低信号中各分量间的相关性,并对变换后的系数进行量化和编码, 以达到信息压缩的目的,充分利用人耳在频域上的听觉特性,如掩蔽效应和 临界频带,来实现对音频信号的压缩。在实际应用中,通常把音频信号分成
若干独立的#1据帧进4亍FFT( Fast Fourier Transform,快速1專立叶变4奐)或DCT (Discrete Cosine Transform,离散余弦变换),但是不能保证每一帧信号在边 缘是连续的,也不能保证信号能够连续延拓成周期信号序列,信号在数据块 边缘的跳变会使信号的能量谱发散而不集中,从而产生大量的高频信号;另 外,对FFT或DCT的系数进行量化编码,这样不可避免地产生量化误差,这 种量化所带来的误差在合成音频信号时被综合窗作用后放大许多倍,使合成 音频信号严重失真,即产生边界效应。
边界效应是由音频信号的数据帧间不连续造成的,使音频信号的自然度 和可懂度受到严重的影响,影响了编码器的效果,使音频质量严重下降;并 且使音频信号听起来带有明显的周期性的"嘟嘟"噪声,在频谱图上表现为出 现明显的间隔性的"噪声竖线"。
现有技术中,为了消除边界效应,通常采用MDCT (Modified Discrete Cosine,修正离散余弦变换)作为时频变换工具,利用50%的样点重叠和时域 混叠消除滤波器组,在不降低变换编码性能的情况下,克服FFT、 DCT处理 运算中的边界效应。相对于DCT而言,MDCT采取了 50%的数据重叠技术, 即当前数据块的前一半数据与其前相邻数据块的后一半数据重叠,而后一 半数据与其后相邻数据块的前一半数据重叠。
MDCT变换的正变换定义如下am
《+l
(2t + l);r, 、
^-M" + "o)
& = 0,1,..!-1 (1) 2
其中,w^^^是MDCT的相位变量。从MDCT定义可知,进行变换的 2
数据块长度iV必须为偶数,MDCT是用iV个音频时域样本变换得到^个频 样本。
MDCT变换的逆变换定义如下
y, (") = w, (")4 ("COS
W 71=0
(2A: + 1)tt
,^(u,』一 (2) 2
MDCT逆变换是用^%个频域信号样本计算iV个时域音频样本。 当信号样本被分成相对独立的数据帧后进行时频变换处理,在数据块的 边缘会发生畸变,解决这一有效的方法是在相邻数据帧间采取数据重叠技术。 通过上述可知,MDCT釆用50%的数据重叠,并且利用分析、综合窗w。(")、 ^W进一步减弱了数据帧间的不连续性。因此,MDCT—定程度上消减了边 界效应,改善了编码音频的可懂度,提高了编码质量。
然而,MDCT系数不可避免地产生量化误差,这种误差会影响帧间的连 续性,因此MDCT不能完全消除边界效应带来的影响,当信号变化比较剧烈, 特别是处理能量较强的音频信号后的边界效应尤为明显;并且在处理多声道 编码技术上,在解码端对能量进行重新分配会使各个声道不连续,出现更为 严重的边界效应。
发明内容
本发明实施例提供一种修正音频信号的方法及装置,能够有效消除边界
效应,
一种修正音频信号的方法,包括 在音频信号数据帧边界附近截取一段信号;
对截取的所述信号进行线性处理,得到新的信号;
计算所述新的信号的测评指标,当所述测评指标小于预置的测评指标时, 继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置 的测评指标。
一种修正音频信号的装置,包括
截取信号单元,用于在音频信号数据帧边界附近截取一段信号; 线性处理单元,用于对接收的信号进行线性处理,得到新的信号; 计算单元,用于计算所述新的信号的测评指标;
比较单元,用于从计算单元接收测评指标,比较所述测评指标与预置的 测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号 发送到线性处理单元,直到^l妄收的测评指标大于或等于所述预置的测评指标。
通过上述技术方案可知,由于音频信号的不连续发生在相邻数据帧边界 附近,因此在音频信号数据帧边界附近截取一段信号,对截取的所述信号进 行线性处理,用线性处理后的信号替换原来发生跳变或不连续的信号,并计 算经过线性处理后的新的信号的测评指标,当经过线性处理后的新的信号的 测评指标小于预置的测评指标时,继续进行线性处理,进一步降低相邻数据 帧边界附近信号的不连续性,直到线性处理后的信号的测评指标大于或等于 预置的测评指标,使得相邻数据帧边界附近的信号具有连续性,实现了消除 边界效应的目的。
图1为本发明实施例提供的方法流程图; 图2为本发明实施例提供的装置示意图; 图3为本发明实施例一提供的装置示意图; 图4为本发明实施例二提供的装置示意图; 图5为本发明实施例三提供的装置示意图6为本发明实施例四提供的装置示意图
图7为本发明实施例五提供的装置示意图 图8为本发明实施例六提供的装置示意图 图9为本发明实施例七提供的装置示意图 图IO为本发明实施例八提供的装置示意图。
具体实施例方式
本发明实施例提供了 一种修正音频信号的方法及装置,用于修正音频信 号相邻数据帧间的不连续性,使得修正后音频信号的波形平滑,进而实现消 除边界效应的目的,为了使本发明实施例的技术方案更清楚,详细,下面列 举实施例进行说明。
首先,对本发明实施例提供的方法进行总体描述。
参见图1,为本发明实施例提供的方法流程图
11) :在音频信号数据帧边界附近截取一段信号,例如,X点为信号l的 边界点,由于一般语语图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
12) :对截取的所述信号进行线性处理,得到新的音频信号;
13) :计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,判断所述测评指标小于预置的测评指标时,返回步骤12),继续进行线 性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标, 否则,结束线性处理。
其中,所述预置的测评指标为消除边界效应所对应的音频信号的信噪比、 频谱失真度、平均意见分。
实施例一
101:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的
边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;;
102:对截取的信号进行LP (Linear Prediction,线性预测)分析,得到预 测系数,然后利用公式s(")-fv("-/)进行线性预测,所得的预测值代替数 据帧边界附近的跳变值,得到'薪的音频信号;
其中,s'(n)代表预测值,p代表预测阶数,a;代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样 值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算 法求解线性预测系数。
103:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回102步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例中,对数据帧边界附近的音频信号通过LP计算得到相关性较大 的数据来代替原来相关性较小的不连续或跳变的数据,使音频信号具有连续 性。
实施例二
201:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
202:对截取的信号进行LP (LinearPrediction,线性预测)分析,得到预 测系数,然后利用公式〃")=^>^("-/)进行线性预测,所得的预测值代替数 据帧边界附近的跳变值,得到Sf的音频信号;
其中,s'(n)代表预测值,p代表预测阶数,*代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样 值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算 法求解线性预测系数。203:对新的音频信号的数据帧跳变前后的至少两个数据点取平均值,用 所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面 的任意一个点为基准点,或者平均值后面的任意一个点为基准点,进行线性 内插,用内插的数据取代原来相应位置的数据,进一步获得新的音频信号;
204:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回202步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
实施例二与实施例一相比,在对音频信号进行线性预测,消除畸变的基 础上,采用线性内插的方法,用线性内插的值取代原来相应位置的点,使得 音频信号具有连续性,进一步保证了音频信号的不连续性。
实施三
301:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
302:对截取的信号进行LP (Linear Prediction,线性预测)分析,得到预 测系数,然后利用公式s ( ) = ^>,^7-z')进行线性预测,所得的预测值代替数 据帧边界附近的跳变值,得到'lf的音频信号;
其中,s'(n)代表预测值,p代表预测阶数,a;代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样 值可以用过去若干个取样值的线性组合来逼近,比4交常用杜宾(Durbin)推算 法求解线性预测系数。
303:对所述新的音频信号进行快速傅立叶变换,将时域变成频域;截取 所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平 均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变 换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
304:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意
见分,当所述测评指标小于预置的测评指标时,返回302步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例二相比,将实施例二中线性内插的方法替换为频域平 滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效应的目的。
实施例四
401:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
402:对截取的信号进行LP (Linear Prediction,线性预测)分析,得到预 测系数,然后利用公式5(")=^>乂"-/)进行线性预测,所得的预测值代替数 据帧边界附近的跳变值,得到Sf的音频信号;
其中,s'(n)代表预测值,p代表预测阶数,a;代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样 值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算 法求解线性预测系数。
403:对新的音频信号的数据帧跳变前后的至少两个数据点取平均值,用 所述数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面 的任意一个点为基准点,或者平均值后面的任意一个点为基准点进行线性内 插,用内插的数据取代原来相应位置的数据,进一步获得新的音频信号;
404:对经过线性内插后获得的音频信号进行快速傅立叶变换,将时域变 成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均 值,用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快 速傅立叶逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换 之前的信号;
405:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回402步骤,继续进行线
性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例将实施例二和实施例三项结合,在对音频信号进行线性内插的 基础上,进一步采用频域平滑的方法修正频谱发散,使音频信号的频谱平滑, 达到消除边界效应的目的。
实施五
501:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
502:在截取的信号中从前向后截取一段信号设置为奇数标志,从后向前 截取一段信号设置为偶数标志,对奇数标志的信号和偶数标志的信号进行线 性预测获取奇数标志的信号的预测值和偶数标志的信号的预测值,并且对偶 数标志的信号的预测值再进行前后倒置,对奇数标志的信号的预测值,和经 过前后倒置的偶数标志的信号的预测值取平均值,用所述平均值代替数据帧 边界附近的跳变值;
503:对截取的信号进行LP (Linear Prediction,线性预测)分析,得到预 测系数,然后利用公式s (") = ^>,("-/)进行线性预测,所得的预测值代替数 据帧边界附近的跳变值,得到'lf的音频信号;
其中,s'(n)代表预测值,p代表预测阶数,ai代表预测系数;
其中,LP分析是最有效的语音分析技术之一,通过一个语音信号的抽样 值可以用过去若干个取样值的线性组合来逼近,比较常用杜宾(Durbin)推算 法求解线性预测系数。
504:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回502步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,在利用对数据帧边界附近的音频信号进行线 性预测中增加了奇偶标志的方法,保证线性预测的准确性,进而更好的修正
音频信号,使音频信号具有连续性。
其中,该实施例中的步骤502可分别位于实施例二中的202之前构成一 个实施例;位于实施例三中的302之前构成一个实施例;位于实施例四中的 402之前构成一个实施例,处理过程同实施例五。
实施例六
601:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语镨图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
602:对音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述 数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任 意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲 线上内插数据,用内插的数据取代原来相应位置的数据,获得新的音频信号;
603:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回602步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,将实施例一中的线性预测的方法,替换为线 性内插的方法,用线性内插的值取代原来相应位置的点,使得音频信号具有 连续性,并且在频域上修正了由于数据不连续造成的锯齿波。
实施例七
701:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
702:对音频信号的数据帧跳变前后的至少两个数据点取平均值,用所述 数据点和所述平均值作线性曲线;以平均值为基准点,或者平均值前面的任 意一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲 线上内插数据,用内插的数据取代原来相应位置的数据,获得经过线性内插
的音频信号;
703:对经过线性内插的音频信号进行快速傅立叶变换,将时域变成频域; 截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所 述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶 逆变换,得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信
704:计算新的音频信号的测评指标,如,信噪比、频谱失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回702步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例六相比,在对音频信号进行线性内插的基础上,进一 步采用频域平滑的方法修正频谱发散,使音频信号的频语平滑,达到消除边 界效应的目的。
实施例/v:
801:在音频信号数据帧边界附近截取一段信号;例如,X点为信号l的 边界点,由于一般语谱图的帧长为256点,则从X点开始分别向前截取128 点,向后截取128点,截取的256点组成一帧信号;
802:对接收的音频信号进行快速傅立叶变换,将时域变成频域;截取所 述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均 值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换, 得到新的音频信号,用所述新的信号代替快速傅立叶变换之前的信号;
803:计算新的音频信号的测评指标,如,信噪比、频语失真度、平均意 见分,当所述测评指标小于预置的测评指标时,返回802步骤,继续进行线 性预测,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
该实施例与实施例一相比,将通过线性预测消除畸变的方法替换为频域 平滑的方法修正频谱发散,使音频信号的频镨平滑,达到消除边界效应的目 的。
其中,上述各实施例中的步骤之间并无严格的时序关序,各标号只是代 表实现本发明实施例的过程。
下面参照附图,对本发明实施例提供的装置进行详细说明
参见图2,为本法实施例的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性处理单元202,用于对接收的信号进行线性处理,得到新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到线性处理单元202,直到接收的测评指标大于或等于所述预置的 测评指标。
上述是对本发明实施例提供的装置示意图的总体描述,下面分别列举实 施例进行详细描述
参见图3,为本发明实施例一提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到 新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频语失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的 测评指标。
16
其中,线性预测单元301,替换单元302,置于线性处理单元202中。
参见图4,为本发明实施例二提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到 新的信号。
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所 述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意 一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线 上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到线性线性预测单元301,直到接收的测评指标大于或等于所述预 置的测评指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元 402置于线性处理单元202中。
实施例二提供的示意图与实施例 一 提供的示意图相比,增加了绘制单元 401和线性内插单元402,用于对音频信号进行线性预测消除畸变的基础上, 进一步修正音频信号的不连续性。
参见图5,为本发明实施例三提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到
新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域 变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后 的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立 叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换 之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的 测评指标。
其中,线性预测单元301、替换单元302、傅立叶变换单元501、频域平 滑单元502、傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图与实施例二提供的装置示意图相比,将实施 例二中的绘制单元401和线性内插单元402替换为傅立叶变换单元501、频域 平滑单元502、傅立叶逆变换单元503,用于修正频谱发散,使音频信号的频 i普平滑,达到消除边界效应的目的。
参见图6,为本发明实施例四提供的装置示意图,包括
截取信号单元201 ,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到 新的信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所
述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意 一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线 上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域 变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后 的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立 叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换 之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的 测评指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元 402、傅立叶变换单元501、频域平滑单元502、傅立叶逆变换单元503置于 线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,增加了绘 制单元401、线性内插单元402、傅立叶变换单元501、频域平滑单元502和 傅立叶逆变换单元503,用于在对音频信号进行线性内插的基础上,进一步采 用频域平滑的方法修正频谱发散,使音频信号的频谱平滑,达到消除边界效 应的目的。
参见图7,为本发明实施例五提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
线性预测单元301,用于对接收的信号进行线性预测,获取预测值;
奇偶标志单元701,用于从截取信号单元201接收信号,对所述信号从前 向后截取一段信号设置为奇数标志,并发送到所述线性预测单元301,获取奇 数标志的信号的预测值;从后向前截取一段信号设置为偶数标志;
前后倒置单元702,用于从所述线性预测单元301接收到偶数标志的信号 的预测值时,进行前向倒置;
平均值单元703,用于接收所述奇数标志的信号的预测值,及经过前后倒 置的偶数标志的信号的预测值,并对所述奇数标志的信号的预测值和经过前 后倒置的偶数标志的信号的预测值取平均值,获得截取信号单元截取信号的 预测值。
替换单元302,用于将接收的预测值代替数据帧边界附近的跳变值,得到 新的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元接收测评指标,比较所述测评指标与预置 的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信 号发送到线性预测单元301,直到接收的测评指标大于或等于所述预置的测评 指标。
其中,线性预测单元301、替换单元302、绘制单元401、线性内插单元 402、奇偶标志单元701、前后倒置单元702、平均值单元703置于线性处理 单元202中。
其中,该实施例中提供的装置示意图中的奇偶标志单元701、前后倒置单 元702、平均值单元703可分别与实施例二提供的装置、施例三提供的装置、 实施例四提供的装置,进一步构成新的装置。
该实施例提供的装置示意图与实施例一提供的装置示意图相比,增加了
奇偶标志单元701、 前后倒置单元702、平均值单元703,用于保证线性预测 的准确性,进而更好的修正音频信号,使音频信号具有连续性。
参见图8,为本发明实施例六提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所 述数据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意 一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线 上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
计算单元203,用于计算所迷新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到绘制单元401,直到接收的测评指标大于或等于所述预置的测评 指标。
其中,绘制单元401、线性内插单元402置于线性处理单元202中。
该实施例提供的示意图与实施例一提供的示意图相比,将线性预测单元 301,替换单元302,替换为绘制单元401和线性内插单元402,用于修正音 频信号的不连续性。
参见图9,为本发明实施例七提供的装置示意图,包括
截取信号单元201,用于在音频信号数据帧边界附近截取一段信号;
绘制单元401,用于对数据帧跳变前后的至少两个数据点取平均值,用所 述it据点和所述平均值作线性曲线;
线性内插单元402,用于以所述平均值为基准点,或者平均值前面的任意 一个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线
上内插数据,用内插的数据取代原来相应位置的数据,获得新的信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域 变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后 的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立 叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换 之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到绘制单元401,直到接收的测评指标大于或等于所述预置的测评 指标。
其中,绘制单元401、线性内插单元402、傅立叶变换单元501、频域平 滑单元502和傅立叶逆变换单元503置于线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,将线性预 测单元301,替换单元302,替换为绘制单元401、线性内插单元402、傅立 叶变换单元501、频域平滑单元502和傅立叶逆变换单元503,用于在对音频 信号进行线性内插的基础上,进一步采用频域平滑的方法修正频谱发散,使 音频信号的频谱平滑,达到消除边界效应的目的。
参见图10,为本发明实施例八提供的装置示意图,包括
截取信号单元201 ,用于在音频信号数据帧边界附近截取一段信号;
傅立叶变换单元501,用于对所述新的信号进行快速傅立叶变换,将时域 变成频域;
频域平滑单元502,用于截取所述频域的高频部分,进行向前,或者向后
的错位相加求平均值,用所述平均值代替所述高频部分;
傅立叶逆变换单元503,用于对用平均值替代后的高频部分进行快速傅立
叶逆变换,得到新的信号,用傅立叶变换后的新的信号代替快速傅立叶变换
之前的信号;
计算单元203,用于计算所述新的信号的测评指标,如,信噪比、频谱失 真度、平均意见分;
比较单元204,用于从计算单元203接收测评指标,比较所述测评指标与 预置的测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新 的信号发送到傅立叶变换单元501,直到接收的测评指标大于或等于所述预置 的测评指标。
其中,傅立叶变换单元501、频域平滑单元502和傅立叶逆变换单元503 置于线性处理单元202中。
该实施例提供的装置示意图相比实施例一提供的装置示意图,将线性预 测单元301,替换单元302,替换为傅立叶变换单元501、频域平滑单元502 和傅立叶逆变换单元503,用于修正频谱发散,使音频信号的频谱平滑,达到 消除边界效应的目的。
以上实施例可以看出,由于音频信号的不连续发生在相邻数据帧的边界 附近,因此在音频信号数据帧边界附近截取一段信号,对截取的所述信号进 行线性处理,用线性处理后的信号替换原来的信号,并计算经过线性处理后 的新的信号的测评指标,当经过线性处理后的新的信号的测评指标小于预置 的测评指标时,继续进行线性处理,进一步修正边界附近的音频信号,直到 线性处理后的信号的测评指标大于或等于预置的测评指标,^使得相邻凄t据帧 边界附近的信号具有连续性,实现了消除边界效应的目的。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机 可读存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的 一种修正音频信号的方法及装置进行了详细介 绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方 式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本 发明的限制。
权利要求
1.一种修正音频信号的方法,其特征在于,包括在音频信号数据帧边界附近截取一段信号;对截取的所述信号进行线性处理,得到新的信号;计算所述新的信号的测评指标,当所述测评指标小于预置的测评指标时,继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。
2、 根据权利要求l所述的方法,其特征在于,所述对截取的所述信号进 行线性处理,包括对截取的信号进行线性预测,所得的预测值代替数据帧边界附近的跳变值。
3、 根据权利要求1所述的方法,其特征在于,所述对截取的所述信号进 行线性处理,包括对数据帧跳变前后的至少两个数据点取平均值,用所述数据点和所述平 均值作线性曲线;以平均值为基准点,或者平均值前面的任意一个点为基准点,或者平均 值后面的任意一个点为基准点,在所述线性曲线上内插数据,用内插的数据 取代原来相应位置的数据。
4、 根据权利要求1所述的方法,其特征在于,所述对截取的所述信号进 行线性处理,包括对所述信号进行快速傅立叶变换,将时域变成频域;截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值, 用所述平均值代替所述高频部分;对用平均值替代后的高频部分进行快速傅立叶逆变换,得到新的信号, 用所述新的信号代替快速傅立叶变换之前的信号。
5、 根据权利要求2所述的方法,其特征在于,所述对截取的所述信号进 行线性处理,包括在所述信号中从前向后截取一段信号设置为奇数标志,从后向前截取一 段信号设置为偶数标志;对奇数标志的信号和偶数标志的信号进行线性预测,获取奇数标志的信 号的预测值和偶数标志的信号的预测值,并对偶数标志的信号的预测值再进 4亍前后倒置;对所述奇数标志的信号的预测值,和经过前后倒置的偶数标志的信号的 预测值取平均值,用所述平均值代替数据帧边界附近的跳变值。
6、 根据权利要求1所述的方法,其特征在于,所述测评指标,包括 音频信号的信噪比、频谱失真度、平均意见分。
7、 一种修正音频信号的装置,其特征在于,包括 截取信号单元,用于在音频信号数据帧边界附近截取一段信号; 线性处理单元,用于对接收的信号进行线性处理,得到新的信号; 计算单元,用于计算所述新的信号的测评指标;比较单元,用于从计算单元接收测评指标,比较所述测评指标与预置的 测评指标的大小,当所述测评指标小于预置的测评指标时,将所述新的信号 发送到线性处理单元,直到接收的测评指标大于或等于所述预置的测评指标。
8、 根据权利要求7所述的装置,其特征在于,所述线性预测单元包括线性预测单元,用于对接收的信号进行线性预测,获取预测值;替换单元,用于将接收的预测值代替数据帧边界附近的跳变值,得到新 的信号。
9、 根据权利要求8所述的装置,其特征在于,所述装置进一步包括奇偶标志单元,用于从截取信号单元接收信号,对所述信号从前向后截 取一段信号设置为奇数标志,并发送到所述线性预测单元,获取奇数标志的 信号的预测值;从后向前截取一段信号设置为偶数标志;前后倒置单元,用于从所述线性预测单元接收到偶数标志的信号的预测值时,进行前后倒置;平均值单元,用于接收所述奇数标志的信号的预测值,及偶数标志的信 号的预测值,并对所述奇数标志的信号的预测值和经过前后倒置的偶数标志 的信号的预测值取平均值,获得截取信号单元截取信号的预测值。
10、 根据权利要求8所述的装置,其特征在于,所述装置进一步包括绘制单元,用于对数据帧跳变前后的至少两个数据点取平均值,用所述 数据点和所述平均值作线性曲线;线性内插单元,用于以所述平均值为基准点,或者平均值前面的任意一 个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上 内插数据,用内插的数据取代原来相应位置的数据。
11、 根据权利要求8所述的装置,其特征在于,所述装置进一步包括 傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的 错位相加求平均值,用所述平均值代替所述高频部分;傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶 逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
12、 根据权利要求7所述的装置,其特征在于,所述线性处理单元包括绘制单元,用于对数据帧跳变前后的至少两个数据点取平均值,用所述 数据点和所述平均值作线性曲线;线性内插单元,用于以所述平均值为基准点,或者平均值前面的任意一 个点为基准点,或者平均值后面的任意一个点为基准点,在所述线性曲线上 内插数据,用内插的数据取代原来相应位置的数据。
13、 根据权利要求12所述的装置,其特征在于,所述装置进一步包括 傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶 逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
14、根据权利要求7所述的装置,其特征在于,所述线性处理单元包括: 傅立叶变换单元,用于对所述信号进行快速傅立叶变换,将时域变成频域;频域平滑单元,用于截取所述频域的高频部分,进行向前,或者向后的错位相加求平均值,用所述平均值代替所述高频部分;傅立叶逆变换单元,用于对用平均值替代后的高频部分进行快速傅立叶 逆变换,得到新的信号,用所述新的信号代替快速傅立叶变换之前的信号。
全文摘要
本发明属于通信技术领域,本发明公开了一种修正音频信号的方法及装置。本发明方法包括在音频信号数据帧边界附近截取一段信号;对截取的所述信号进行线性处理,得到新的信号;计算该新的信号的测评指标,当计算所得的测评指标小于预置的测评指标时,继续进行线性处理,直到线性处理后的信号的测评指标大于或等于所述预置的测评指标。本发明具有以下效果计算量小,通过修正音频信号,使音频信号的时域波形变的平滑且有周期性;并且保证了信号的相位信息,减小了频谱发散,使频谱趋于平滑,进而消除边界效应。
文档编号G10L19/00GK101373594SQ200710145278
公开日2009年2月25日 申请日期2007年8月21日 优先权日2007年8月21日
发明者郭利斌 申请人:华为技术有限公司