带噪语音信号处理方法、装置及服务器的制造方法

文档序号:2826468阅读:239来源:国知局
带噪语音信号处理方法、装置及服务器的制造方法
【专利摘要】本发明公开了一种带噪语音信号处理方法、装置及服务器,属于通信【技术领域】。所述方法包括:根据带噪语音信号的静默段,获取该带噪语音信号中噪声信号;对于语音信号中的每一帧,根据该噪声信号和该带噪语音信号,获取该语音信号的每一帧的功率谱迭代因子;根据该带噪语音信号、该噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱;根据该语音信号每一帧的中间功率谱和噪声信号,计算该带噪语音信号中每一帧的信噪比;根据该带噪语音信号中每一帧的信噪比、该带噪语音信号和该噪声信号的每一帧,获取时域的处理后带噪语音信号。本发明通过功率谱迭代因子对带噪语音信号进行处理,提高了用户的听觉质量。
【专利说明】带噪语音信号处理方法、装置及服务器
【技术领域】
[0001]本发明涉及通信【技术领域】,特别涉及一种带噪语音信号处理方法、装置及服务器。【背景技术】
[0002]现实生活中的语音不可避免地要受到周围环境噪声的影响,为了改善听觉质量,需要对语音信号进行去噪处理。
[0003]在进行去噪处理时,通常采用基于短时幅度谱估计的算法,即在频域内,利用原始语音信号的功率谱和噪声信号的功率谱得到语音信号的功率谱,并根据语音信号的功率谱计算得到语音信号的幅度谱,通过傅里叶反变换得到时域的语音信号。
[0004]在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
[0005]对于信号的功率谱估计,通常的做法是采用固定迭代因子的迭代算法,该算法往往对于白噪声有效,不能及时跟踪语音或者噪声的变化,因此遇到有色噪声时性能急剧下降。

【发明内容】

[0006]为了解决现有技术的问题,本发明实施例提供了一种带噪语音信号处理方法、装置及服务器。所述技术方案如下:
[0007]第一方面,提供了一种带噪语音信号处理方法,所述方法包括:
[0008]根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号;
[0009]对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子;
[0010]对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱;
[0011]根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一中贞的信噪比;
[0012]根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
[0013]第二方面,提供了一种带噪语音信号处理装置,所述装置包括:
[0014]噪声信号获取模块,用于根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号;
[0015]功率谱迭代因子获取模块,用于对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子;
[0016]语音信号中间功率谱获取模块,用于对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱;[0017]信噪比获取模块,用于根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比;
[0018]带噪语音信号处理模块,用于根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
[0019]第三方面,提供了一种服务器,所述服务器包括:处理器和存储器,所述处理器与所述存储器相连接,
[0020]所述处理器,用于根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号;
[0021]所述处理器还用于对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子;
[0022]所述处理器还用于对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱;
[0023]所述处理器还用于根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比;
[0024]所述处理器还用于根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
[0025]本发明实施例提供的技术方案带来的有益效果是:
[0026]通过带噪语音信号和噪声信号确定功率谱迭代因子,基于功率谱迭代因子得到语音信号的中间功率谱,服务器能够通过功率谱迭代因子对带噪语音信号进行跟踪,使得每一帧带噪语音信号在相减前后频谱误差减小,从而提高增强后的语音信号信噪比,大大减少了语音信号中夹杂的噪声,提高了用户的听觉质量。
【专利附图】

【附图说明】
[0027]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]图1是本发明实施例提供的一种带噪语音信号处理方法流程图;
[0029]图2是本发明实施例提供的一种带噪语音信号处理方法流程图;
[0030]图3是本发明实施例提供的一种语音信号流转示意图;
[0031]图4是本发明实施例提供的一种带噪语音信号处理装置结构示意图;
[0032]图5是本发明实施例提供的一种服务器结构示意图。
【具体实施方式】
[0033]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0034]图1是本发明实施例提供的一种带噪语音信号处理方法流程图。参见图1,该实施例的执行主体为服务器,该方法包括:
[0035]101、根据带噪语音信号的静默段,获取该带噪语音信号中噪声信号,该带噪语音信号包括语音信号和噪声信号,该带噪语音信号为频域信号。
[0036]102、对于该语音信号中的每一帧,根据该噪声信号和该带噪语音信号,获取该语音信号的每一帧的功率谱迭代因子。
[0037]103、对于该语音信号中的每一帧,根据该带噪语音信号、该噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱。
[0038]104、根据该语音信号每一帧的中间功率谱和噪声信号,计算该带噪语音信号中每一中贞的信噪比。
[0039]105、根据该带噪语音信号中每一帧的信噪比、该带噪语音信号和该噪声信号的每一帧,获取时域的处理后带噪语音信号。
[0040]本发明实施例提供的方法,通过带噪语音信号和噪声信号确定功率谱迭代因子,基于功率谱迭代因子得到语音信号的中间功率谱,服务器能够通过功率谱迭代因子对带噪语音信号进行跟踪,使得每一帧带噪语音信号在相减前后频谱误差减小,从而提高增强后的语音信号信噪比,大大减少了语音信号中夹杂的噪声,提高了用户的听觉质量。
[0041]图2是本发明实施例提供的一种带噪语音信号处理方法流程图。参见图2,该实施例的执行主体为服务器,该方法流程包括:
[0042]201、服务器根据带噪语音信号的静默段,获取该带噪语音信号中噪声信号,该带噪语音信号包括语音信号和噪声信号,该带噪语音信号为频域信号。
[0043]在现实生活中,语音不可避免的会受到周围环境噪声的影响,因此原始语音信号中不仅包括语音信号,还包括了噪声信号,该原始语音信号为时域信号。该原始语音信号可以表示为 y (m, n) =x (m, n) +d(m, η),其中,m 为中贞号,且 m=l, 2, 3,..., n=0, I, 2,..., N_l, N 为帧长,x(m,n)为时域的语音信号,d(m,η)为时域的噪声信号。该服务器将该原始语音信号进行傅里叶变换,将该原始语音信号变换为频域信号,得到带噪语音信号,该带噪语音信号可以表示为¥(111,10=乂(111,10+0(111,10,其中,m为帧号,k为离散频率,X(m,k)为频域的语音信号,D(m,k)为频域的噪声信号。
[0044]该服务器用于对语音信号进行去噪处理,该服务器可以为即时通信应用的服务器、会议服务器等。
[0045]由于带噪语音信号中带有噪声信号,为了降低噪声信号对语音信号的影响,需要对带噪语音信号中噪声信号进行检测。步骤201具体为:服务器根据预设检测算法对带噪语音信号的静默段进行检测,得到带噪语音信号的静默段,服务器得到带噪语音信号的静默段之后,可以将该带噪语音信号静默段对应的帧确定噪声信号。其中,静默段是指带噪语音信号中语音信号有停顿的时间段。
[0046]其中,预设检测算法可以由技术人员在开发时设置,也可以由用户在使用的过程中调整,本发明实施例对此不做限定。该预设检测算法具体可以为语音活动检测算法等。
[0047]202、对于该语音信号中的第m帧,服务器根据该噪声信号和该带噪语音信号的第
m_l帧,计算该语首/[目号的第m-Ι帧的方差of ?
[0048]具体地,对于该语音信号中的第m帧,服务器将该噪声信号的第m-Ι帧D (m_l,k)的期望E{|D(m-l,k) I2}和该带噪语音信号的第m-Ι帧Y(m-l,k)的期望E{| Y(m_l,k) |2},
代入公式大
【权利要求】
1.一种带噪语音信号处理方法,其特征在于,所述方法包括: 根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号; 对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子; 对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱; 根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比; 根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
2.根据权利要求1所述的方法,其特征在于,对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子包括: 对于所述语音信号中的第m帧,根据所述噪声信号和所述带噪语音信号的第m-Ι帧,计算所述语音信号的第m-1帧的方差Crs2,所述语音信号的第m-1帧的方差
3.根据权利要求1所述的方法,其特征在于,对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱包括: 根据所述带噪语音信号、所述噪声信号的第m-Ι帧和所述语音信号的第m帧的功率谱迭代因子,利用公式
4.根据权利要求1所述的方法,其特征在于,根据所述带噪语音信号中每一帧的信噪t匕、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号包括: 根据所述带噪语音信号的第m帧的信噪比、所述带噪语音信号和所述噪声信号的第m帧以及所述噪声信号的第m帧的掩蔽阈值,计算所述带噪语音信号的第m帧的修正因子;根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧的修正因子,计算所述带噪语音信号的第m帧的传递函数; 根据所述带噪语音信号的第m帧的传递函数、所述带噪语音信号的第m帧的幅度谱,计算处理后带噪语音信号的第m帧的幅度谱; 以所述带噪语音信号的相位作为处理后带噪语音信号的相位,基于处理后带噪语音信号的第m帧的幅度谱进行傅里叶反变换,得到时域的处理后带噪语音信号的第m帧。
5.根据权利要求4所述的方法,其特征在于,根据所述带噪语音信号的第m帧的信噪t匕、所述带噪语音信号和所述噪声信号的第m帧以及所述噪声信号的第m帧的掩蔽阈值,计算所述带噪语音信号的第m帧的修正因子包括: 根据所述带噪语音信号和所述噪声信号的第m帧,计算所述噪声信号的第m帧的掩蔽阈值;根据所述带噪语音信号的第m帧的信噪比、所述带噪语音信号和所述噪声信号的第m帧以及所述噪声信号的第m帧的掩蔽阈值,利用不等式
6.根据权利要求4所述的方法,其特征在于,根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧的修正因子,计算所述带噪语音信号的第m帧的传递函数包括: 根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧的修正因子,利用公式
7.根据权利要求1所述的方法,其特征在于,根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比之后,所述方法还包括:对于所述语音信号的第m帧,根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧,计算所述语音信号的第m帧的功率谱; 基于所述语音信号的第m帧的功率谱,计算所述语音信号的第m+1帧的功率谱迭代因子。
8.根据权利要求1所述的方法,其特征在于,根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比包括: 根据所述噪声信号的第m-Ι帧和所述语音信号的第m帧的中间功率谱,利用公式
9.一种带噪语音信号处理装置,其特征在于,所述装置包括: 噪声信号获取模块,用于根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号; 功率谱迭代因子获取模块,用于对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子; 语音信号中间功率谱获取模块,用于对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱; 信噪比获取模块,用于根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比; 带噪语音信号处理模块,用于根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
10.根据权利要求9所述的装置,其特征在于,所述功率谱迭代因子获取模块还用于对于所述语音信号中的第m帧,根据所述噪声信号和所述带噪语音信号的第m-Ι帧,计算所述语音信号的第m-Ι帧的方差 <,所述语音信号的第m-Ι帧的方差
11.根据权利要求9所述的装置,其特征在于,所述语音信号中间功率谱获取模块还用于根据所述带噪语音信号、所述噪声信号的第m-Ι帧和所述语音信号的第m帧的功率谱迭代因子,利用公式
12.根据权利要求9所述的装置,其特征在于,所述带噪语音信号处理模块包括:修正因子获取单元,用于根据所述带噪语音信号的第m帧的信噪比、所述带噪语音信号和所述噪声信号的第m帧以及所述噪声信号的第m帧的掩蔽阈值,计算所述带噪语音信号的第m帧的修正因子; 传递函数获取单元,用于根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧的修正因子,计算所述带噪语音信号的第m帧的传递函数; 幅度谱获取单元,用于根据所述带噪语音信号的第m帧的传递函数、所述带噪语音信号的第m帧的幅度谱,计算处理后带噪语音信号的第m帧的幅度谱; 带噪语音信号处理单元,用于以所述带噪语音信号的相位作为处理后带噪语音信号的相位,基于处理后带噪语音信号的第m帧的幅度谱进行傅里叶反变换,得到时域的处理后带噪语音信号的第m帧。
13.根据权利要求12所述的装置,其特征在于,所述修正因子获取单元还用于根据所述带噪语音信号和所述噪声信号的第m帧,计算所述噪声信号的第m帧的掩蔽阈值;根据所述带噪语音信号的第m帧的信噪比、所述带噪语音信号和所述噪声信号的第m帧以及所述噪声信号的第m帧的掩蔽阈值,利用不等式
14.根据权利要求12所述的装置,其特征在于,所述传递函数获取单元还用于根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧的修正因子,利用公式
15.根据权利要求9所述的装置,其特征在于,所述装置还包括: 语音信号功率谱获取模块,用于对于所述语音信号的第m帧,根据所述带噪语音信号的第m帧的信噪比和所述带噪语音信号的第m帧,计算所述语音信号的第m帧的功率谱;所述功率谱迭代因子获取单元还用于基于所述语音信号的第m帧的功率谱,计算所述语音信号的第m+1帧的功率谱迭代因子。
16.根据权利要求9所述的装置,其特征在于,所述信噪比获取模块还用于根据所述噪声信号的第m-ι帧和所述语音信号的第m帧的中间功率谱,利用公式
17.一种服务器,其特征在于,所述服务器包括:处理器和存储器,所述处理器与所述存储器相连接, 所述处理器,用于根据带噪语音信号的静默段,获取所述带噪语音信号中噪声信号,所述带噪语音信号包括语音信号和噪声信号,所述带噪语音信号为频域信号; 所述处理器还用于对于所述语音信号中的每一帧,根据所述噪声信号和所述带噪语音信号,获取所述语音信号的每一帧的功率谱迭代因子; 所述处理器还用于对于所述语音信号中的每一帧,根据所述带噪语音信号、所述噪声信号的每一帧和上一帧的功率谱迭代因子,计算语音信号每一帧的中间功率谱;所述处理器还用于根据所述语音信号每一帧的中间功率谱和噪声信号,计算所述带噪语音信号中每一帧的信噪比; 所述处理器还用于根据所述带噪语音信号中每一帧的信噪比、所述带噪语音信号和所述噪声信号的每一帧,获取时域的处理后带噪语音信号。
【文档编号】G10L21/0232GK103632677SQ201310616654
【公开日】2014年3月12日 申请日期:2013年11月27日 优先权日:2013年11月27日
【发明者】陈国明, 彭远疆, 莫贤志 申请人:腾讯科技(成都)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1