专利名称:一种获取基音周期的方法和装置的制作方法
技术领域:
本发明涉及信号处理领域,尤其涉及一种获取基音周期的方法和装置。
背景技术:
基音是指发浊音时声带震动所引起的周期性,基音周期为声带振动频率 的倒数。基音周期在语音信号处理中一直是一个很重要的参数,基音周期的 检测无论在语音信号的合成、编码还是识别方面,都起着非常重要的作用。
尽管目前已经对语音信号的基音周期检测方面作了大量的研究工作,但 是语音信号固有的特点使得语音信号的基音检测仍是语音信号处理中最困难 的问题之一。
现有技术中基音检测的一种常用方法是基于自相关的检测技术,以下结
合图1描述利用自相关检测基音周期的方法。假定基音的周期为T,则首先设 定滑动窗的窗长为W, W的选择一定不能小于T。在通话中,基音周期的长 度一般为4 ~ 10ms,因此滑动窗的窗长一般选择10 ~ 12ms即可。 这里定义自相关函数为
其中,k表示滑动窗向左滑动的距离。如果该信号是个浊音,则它会具有 周期T,也就是我们要求的基音周期T。那么有
x(m) = x(附+ r)
则有
<formula>formula see original document page 5</formula>因此如果x(m)是一个周期信号的话,那么自相关函数i (&)具有和x(m) — 样的周期特性。如果这段信号是个浊音信号(具有周期性)的话,那么/ ("的 值就比较大,会具有峰值并具有周期性;而清音(不具有周期性)的i (A:)值
就表现出杂乱无章,没有什么规律。根据自相关系数的这个特性,就可以得 出基音周期。
使用自相关方法检测基音周期的缺陷在于其准确性不是很高,尤其在 外界存在干扰时容易发生误判。
发明内容
本发明的实施例提供一种获取基音周期的方法和装置,以实现对语音信 号基音周期的准确获取。
为达到上述目的,本发明的实施例提供一种获取基音周期的方法,包括 以下步骤
获取初始位置语音信号和其他一个或多个位置语音信号的相位; 根据所述相位,获取所述初始位置语音信号的相位与所述其他位置语音
信号的相位的相似程度;
根据所述相位的相似程度获取基音周期。 本发明的实施例还提供一种获取基音周期的装置,包括 相位获取模块,用于获取语音信号中初始位置和其他位置的相位,并将
所述相位通知给相位相似程度获取模块;
相位相似程度获取模块,用于根据所述相位获取模块通知的相位,获取
所述初始位置相位与其他位置相位的相似程度,并将所述相似程度通知基音
周期获^^莫块;
基音周期获取模块,用于根据所述相位相似程度获取模块的通知获取基 音周期。
与现有技术相比,本发明的实施例具有以下优点 基于语音信号的相位相似性进行基音检测,获取到的基音周期具有较高 的准确性,且实现简单。
图1是现有技术中通过自相关检测基音周期的方法的示意图2是本发明的实施例一中获取基音周期的方法的流程图3是本发明的实施例二中获取基音周期的方法的流程图4是本发明的实施例二中获取语音信号相位的流程图5是本发明的实施例二中获取相位相似程度的流程图6是本发明的实施例二中根据相位相似程度获取基音周期的流程图7是本发明的实施例二中另一根据相位相似程度获取基音周期的流程
图8是本发明实施例中的各个位置相位差绝对值的和的波形图; 图9是本发明实施例中的一种获取基音周期的装置图; 图10是本发明实施例中的一种基音周期获取模块的装置图; 图11是本发明实施例中的另 一种基音周期获取模块的装置图。
具体实施例方式
下面结合附图和实施例,对本发明的具体实施方式
作进一步详细描述 本发明实施例一中, 一种获耳又基音周期的方法的流程如图2所示,包括以 下步骤
步骤s201、对于一个语音信号,获取初始位置语音信号的相位。 步骤s202、获取其他位置语音信号的相位。
步骤s203、获取其他位置语音信号的相位与初始位置语音信号的相位的相 似度。
步骤s204、根据相位的相似程度获取基音周期。
本发明实施例二中,结合一个具体的语音信号, 一种获取基音周期的方 法流程如图3所示,包括以下步骤
步骤s301、对于一个语音信号,获取初始位置尸(O)处语音信号的相位。 本实施例中以P(O)表示初始位置。
步骤s302、获取其他位置尸(l), P(2)…尸(A0处语音信号的相位。 本实施例中以尸(l),尸(2)…尸(A0表示其他位置,其中位置尸(O),尸(l), 户(2)...尸(>0之间可以是连续的,也可以中间间隔若干个样点,为了减小计算
量,尸(0)和尸(1)之间的距离最好等于一个预设的最小基音周期,尸(0)和尸(7V) 之间的距离最好等于一个预设的最大基音周期。其中,该预设的最大、最小 基音周期可以根据人声音频率的范围来决定, 一般人声音的频率为50-500赫 兹,因此预设的最小基音周期可以为2ms,最大基音周期可以为20ms。假设采 样频率为10kHz,即每lms采10个样点,将初始位置尸(0)与P(1)之间的距离设 置为20个样点,即最小基音周期2ms;将初始位置户(O)与尸(7V)之间的距离设 置为200个样点,即最大基音周期20ms。假定户(0)的位置为第1000个样点,则 尸(l), P(2)…户(A0的位置可取为第1020,…,1200个样点。
步骤s303 、获取初始位置尸(O)处语音信号的相位与位置尸(l), P(2)...户(iV)处语音信号的相位的相似程度S(l), S(2)... 。
步骤s304、根据相位的相似程度获取基音周期。
图3中的步骤s301和s302可以按照图4所示的方法获取相位,包括以下步
骤
步骤s401、在需要获取相位的位置选择一段语音信号进行力。窗,窗的类型 可以是矩形窗、汉明窗、三角窗等,优选为矩形窗。
步骤402、对加窗的语音信号进行傅立叶变换,变换之后的频域参数包括 幅度信息和相位信息。
步骤401和402可以用下面公式表示
<formula>formula see original document page 8</formula>式(1 )中x(m)是语音时域信号,wO)是在区间
之外为零的分析 窗,n是需要获取相位的时域位置,X(",A)是傅立叶变换之后的频域信号,k
是离散的频率点,取值范围为O,l..丄-l,和角频率对应的关系为0 =——
丄
L为窗的长度。
义(",Q是复数值,可以用幅度和相位的形式表示<formula>formula see original document page 8</formula>
式(2)中4a是第k个频率点的幅度值,、&是第k个频率点的相位。 因此在时域位置n处获取的和各个频率点对应的相位包括 j , ,2 ... ,n 。
对于图3中的步骤s303,可以用图5所示的方法获取相位相似程度,包 括以下步骤
步骤s501、对于每个位置P(l),尸(2)…P(A0,获取各位置下各个频率点 的相位和初始位置户(O)各对应频率点的相位的差值。
步骤s502、对于每个位置,获取该位置各个频率点和初始位置各个频率 点的上述相位差值的绝对值的和。
步骤s503、取每个位置相位差值的绝对值的和的倒数,作为该位置的相 位与初始位置的相位的相似程度S(l) , S(2) ...S(AO 。
上述步骤s501 ~ s503可以用下面7〉式来表示
——^- (3)
S l- 6尸(0),yt
根据前面所述,可以知道在某个时域位置获取的相位共有L个,且和各 个频率点对应,由于高频部分相位变化较大,且容易受到噪声影响,因此在 获取相似性时,通常只取部分频率范围内的相位差, 一个优选方案是^^50-500Hz范围的相位差。在公式(3)中,KL是用于获取相位差的最低频率点, KH是最高频率点,例如,根据经验,如果语音信号的采样频率为32kHz,窗 长取为512,则4艮据经^验值,KL可耳又为l, KH可取为7。
对于图3中的步骤s304,可以用图6所示的方法获取基音周期,步骤如
下
步骤s601、令最大的相位相似程度S'等于5"(1),相应的位置尸'等于尸(l)。 步骤s602、令k等于2。
步骤s603、判断S(k)是否大于S',如果是,则执行步骤s604,否则跳转 到步骤s605。
步骤s604、令S'等于S(A:),尸'等于 步骤s605、对k进行累加,即^: = & + 1。
步骤s606、判断A:是否大于W,如果是则执行步骤s607,否则跳转到步
骤s603。
步骤s607、获取尸'与P(O)的差的绝对值,即得到基音周期。 对于图3中的步骤s304,也可以用图7所示的另外一种实现方式获取基 音周期,步骤如下
步骤s701 、设置相位相似度门限S丄。 步骤s702、令6等于1。
步骤s703、判断S("是否大于5Z,如果是则执行步骤s704,否则执行步 骤s705。
步骤s704、获取户(A)与尸(O)的差的绝对值,即是所求基音周期。获取完 周期之后,则退出获取基音周期的流程,即结束步骤s304。 步骤s705、对k进行累加,即A:-A: + 1。
步骤s706、判断A是否大于W,如果是则退出获取基音周期的流程,即 结束步骤s304;如果否则跳转到步骤s703。
在图8中,上部是语音波形图,采样率为32khz,中间是采样本发明方案 获取的每个位置相位差值的绝对值的和,窗长取的是512,用于获取相位差的 频率点的范围为1至7;图的下部是相应的相位相似程度,用图6或图7的方 法可以方便的检测出基音周期为276个样点。
通过使用上述实施例提供的获取基音周期的方法,基于语音信号频域相 位相似性进行基音检测,获取到的基音周期具有较高的准确性,且实现简单。
本发明实施例的一种获取基音周期的装置如图9所示,该装置包括相位 获取模块10、相位相似程度获取模块20和基音周期获取模块30。其中相位 相似程度获取模块20分别与相位获取模块10以及基音周期获取模块30连接。
具体的,相位获取模块IO用于获取一语音信号各位置的相位,然后通知 给相位相似程度获取模块20。其进一步包括加窗子模块11和变换子模块12, 其中加窗子模块11用于在需要获取相位的位置选择一段语音信号进行加窗, 窗的类型可以是矩形窗、汉明窗、三角窗等,优选为矩形窗。变换子模块12 用于对加窗子模块11加窗的语音信号进行傅立叶变换,变换之后的参数包括 幅度信息和相位信息。
相位相似程度获取模块20用于获取初始位置相位与其他位置相位的相似 程度,然后把获取结果通知给基音周期获取模块30。
基音周期获取模块30根据相位相似程度获取模块20的通知获取基音周期。
具体的,基音周期获取模块30可以进一步包括判断子模块31和处理子 模块32,如图10所示,其中判断子模块31用于获取最大的相位相似程度, 获取的具体过程为依次比较各个位置的相位相似程度,直到得出最大值;进 一步获取最大值所对应的位置并通知处理子模块32。处理子模块32通过获取 所述最大值的位置与初始位置的差的绝对值来获取基音周期。
具体的,基音周期获取模块30也可以进一步包括门限设置子模块33、比 较子模块34和获取子模块35,如图11所示,其中门限设置子模块33用于设 置一个相位相似度门限,该门限设置的标准参考上述预设的最大最小基音周 期。比较子模块34用于比较各个位置的相位相似度与门限设置子模块33设 置的门限的大小,获取最大的相位相似程度并通知给获取子模块35,获取子 模块35通过获取比较子模块34发送最大值的位置与初始位置的差的绝对值 来获取基音周期。
通过使用上述实施例提供的获取基音周期的装置,基于语音信号频域相 位相似性进行基音检测,获取到的基音周期具有较高的准确性,且实现简单。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发 明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件, 但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案 本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来, 该获取机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备 执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此, 任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
权利要求
1、一种获取基音周期的方法,其特征在于,包括以下步骤:获取初始位置语音信号和其他一个或多个位置语音信号的相位;根据所述相位,获取所述初始位置语音信号的相位与所述其他位置语音信号的相位的相似程度;根据所述相位的相似程度获取基音周期。
2、 如权利要求1所述获取基音周期的方法,其特征在于,所述获取初始 位置语音信号和其他一个或多个位置语音信号的相位之前还包括确定所述初始位置和所述其他位置;
3、 如权利要求2所述获取基音周期的方法,其特征在于,所述其他位置 的确定方法为确定与所述初始位置的距离等于一个预"i殳的最小基音周期的位置为第一 个位置,与所述初始位置的距离等于一个预设的最大基音周期的位置为最后 一个位置,其余位置分布在所述第一个位置和最后一个位置之间。
4、 如权利要求1所述获取基音周期的方法,其特征在于,所述获取初始 位置语音信号和其他位置语音信号的相位的步骤具体为对需要获取相位位置的语音信号进行加窗;对所述加窗的语音信号进行傅立叶变换;根据所述傅立叶变换的结果获取所述位置的语音信号的相位。
5、 如权利要求1所述获取基音周期的方法,其特征在于,所述获取初始 位置语音信号的相位与其他位置语音信号的相位的相似程度的步骤具体包 括对于其他位置,获取所述初始位置语音信号的相位与所述其他位置语音 信号的相位差值;对于其他位置,获取所述相位差值的绝对值的和;对于其他位置,根据所述绝对值的和获取所述初始位置语音信号的相位 与所述其他位置语音信号的相位的相似程度。
6、 如权利要求1或5所述获取基音周期的方法,其特征在于,所述根据 相位的相似程度获取基音周期的步骤具体包括 获取所述初始位置语音信号的相位与各其他位置语音信号的相位的相似程度中的最大相位相似程度;获取所述最大相位相似程度的对应位置; 获取所述对应位置与所述初始位置差的绝对值为基音周期。
7、 如权利要求1或5所述获取基音周期的方法,其特征在于,所述根据 相位的相似程度获取基音周期的步骤具体包括设定相位相似度门限值;将所述初始位置语音信号的相位与其他位置语音信号的相位的相似程度 与所述相位相似度门限值依次进行比较;获取第一次大于所述相位相似度门限值的相似程度所对应的位置; 获取所述位置与所述初始位置差的绝对值为基音周期。
8、 一种获取基音周期的装置,其特征在于,包括相位获取模块,用于获取^语音信号中初始位置和其他位置的相位,并将 所述相位通知给相位相似程度获取模块;相位相似程度获取模块,用于根据所述相位获取模块通知的相位,获取 所述初始位置相位与其他位置相位的相似程度,并将所述相似程度通知基音 周期获取模块;基音周期获取模块,用于根据所述相位相似程度获取模块的通知获取基 音周期。
9、 如权利要求8所述,其特征在于,所述相位获取模块进一步包括 加窗子模块,用于对需要获取相位位置的语音信号进行加窗; 变换子模块,用于对所述加窗子模块加窗后的语音信号进行傅立叶变换,所述变换之后的参数包括相位信息。
10、 如权利要求8所述,其特征在于,所述基音周期获取模块进一步包括判断子模块,用于获取最大的相位相似程度,进一步获取所述最大相位 相似程度对应的位置;处理子模块,用于根据所述判断子模块获取的所述最大相位相似程度的位置与初始位置的差的绝对值,获取基音周期。
11、如权利要求8所述,其特征在于,所述基音周期获取模块进一步包括门限设置子模块,用于设置相位相似度门限;比较子模块,用于比较各其他位置的相位相似度与所述门限设置子模块 设置的门限的大小,获取第一个大于所述相位相似度门限的相位相似程度, 以及所述相位相似程度所对应的位置;获取子模块,用于根据所述比较子模块获取的所述最大相位相似程度的 位置与初始位置的差的绝对值来获取基音周期。
全文摘要
本发明公开了一种获取基音周期的方法,包括以下步骤获取初始位置语音信号和其他一个或多个位置语音信号的相位;根据所述相位,获取所述初始位置语音信号的相位与所述其他位置语音信号的相位的相似程度;根据所述相位的相似程度获取基音周期。本发明还提供一种获取基音周期的装置。通过使用本发明,基于语音信号频域相位相似性进行基音检测,获取到的基音周期具有较高的准确性,且实现简单。
文档编号G10L21/00GK101383148SQ20071014603
公开日2009年3月11日 申请日期2007年9月7日 优先权日2007年9月7日
发明者詹五洲 申请人:深圳华为通信技术有限公司