谐波信号基频估计算法及装置的制造方法
【技术领域】
[0001 ]本发明属于信号处理领域,涉及一种谐波信号基频估计算法。
【背景技术】
[0002] 目前常用的基频估计算法包括自相关法、倒谱法、小波变换法、谐波求和法等。自 相关法具有原理简单、易于实现的优点,但其计算量随着每帧信号长度成平方倍增。倒谱法 在语音切换时,由于信噪比减小常导致倒谱峰严重偏离基频。小波变换法通过检测声门闭 合时信号特征突变推算出基因周期,但小波变换中的多个阈值难以准确选择。谐波求和方 法仅考虑到各次谐波幅度加权求和,而没有考虑到各次谐波频率可能会稍微偏离谐波整数 倍,频谱泄露现象导致高频范围内信号的伪峰数量增加,及部分高频分量会被低频分量的 旁瓣掩埋。
[0003]
【发明内容】
[0004] 为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,本发明 提出了一种谐波信号基频估计算法,以提高基频提取的速度和准确性。
[0005] 为了实现上述目的,本发明采用的技术方案是:一种谐波信号基频估计算法,包 括:S1.对音频谐波信号作常Q变换,得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和 谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数,根 据最大后验概率准则提取并输出谐波信号基频。
[0006] 有益效果:本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估 计,基于常Q变换谱定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法 实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与观测频谱的 匹配度确定。
[0007]音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号 处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有 谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求 和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能 量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
【附图说明】
[0008]图1是实施例10中的一帧音乐信号图不;
[0009] 图2是实施例10中的音乐信号的常Q变换谱;
[0010] 图3是实施例10中的折叠谐波求和谱;
[0011] 图4是实施例10中的基频后验概率密度谱;
[0012] 图5是实施例11中的时域信号图示;
[0013]图6是实施例11中的常Q变换谱;
[0014] 图7是实施例11中的折叠谐波求和谱;
[0015] 图8是实施例11中的基频后验概率密度谱;
[0016] 图9是本发明所述方法的软件流程图。
【具体实施方式】
[0017] 实施例1: 一种谐波信号基频估计算法,包括步骤:
[0018] S1.对音频谐波信号作常Q变换,得常Q变换谱;
[0019] S2.使用常Q变换谱计算得折叠谐波求和谱;
[0020] S3.由折叠谐波求和谱的谱峰初步筛选基频;
[0021] S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波 信号基频。
[0022] 本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐 波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基 频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与频谱的匹配度确定。
[0023] 音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号 处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有 谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求 和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能 量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
[0024] 实施例2:具有与实施例1相同的技术方案,更为具体的,常Q变换前,可以先对音频 谐波信号进行分频,加窗处理。
[0025] 在所述步骤S1中,先对输入的非平稳音频谐波信号作分帧处理,然后给短时分帧 信号加汉宁窗抑制旁瓣幅度,窗口长度与常Q变换的时间窗宽度一致。
[0026] 实施例3:具有与实施例1或2相同的技术方案,更为具体的,所述步骤S3中,筛选规 则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频,本实施例选择 前3个极大值作为候选基频,实验中,候选基频数量增加,可以提高准确度,而选取3个,其准 确度已经非常高。
[0027] 实施例4:具有与实施例1或2或3相同的技术方案,更为具体的,步骤S1中,是根据 人耳听觉特性,计算对数频率域常Q变换谱,该常Q变换谱为:
[0029] (1)式中,Q是品质因子,其为常数,N[ k ]为常Q变换在第k个频点对应的时间窗宽 度,(1)式中,x(l,m)表不第1帧信号中的序号为m的米样点;设χι(η),n = 0,1,· · . ·Μ-1表不 长度为Μ,采样率SFs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L, 则第1帧信号可以表示为:
[0030] x( 1 ,m) =xi(m+lL) ,m=0,l,. . .N[k]-1 (2)
[0031 ] (1)式中,WN[k](m)表不长度为N[k]的汉宁窗,即:
[0033]实施例5:具有与实施例1或2或3或4相同的技术方案,更为具体的,折叠谐波求和 谱定义为:
[0035]其中:h为谐波次数,Η为最高次谐波,0<a<l,XQ(k,l)为常Q变换谱,round( ·)运 算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最
1其中ceil( ·)运算结果等于正无穷方 向最近的整数,常Q变换的第k个频率点对应的频率为:
[0037]实施例6:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,基频后验概 率密度定义为:
[0039] 其中:Fi,i为第1帧的第i个基频候选,上式中p(Fi,i)为第1帧第i个基频Fi,i的先验 概率,定义?的,1)=乂。的,1,1);上式中?〇。出,1)旧,1)量测给定基频?^1得到观测常诚页谱 的概率。
[0040] 实施例7:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,定义:
[0045] (8)式中β = 0.03,若常Q谱中基频候选Fi,i的第h次谐波是谱峰则γ i(h,Fi,i)为1,
表征第1帧常Q谱中所包含的前Η次谐波分量的数量。类似地,若X Q
(k,l)是谱峰则心(1〇为1,否则为0 表征第1帧常Q谱中F1;1的前Η次谐波 频率范围内的所有谱峰数。
[0046] 折叠谐波求和谱是基频及各次谐波分量的归一化加权和,设基频为Fo,则折叠谐 波求和谱在Fo位置处的函数值为常Q变换在F Q,2FQ,3F(),. . .,HF〇等处幅度的归一化加权和; 折叠谐波求和谱在2F〇位置处的函数值为常Q变换在2FQ,4F Q,6F(),. . .,2HF〇等处幅度的归一 化加权和。日常语音、音乐等信号主要能量集中在低频段,故即使常Q变换基频幅度小于二 次谐波幅度,其折叠谐波求和谱也能在基频位置处得到较大输出。由折叠谐波求和谱中的 前几个峰值得到基频候选,能够实现基频的初步筛选。
[0047] 最大后验概率密度函数中的第一项定义为?$1,1)=乂。卬1, 1,1),即折叠谐波求和 谱在F1;1处的幅度,p(F1;1)取折叠谐波求和谱而非常Q变换谱是因为有时候某些谐波分量的 幅度会超过基频的幅度,而即使谐波幅度高于基频幅度的时候,折叠谐波求和谱在基频位 置处的值仍大于高次谐波处的值,进而提高基频估计的准确率,降低误判率。
[0048] 实施例8:具有与实施例1或2或3或4或5或6或7相同的技术方案,更为具体的,基频 估计公式为:
[0050]实施例9: 一种谐波信号基频估计算法,包括如下步骤:
[0051 ] 1.对音频谐波信号作常Q变换,得常Q变换谱,该常Q变换谱为:
[0053] (1)式中,Q是品质因子,其为常数,N[ k ]为常Q变换在第k个频点对应的时间窗宽 度,(1)式中,x(l,m)表不第1帧信号中的序号为m的米样点;设χι(η),n = 0,