谐波信号基频估计算法及装置的制造方法

文档序号：9788623阅读：845来源：国知局

谐波信号基频估计算法及装置的制造方法
【技术领域】
[0001 ]本发明属于信号处理领域，涉及一种谐波信号基频估计算法。
【背景技术】
[0002] 目前常用的基频估计算法包括自相关法、倒谱法、小波变换法、谐波求和法等。自相关法具有原理简单、易于实现的优点，但其计算量随着每帧信号长度成平方倍增。倒谱法在语音切换时，由于信噪比减小常导致倒谱峰严重偏离基频。小波变换法通过检测声门闭合时信号特征突变推算出基因周期，但小波变换中的多个阈值难以准确选择。谐波求和方法仅考虑到各次谐波幅度加权求和，而没有考虑到各次谐波频率可能会稍微偏离谐波整数倍，频谱泄露现象导致高频范围内信号的伪峰数量增加，及部分高频分量会被低频分量的旁瓣掩埋。
[0003]

【发明内容】

[0004] 为了解决快速、准确提取基频，并减少频谱泄露对高频谱峰的影响的问题，本发明提出了一种谐波信号基频估计算法，以提高基频提取的速度和准确性。
[0005] 为了实现上述目的，本发明采用的技术方案是：一种谐波信号基频估计算法，包括:S1.对音频谐波信号作常Q变换，得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数，根据最大后验概率准则提取并输出谐波信号基频。
[0006] 有益效果:本发明所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于常Q变换谱定义折叠谐波求和谱，并将其用于初步基频筛选。通过最大后验概率法实现基频估计，其中先验概率由折叠谐波求和谱求出，似然函数由谐波谱峰与观测频谱的匹配度确定。
[0007]音频谐波信号基频估计是信号处理领域的一项关键技术，在语音识别、音乐信号处理、水声信号处理等方面具有重要作用，本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中，提出的方法能够实现频谱多分辨率分析，提出折叠谐波求和谱作为基频的初步筛选，采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息，实现基频估计，具有运算速度快，参数少，鲁棒性强的特点。
【附图说明】
[0008]图1是实施例10中的一帧音乐信号图不；
[0009] 图2是实施例10中的音乐信号的常Q变换谱；
[0010] 图3是实施例10中的折叠谐波求和谱；
[0011] 图4是实施例10中的基频后验概率密度谱；
[0012] 图5是实施例11中的时域信号图示；
[0013]图6是实施例11中的常Q变换谱；
[0014] 图7是实施例11中的折叠谐波求和谱；
[0015] 图8是实施例11中的基频后验概率密度谱；
[0016] 图9是本发明所述方法的软件流程图。
【具体实施方式】
[0017] 实施例1: 一种谐波信号基频估计算法，包括步骤：
[0018] S1.对音频谐波信号作常Q变换，得常Q变换谱；
[0019] S2.使用常Q变换谱计算得折叠谐波求和谱；
[0020] S3.由折叠谐波求和谱的谱峰初步筛选基频；
[0021] S4.建立基频候选的后验概率密度函数，根据最大后验概率准则提取并输出谐波信号基频。
[0022] 本发明所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于谐波求和能量定义折叠谐波求和谱，并将其用于初步基频筛选。通过最大后验概率法实现基频估计，其中先验概率由折叠谐波求和谱求出，似然函数由谐波谱峰与频谱的匹配度确定。
[0023] 音频谐波信号基频估计是信号处理领域的一项关键技术，在语音识别、音乐信号处理、水声信号处理等方面具有重要作用，本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中，提出的方法能够实现频谱多分辨率分析，提出折叠谐波求和谱作为基频的初步筛选，采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息，实现基频估计，具有运算速度快，参数少，鲁棒性强的特点。
[0024] 实施例2:具有与实施例1相同的技术方案，更为具体的，常Q变换前，可以先对音频谐波信号进行分频，加窗处理。
[0025] 在所述步骤S1中，先对输入的非平稳音频谐波信号作分帧处理，然后给短时分帧信号加汉宁窗抑制旁瓣幅度，窗口长度与常Q变换的时间窗宽度一致。
[0026] 实施例3:具有与实施例1或2相同的技术方案，更为具体的，所述步骤S3中，筛选规则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频，本实施例选择前3个极大值作为候选基频，实验中，候选基频数量增加，可以提高准确度，而选取3个，其准确度已经非常高。
[0027] 实施例4:具有与实施例1或2或3相同的技术方案，更为具体的，步骤S1中，是根据人耳听觉特性，计算对数频率域常Q变换谱，该常Q变换谱为：
[0029] (1)式中，Q是品质因子，其为常数，N[ k ]为常Q变换在第k个频点对应的时间窗宽度，（1)式中，x(l，m)表不第1帧信号中的序号为m的米样点；设χι(η)，n = 0,1，· · . ·Μ-1表不长度为Μ，采样率SFs的音频信号，把该音频信号截断为每段长度为N[k]的帧，若帧移为L，则第1帧信号可以表示为：
[0030] x( 1 ,m) =xi(m+lL) ,m=0,l,. . .N[k]-1 (2)
[0031 ] (1)式中，WN[k](m)表不长度为N[k]的汉宁窗，即：
[0033]实施例5:具有与实施例1或2或3或4相同的技术方案，更为具体的，折叠谐波求和谱定义为：
[0035]其中:h为谐波次数，Η为最高次谐波，0<a<l，XQ(k，l)为常Q变换谱，round( ·)运算结果等于最近的整数，假设每倍频程取Oct个点，常Q变换分析的最低频率分量为fmin，最
1其中ceil( ·)运算结果等于正无穷方向最近的整数，常Q变换的第k个频率点对应的频率为：
[0037]实施例6:具有与实施例1或2或3或4或5相同的技术方案，更为具体的，基频后验概率密度定义为：
[0039] 其中：Fi,i为第1帧的第i个基频候选，上式中p(Fi,i)为第1帧第i个基频Fi,i的先验概率，定义？的,1)=乂。的,1，1);上式中？〇。出，1)旧,1)量测给定基频?^1得到观测常诚页谱的概率。
[0040] 实施例7:具有与实施例1或2或3或4或5相同的技术方案，更为具体的，定义：
[0045] (8)式中β = 0.03,若常Q谱中基频候选Fi,i的第h次谐波是谱峰则γ i(h，Fi,i)为1，
表征第1帧常Q谱中所包含的前Η次谐波分量的数量。类似地，若X Q
(k，l)是谱峰则心(1〇为1，否则为0 表征第1帧常Q谱中F1;1的前Η次谐波频率范围内的所有谱峰数。
[0046] 折叠谐波求和谱是基频及各次谐波分量的归一化加权和，设基频为Fo,则折叠谐波求和谱在Fo位置处的函数值为常Q变换在F Q，2FQ，3F()，. . .，HF〇等处幅度的归一化加权和；折叠谐波求和谱在2F〇位置处的函数值为常Q变换在2FQ，4F Q，6F()，. . .，2HF〇等处幅度的归一化加权和。日常语音、音乐等信号主要能量集中在低频段，故即使常Q变换基频幅度小于二次谐波幅度，其折叠谐波求和谱也能在基频位置处得到较大输出。由折叠谐波求和谱中的前几个峰值得到基频候选，能够实现基频的初步筛选。
[0047] 最大后验概率密度函数中的第一项定义为？$1,1)=乂。卬1, 1，1)，即折叠谐波求和谱在F1;1处的幅度，p(F1;1)取折叠谐波求和谱而非常Q变换谱是因为有时候某些谐波分量的幅度会超过基频的幅度，而即使谐波幅度高于基频幅度的时候，折叠谐波求和谱在基频位置处的值仍大于高次谐波处的值，进而提高基频估计的准确率，降低误判率。
[0048] 实施例8:具有与实施例1或2或3或4或5或6或7相同的技术方案，更为具体的，基频估计公式为：
[0050]实施例9: 一种谐波信号基频估计算法，包括如下步骤：
[0051 ] 1.对音频谐波信号作常Q变换，得常Q变换谱，该常Q变换谱为：
[0053] (1)式中，Q是品质因子，其为常数，N[ k ]为常Q变换在第k个频点对应的时间窗宽度，（1)式中，x(l，m)表不第1帧信号中的序号为m的米样点；设χι(η)，n = 0,

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张维维;李敏;许爽;董玉华;
技术所有人：大连民族大学;
我是此专利的发明人

上一篇：网络教学实时语音分析系统的制作方法
上一篇：一种音频信号处理方法及装置的制造方法