专利名称:一种实现声音变速不变调方法及变速变调系统的制作方法
技术领域:
本发明涉及声音信号处理技术领域,具体涉及一种实现声音变速不变调的方法及
其声音变速变调的系统。
背景技术:
变调的过程实际上是将声音的频谱进行收縮或者扩展,同时原先各谐波成分之间 的关系仍然保留;变调需借助于一定的算法实现。现在变调算法主要分为时域算法和频域 算法两大类。频域算法是先对数字声音信号进行傅立叶变换运算,将数字语音信号转换成 频域的频谱信号,对此频谱信号平移一差值,以改变数字语音信号的频谱,再对此频谱信号 进行反傅立叶变换运算转成时域的数字语音信号,即可达成产生变调数字语音信号。但是, 该方法实现的变调效果会带有金属声。原因在于频率的搬移并不是频率的线性变化。频域 算法的另一种方法是在频域上用线性内插的方法来实现频率的提高与降低,从而实现声调 的变化。这个方法的缺点在于内插的方法会引入不需要的频率。特别是在某些能量大的 频点,假设要升2倍频,将会引入一些能量为原频点能量一半的频率分量。这些频率分量会 大大影响音频的音质。而且这些频率分量与原来有用的频率贴得很近,若要进行滤波也较 麻烦。另外,上述两种方法需要进行傅立叶变换及其反变换,运算量较大。这两种比较适合 大比例的音调改变,不过变调之后的声音的自然度较低。时域算法一般采用变速加变采样 率的方法实现。 变速即对信号进行变速不变声的处理,也就是将一段声音的持续时间拉长或者縮 短,而声音的音调不变。现在实现声音变速的方法几乎都是在时域进行的,都是对原始信号 进行删除或者插入,使信号变短或变长,从而实现声音的快放或者慢放。国际专利PCT(申 请号PCT/CN96/00074)和两个中国专利(公开号为CN1197976和CN1920951)认为音频信号 系统可以认为是由音元所组成;音元作为一种包含独立、完整基本信息元素的最基本结构 单元,可认为是一种声音分子;声音分子(音元)的不同排列、组合形式构成了不同的声源; 结构、性状相同或相近的声音分子的多次重复、组合构成同一个音;紧密连接的不同音,其 内的音元从一种形态变化到另一种形态是一种渐变的而非突变的过程。对于音频信号,进 行以音元为基本处理(分割)单位的切割,然后在切割点处插入信息单元(比如,在切割点 处插入所被切割的音元本身),使原信号的长度增长;或在切割点处,删去性状相同或相近 的音元中的一个或几个,使原信号的长度縮短,从而实现对音频信号的变慢或变快放音,并 获得的变速不变调放音效果。这种方法的关键点是寻找最佳匹配区。寻找最佳匹配区的方 法一般有最大互相关系数法、最大归一化互相关系数法、最小平均幅度差系数法三种。众所 周知,在求最大互相关系数、最大归一化互相关系数、或者最小平均幅度差系数时都要经过 大量的运算,这极度增大了实现算法的复杂度,不利于变速不变调的实时性。同时,这些发 明在处理两帧的连接处时把两帧数据直接连接,使得连接处不平滑而引入噪声。
=
发明内容
本发明的目的在于提供一种实现声音变速不变调的方法,以复杂度非常低的算法 实现了声音变速不变调效果,同时保持了原始声音的自然度。 为了实现这一 目的,本发明的技术方案为一种实现声音变速不变调的方法,其特 征在于该方法的技术方案包含4个主要步骤A.输入缓存对将要被处理的原始音频信号 读入缓存中;B.分割数据采用窗口函数,根据变速系数从原始语音信号中提取出一串信 号子系列(即小段声音);C.连接数据将这些信号子系列按它们的时间先后顺序连接起 来就得到变速不变调信号;D.输出缓存把处理过的音频信号输出出去。在分割数据时,所 用到的窗口函数通过下面的方式构造
一,), 0 Sw < /r
1, w < /e (1) 并且,当0《n〈lT时, 0《P (n) < P (n+1)《1 (2) P (n)是三角窗、Harming窗、Hammiing窗、或者是Blackman窗的前半部分,或者 是正弦窗的半部分或者是满足式(2)的其他数列;lw为窗口长度;le为一个窗口中有效数 据的长度,在此被定义为窗口中权值大于0.5的数据长度;lT为窗口的过渡段的长度;L和 le, lT之间的关系如下:
lw = le+lT (3)。 假设一次读入缓存的数据的采样数为l,当1 > 2L时,利用式(1)定义的窗口把 读入的音频信号分割成多个信号子系列,相邻子系列的起始位置之间的距离ls计算方式如
下 ls = le a (4) 其中,a为变速系数,当a > 1时,声音加速;当0 < a < 1时,声音放慢。
当1《21w时,把读入的音频信号分割成两个信号子系列,分割方式是①当a > 1时,前一子系列为从本次读出数据的最前面的,长度为1/a的数据(但最后It个采祥与 窗口系列式(1)中尾部lT个数据相乘),后一子系列为本次读出数据的最后的,长度为lT的 那段数据(但头部的lT个采样与窗口系列式(1)的头部lT个数据相乘); 当0.5< a < 1时,前一子系列为从本次所读出的数据本身(但最后It个采祥与窗口系列式(1)中尾 部1t个数据相乘);后一子系列为本次读出数据的最后的、长度为l d= 1 ,(1/a-l)+lT的 那段数据,如果l d > l,则利用前一次读入数据的最后长度为ld = l d_l补足,并且头部 的It个采祥与窗口系列式(1)的头部It个数据相乘。 连接数据是把分割出来的子系列按照它们的时间先后顺序连接起来,连接处的处 理方式为把前一子系列的尾部过渡数据与后一段数据的头部过渡数据相加,即假设前一 子系列尾部长度为1T的数据系列为Xj(0《j < 1T),后一子系列头部长度为1T的数据系列 为yj (0《j < 1T),连接处的数据系列Zj (0《j < 1T),那么,
Zj = Xj+yj (5) 本发明的另一目的在于提供一种实现声音变速变调的系统,该系统以极低的复杂 度算法实现了声音变速变调效果,同时保持了原始声音的自然度。
为了实现这一目的,本发明的技术方案为一种实现声音变速变调的系统,该系统 由以下4个部分组成输入缓存模块,将待处理声音信号数据读入缓存;变调处理模块,对 声音信号进行变调处理以改变声音的音调;变速不变调处理模块,对声音信号进行变速不 变调处理,以改变语速但音调不变;数据输出模块,把上述变速变调信号输出。变调模块是 利用重采样处理技术和低通滤波处理技术实现的。变速不变调处理模块包括分割数据模 块,根据变速系数利用窗口函数从原始语音信号中提取出一串信号子系列(即小段声音); 和连接数据模块,将这些信号子系列按它们的时间先后顺序连接起来。 由于变调处理技术与变速不变调处理技术是相互独立的,所有在本发明中实现变 速变调系统时有两种情况(l)先对原始音频信号进行变调处理以得到变调信号,再对变 调信号进行变速不变调处理,这样就得到所期望的变速变调信号;(2)先对原始音频信号 进行变速不变调处理,以得到变速信号,再对变速信号进行变调处理,这样也得到所期望的 变速变调信号。 本发明的优点在于以很低算法复杂度实现了音频的变速不变调功能和变速变调 功能,并不引入噪声,提高了处理后的声音质量。
图1为适用于本发明的系统环境; 图2为本发明的典型的应用实例 图3为常见的声音频率(基音频率); 图4为静音门槛曲线; 图5为遮蔽门槛曲线; 图6为原始信号分段图; 图7为信号段连接图; 图8为窗口函数中相关参数之间的关系; 图9为本发明的声音变速不变调实施例1的算法流程图; 图10为本发明的声音变速不变调实施例2的算法流程图; 图11为本发明的声音变速变调系统实施例1的逻辑框图; 图12为本发明的声音变速变调系统实施例2的逻辑框图。
具体实施例方式
在本发明的较佳实施例的下述描述中,参考了作为说明书一部分的附图进行描 述,所述
了本发明可以采用的特定实施例。本领域技术人员应该理解在不背离本 发明精神的情况下,还可以使用其它实施例或对这些实施例进行修改。这都没有超出本发 明的公开范围。 l.O示范工作环境以及应用 图1示出了可以实现本发明的一种合适的系统实例。该系统只是一个合适的系统 实例,并不是要将本发明的使用和功能范围局限在该系统中,也不是要将系统解释为与示 范硬件系统中所示部件之一或其组合具有联系或要求。 本发明可以在许多其它通用或专用系统环境或配置中工作。适用于本发明的系统、环境和/或配置的实例可以包括(但不局限于)多媒体计算机、MP3机、MP4机、数码学 习机、VCD、 DVD、 KTV系统、家用音响系统,等等。 如图l所示,一种执行本发明的示范系统包括以数字多媒体系统形式出现的通 用设备。该系统100的部件包括(但不局限于)处理单元114、系统存储器101和系统总 线112,它将处理器114、系统存储器、输入设备117、输出设备、网络设备以及其他硬件模块 109等连接在一起。输入设备117包括(但不局限于)鼠标、键盘、控制键板、或者调制解 调器等,负责接收用户所输入的命令或者数据,它通过用户输入接口 118接入系统;输出设 备,如扬声器113,通过输出外围接口与接入系统;系统可以在使用物理连接一个或多个远 程设备的联网环境中运行,该远程设备115可以是个人计算机、服务器、路由器、网络PC、对 等设备。系统通常包括各种存放数据的可读媒体。这些媒体可以包括(但不局限于)存 储媒体和通信媒体。存储媒体包括易失和非易失、可移动和非可移动媒体,比如RAM、 ROM、 EEPROM、闪存或其它存储器技术、CD-ROM、数字通用光盘(DVD)或其它光盘存储、磁带盒、磁 带、磁盘存储。这些媒体可以用于任何存储信息,例如可读指令、数据结构、程序模块或其它 数据的方法或技术实现。通信媒体通常包含计算机可读指令、数据结构、程序模块或其它调 制数据信号(例如载波)或其它传输机制中的数据,并且包括任何信息传递媒体。通信媒 体包括(但不局限于)有线媒体例如有线网络或直线连接、以及无线媒体例如声音、RF、红 外线和其它无线媒体。上述媒体的任意组合也应包含在可读媒体的范畴。系统中系统存储 器中的音频解码模块105和挂在系统总线音频解码模块110的作用都是把经过压縮编码的 音频流解码为PCM格式的数据,但105与110是有区别的,音频解码模块105是软件,它的 运行效率与系统的处理器的主频有很大的关系,而音频解码模块110是音频解码的专用芯 片,它的运行效率只与它自身的运算速度有关,通常来讲它的运行效率比较高。
本发明的典型应用如图2所示,这种应用包括(但不局限于)学习语言、唱歌、听 音乐、练习唱歌等。其整个应用的功能模块包括用户输入模块202、输入缓存模块203、音频 解码模块204、其他处理模块205、变速变调处理模块206、播放模块207。用户输入模块202 用于接收用户设置各种参数,比如变调系数n和变速系数a ,输入的方式可以包括(但不 局限于)键盘输入、遥控器输入、按键输入等等;输入缓存模块203用于存放读入的、压縮 的音频流,这些音频流的格式包括(但不局限于)包括MP3、RM、MPG、AC3等;音频解码模块 204作用是把MP3、RM、MPG、AC3等格式的音频数据解码为数字声音的波形数据;其他处理模 块205的作用是对解码出来的数据进行其他方面的处理,这些处理包括(但不局限于)重 采样、调整音量等;变速变调处理模块206的作用是声音进行变速、变调方面的处理,其具 体方法将在后面详细阐述;播放模块207的作用是数字声音信号进行D/A转换、前置放大、 功率放大等处理,把声音播放出来。 现在,已经讨论了本发明的示范操作环境和示范应用,本说明书部分的剩余内容 将致力于描述实现本发明的程序模块。
2. 0音频的变速不变调处理方法 当人耳听到声音时,立即可以辨别是哪种声音。对应于这种辨认的听觉印象即为 音色。音色主要决定于声音的频谱,即基音和各次谐音的组成,也和波形、声压及声音的时 间特性有关系。如果将留声机的唱片反向转动,声音的频谱虽然未变,音色却显著改变了。 这说明音色在很大程度上与各泛音在开始时和终了时振幅上升和下降的特点有关系。在这里,本发明先定义一个概念音波——在某单一音色的声音的基波持续一个周期内,基波 和它的所有谐次波所合成的波。本发明认为,人耳能够具体分辨出声音的条件是人耳必须 听到一个以上的完整的音波。图3列出了一些常听到的声音的频率。从图中可以看出,人 们常听到的声音的一个音波所持续的时间多则几十毫秒,少则一百微秒,但通常是几毫秒。 在一列由多个音波组成的声音中,删除一个以上的音波后只要剩下的音波中还有完整的音 波,或者在这列音波持续的时刻增加一个(以上)同样的音波,人耳就有可能把这种声音分 辨出来。由于声音是由时间上错落有致的、大量的音波系列组成,每个音波列所持续的时间 是有限的,长的则几秒甚至数分钟,短的则几十毫秒到几毫秒甚至一毫秒以下。图4显示的 是静音门槛曲线,表示在安静的环境中,某一频率的声音被听见的条件是该声音的强度必 须大于它所对应的静音门槛值。在嘈杂的环境中,并不是所有强度高于静音门槛曲线中相 应门槛值的声音都能被听见,这是因为强度高的声音可能会遮蔽它频率附近的强度较低的
声音而使得人们不能听见,如图5所示。这也就解释了为什么在吵闹的环境中,人们说话时 都放大嗓门以便于让别人听清楚。 本发明实现声音的变速不变调的技术方案如下 利用窗口函数从原始声音信号中分割出一串信号子系列(即小段声音),该一串
信号子系列包括至少两个信号子系列,根据变速系数a不同,连续两个子系列有部分信号
是交叉的(如图6中的601),或者没有交叉甚至相隔一段距离(如图6中的602);将这些
信号子系列按它们的时间先后顺序连接起来就改变了声音数据长度(如图7中所示),从而
实现了声音的慢放或快放——达到预期的效果。当a > 1时,声音的速度被加快;0. 5《a
< 1时,声音的速度被放慢。 上述的窗口函数是这样构造的
'/ ("), 0 S " < /r
1, /r2w</e (1)
—"), /e^"</w
并且,当0《n〈lT时,
0《P (n) < P (n+1)《1 (2) P (n)可以是三角窗、Hanning窗、Hammiing窗、或者Blackman窗等窗函数的前半 部分,还可以是正弦窗的半部分或者是满足式(2)的其他数列;lw为窗口长度;^为一个窗 口中有效数据的长度,在本发明中被定义为窗口中权值大于0. 5的数据长度;1T为窗口的 过渡段的长度;如图8所示,lw和^, lT之间的关系如下
lw = le+lT (3) 按照式(1)构造的窗函数就是一个低通滤波器。在利用窗口函数去分割原始声音 信号时,不可避免地会把一些音波一分为二,而产生新的音波。为了使新音波形成的声音的 强度远低于它的静音门槛值,这要求P (n)变化平坦,即要求lT足够大。通常,1t取10his 左右即可。从发声机理知,一个完整的音包含有产生、发展、消亡的过程。与此相对应,构成 该声音的音波系列也有产生、发展(成长)、消亡(演变)的变化过程及形态,即持续一段时 间。窗口长度lw是影响变速效果的一个重要因素,如果帧长选择的太小,很多音波被破坏 引起低频部分失真,如果lw选择过大又会引入不连续的回声。经过大量的测试,具体实施 时窗口长度lw(即帧长)选择30ms 40ms为宜。
2. 1变速不变调的方法的实施例1 当系统有很大的内存可用并且一下子可以处理完所有音频数据时,本发明涉及到 的变速不变调处理的系统流程的实施例1如图7所示,在本实施例中,把原始信号一下子读 入到输入缓存区,根据变速系数,利用本发明中所述的窗口函数从原始声音信号分割出一 联串的信号子系列(即小段声音),再将这些信号子系列按它们的时间先后顺序连接起来 就能得到所期望的信号。其具体步骤如下 步骤901,系统初始化根据声音信号的采样率和所要求的变速系数计算出窗口 长度(即窗口函数的点数)以及按照式(1)构造窗口函数,和相邻段数据的起始位置之间 的距离。由于一次读入缓存的数据的采样数为1 > 2L,其中L为窗口长度,因此相邻段数 据的起始位置之间的距离ls计算方式如下
ls = le a (4) 步骤902,输入缓存把所有原始信号数据读入缓存; 步骤903,分割数据采用加窗的方式从原始信号数据中提出一联串的信号子系 列(即小段声音),前后两个子系列在原始信号中的距离由式(4)确定,而窗口函数由式 (1)构造。 步骤904,连接数据根据每段信号在时间上的先后顺序把步骤903得到的子系列 连接起来,这就形成所求的变速信号。相邻的子系列的连接方式为把前一子系列的窗口尾 部过渡数据与后一子系列的窗口头部过渡数据相加,即假设第i段窗口尾部过渡数据系列 为Xj(0《j < 1T),第i+l段窗口头部过渡数据系列为yj(O《j < 1T),相应生成的数据Zj, 那么, Zj = Xj+yj (5) 步骤905,数据输出把经过上述几个步骤处理得到变速不变调信号输出。 步骤906,结束。 2. 2变速不变调的方法的实施例2 当系统的可用内存很小或者需要实时处理时,这时一次读入缓存的数据的采样数 1《2L,因此每次读入一帧原始信号数据,把它处理成两段,将这两段数据连接就能得到变 速的信号。具体实施方法如图IO所示,其步骤如下
步骤IOOI,系统初始化与实施例1中的步骤901相同。 步骤1002,输入数据读取帧长为1原始信号数据到输入数据模块中,其中数据长
度1计算方法如下 当变速系数a > 1时, 1 = le a 当变速系数0. 5《a < 1时,
1 = le 步骤1003,分割数据对步骤702读入的原始信号数据分割为两段,分割的方法如 下 当变速系数a > 1时,前一段数据为从本次读出数据的最前面的,长度为L的数 据;后一段数据为本次读出数据的最后的,长度为1T的那段数据。 当变速系数O. 5《a < 1时,前一段数据为从本次所读出的数据本身;后一段数据为本次读出数据的最后的、长度为lend = le _1)+1T的那段数据,如果lend > le,则
需要利用前一次读入数据的最后长度为ld = 步骤1004,连接数据把步骤1003所得到的两段数据连接起来。连接处的处理方
式为把前一段数据的窗口尾部过渡数据与后一段数据的窗口头部过渡数据相加,即假设
前一段数据尾部长度为1T的数据系列为Xj(0《j < 1》,后一段数据头部长度为1T的数
据系列为yj(O《j < 1》,连接处的数据系列Zj(0《j < 1》,本发明中所述窗口函数(式
(l))系列的最后长为1T的系列为MO《j < 1》,那么, Zj = Xj |3 (le+j)+yj [1—P (le+j)] , (0《j < 1T) (6) 其中,|3 (j)为本发明中定义的窗口函数(式(l))。 步骤1005,数据输出把经过上述几个步骤处理得到信号输出。 步骤1006,转到步骤1002,接着处理下一帧数据。 步骤1007,结束。 2. 3超慢速播放处理方法 当a《0. 5时,播放的速度非常慢,其处理方式是将分割数据得到数据重复1/a 次,再把它们采用上述的方法连结起来,这样就可以达到所期望的语速。为此,这里不再详 述。 大量实验表明,本发明提出的方法对于变速系数a为0. 5 2内的变速处理都能 获得非常好的处理效果,不引入噪声,同时实现了声音的保真。
3. 0音频信号的变速变调系统 本发明的音频信号的变速变调系统由以下4个部分组成输入缓存模块,将待处 理声音信号数据读入缓存;变调处理模块,先利用离散信号的重采样的方法对声音进行重 采样,使声音的频谱收縮或者扩张,再对经过重采样的信号进行低通滤处理就达到变调的 效果;变速不变调处理模块,对声音信号进行变速不变调处理,以改变语速但音调不变;数 据输出模块,把上述变速变调信号输出。其中变速不变调处理模块包括分割数据模块,采用 窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即小段声音);和连接 数据模块,将这些信号子系列按它们的时间先后顺序连接起来就得到变速不变调信号。
假设变调系数是n :当n > 1时,表示升调;当n < 1时,表示降调。变速系数 是a ,那么在对音频信号进行变速处理时,变速系数将变为a ' = a / n ,其中a是原来的 变速系数。从上述可知,有两种实现变速不变调的方法。方法一如图ll所示,先对原始音 频信号进行变调系数为n的重采样和低通滤波处理1103,在对低通滤波后的信号进行变 速系数为a'的变速处理1104,这样达到变调系数为n、变速系数为a的变速变调效果。 方法二如图12所示先对原始音频信号进行变速系数为a '的变速处理1203,再变速信号 进行变调系数为n的重采样和低通滤波处理1204,这样也能达到变调系数为n、变速系数 为a的变速变调效果。 以上所述仅为本发明的过程及方法实施例,并不用以限制本发明,凡在本发明的 精神和原则之内所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
一种实现声音变速不变调的方法,其特征在于该方法的技术方案包含4个主要步骤A.输入缓存对将要被处理的原始音频信号读入缓存中;B.分割数据采用窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即小段声音);C.连接数据将这些信号子系列按它们的时间先后顺序连接起来就得到变速不变调信号;D.输出缓存把处理过的音频信号输出出去。
2. 如权利要求1所述的声音变速不变调的方法,其特征在于分割数据步骤利用窗口函数分割待变速声音信号,其中窗口函数通过下面的方式构造'风"), 0《"< /r= j 1, " < /e (1 )并且,当0《n < 1T时,0《P (n) < P (n+1)《1 (2)P (n)是三角窗、Harming窗、Hammiing窗、或者是Blackman窗的前半部分,或者是正 弦窗的半部分或者是满足式(2)的其他数列;lw为窗口长度;L为一个窗口中有效数据的 长度,在此被定义为窗口中权值大于0.5的数据长度;lT为窗口的过渡段的长度;lw和I" lT之间的关系如下lw = le+lT (3)
3. 如权利要求2所述的声音变速变调的方法,其特征在于一次读入缓存的数据的采样数为1, 1 > 2L,利用式(1)定义的窗口把读入的音频信号分割成多个信号子系列,相邻子系列的起始位置之间的距离ls计算方式如下 ls = le a (4)。其中,a为变速系数,当a > 1时,声音加速;当0< a < l时,声音放慢。
4. 如权利要求2所述的声音变速变调的方法,其特征在于一次读入缓存的数据的采 样数为l,l《2L,把读入的音频信号分割成两个信号子系列,分割方式是①当a > 1时, 前一子系列为从本次读出数据的最前面的,长度为1/a的数据(但最后1t个采祥与窗口 系列式(1)中尾部lT个数据相乘),后一子系列为本次读出数据的最后的,长度为1T的那 段数据(但头部的lT个采样与窗口系列式(1)的头部lT个数据相乘);②当0.5《a <1 时,前一子系列为从本次所读出的数据本身(但最后It个采祥与窗口系列式(1)中尾部1T 个数据相乘);后一子系列为本次读出数据的最后的、长度为l^二l(l/a-l)+lT的那段数 据,如果lmd > l,则利用前一次读入数据的最后长度为ld = lmd_l补足,并且头部的It个 采样与窗口系列式(1)的头部lT个数据相乘。
5. 如权利要求1所述的声音变速不变调的方法,其特征在于把分割出来的子系列按 照它们的时间先后顺序连接起来,连接处的处理方式为把前一子系列的尾部过渡数据与 后一段数据的头部过渡数据相加,即假设前一子系列尾部长度为1T的数据系列为Xj(0《j< 1T),后一子系列头部长度为1T的数据系列为yj (0《j < 1T),连接处的数据系列Zj (0《j< 1》,那么,<formula>formula see original document page 3</formula> (5)。
6. —种声音变速、变调系统,其特征在于该系统由以下4个部分组成输入缓存模块, 将待处理声音信号数据读入缓存;变调处理模块,对声音信号进行变调处理以改变声音的 音调;变速不变调处理模块,对声音信号进行变速不变调处理,以改变语速但音调不变;数 据输出模块,把上述变速变调信号输出。
7. 如权利要求6所述的声音变速、变调系统,其特征在于变速不变调处理模块包括分 割数据模块,采用窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即 小段声音);和连接数据模块,将这些信号子系列按它们的时间先后顺序连接起来就得到 变速不变调信号。
8. 如权利要求7所述的声音变速、变调系统,其特征在于分割数据模块利用窗口函数 分割待变速声音信号,其中窗口函数通过下面的方式构造<formula>formula see original document page 3</formula>并且,当0《n < 1T时,<formula>formula see original document page 3</formula>P (n)是三角窗、Harming窗、Hammiing窗、或者是Blackman窗的前半部分,或者是正 弦窗的半部分或者是满足式(2)的数列;L为窗口长度;L为一个窗口中有效数据的长度, 在此被定义为窗口中权值大于0. 5的数据长度;1T为窗口的过渡段的长度;lw和U 1T之间 的关系如下lw = le+lT(8)。
9.如权利要求6所述的实现声音变速变调的方法,其特征在于变调处理是在时域进 行的,先对音频信号进行重采样使声音的频谱收縮或扩展,再对该信号进行低通滤波处理,从而达到变调的效果,n为变调系数当n > l时,表示升调;当n < l时,表示降调。那么在对音频信号进行变速处理时,变速系数将变为a' = a/n。
全文摘要
本发明公开了一种实现声音变速变调的系统,该系统由以下4个部分组成输入缓存模块,将待处理声音信号数据读入缓存;变调处理模块,对声音信号进行变调处理以改变声音的音调;变速不变调处理模块,对声音信号进行变速不变调处理,以改变语速但音调不变;数据输出模块,把上述变速变调信号输出。变速不变调处理模块包括分割数据模块,采用窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即小段声音);和连接数据模块,将这些信号子系列按它们的时间先后顺序连接起来就得到变速不变调信号。本发明的优点在于以非常低的算法复杂度实现了音频的变速不变调功能和变速变调功能,并不引入噪声,提高了处理后的声音质量。
文档编号G11B20/10GK101740034SQ20081020219
公开日2010年6月16日 申请日期2008年11月4日 优先权日2008年11月4日
发明者刘盛举, 周琴, 郝桂堂 申请人:刘盛举;郝桂堂