改变声音声调及减少其噪声的装置的制作方法

文档序号：2835806阅读：652来源：国知局

专利名称：改变声音声调及减少其噪声的装置的制作方法
本申请涉及一种改变声音声调及减少其噪声的装置，特别涉及利用插入平滑化处理后的数字数据来改变声音声调及减少其噪声的装置，并能实现实时(realtime)的功效，且只需少量的运算及少量的存储器储存量即可完成。
改变说话者的声音声调，若应用于卡拉OK和儿童玩具等日常生活中，将可增进欢乐气氛。然而这些消费性产品的要求是要能实时处理，而且产品成本要低，所以改变声调的运算复杂度不可太高，所需的存储器也要尽量节省。故传统正规装置，将语音信号转换至频域(frequency domain)处理后再转换回时域(timedomain)的处理方式，受限于上面所提的条件，无法应用在中低价位的消费性产品中。
本申请的目的即根据上述常用技术的缺点，提出一改善的装置，使实时改变声音声调所需的运算及存储器储存量减少，同时又可消除模拟信号输出时的噪声。
为达上述目的，本申请的改变声音声调及减少其噪声的装置，包含模拟数字转换器，以第一取样频率将输入模拟信号转换为数字数据；数字模拟转换器，以第二取样频率，将该数字数据转换为输出模拟信号；声调改变运算器，将该数字数据依序存入第一时帧，并于该第一时帧存满后，再从第二时帧依序存入该数字数据，并从该第二时帧依序取出至该数字模拟转换器，而于该第二时帧取完后，再从该第一时帧依序取出至该数字模拟转换器；其中由于第二取样频率与第一取样频率是不同的，所以该数字数据在从取出至该数字模拟转换器之前，先进行平滑化处理，以消除不连续现象。
如所述之改变声音声调及减少其噪声的装置，其中该第一时帧及该第二时帧系为声音数据时帧(frame)。
如所述之改变声音声调及减少其噪声的装置，其中该第一取样频率为模拟转换为数字的取样频率。
如所述之改变声音声调及减少其噪声的装置，其中该第二取样频率系为数字转换为模拟的取样频率。
如所述之改变声音声调及减少其噪声的装置，其中该数字数据系依序并循环地存入该第一时帧及该第二时帧。
如所述之改变声音声调及减少其噪声的装置，其中该模拟信号系依序并循环地自该第二时帧及该第一时帧取出后转换。
如所述之改变声音声调及减少其噪声的装置，其中该第一取样频率小于该第二取样频率时，该声音声调系变高。
如所述之改变声音声调及减少其噪声的装置，其中由于该第一取样频率小于该第二取样频率，所以自这些时帧取出一段落数据转换获得输出的模拟信号的增加。
如所述之改变声音声调及减少其噪声的装置，其中通过利用尾端数据及该段落数据前的比较数据产生平滑化的数字数据。
如所述之改变声音声调及减少其噪声的装置，依序由输出时帧位于该尾端数据之前的数字数据、平滑化的数字数据及该段落数据转换获得模拟信号。
如所述之改变声音声调及减少其噪声的装置，其中第一取样频率大于第二取样频率时，该声音声调系变低。
如所述之改变声音声调及减少其噪声的装置，其中由于第一取样频率大于第二取样频率，所以输出的模拟信号转换时从这些时帧中扣除无效数据。
如所述之改变声音声调及减少其噪声的装置，其中无效数据位于时帧之后端，且包含一尾端数据，而无效数据前为经平滑化处理的比较数据。
如所述之改变声音声调及减少其噪声的装置，其中比较数据及尾端数据经平滑化处理后，产生平滑化的数字数据。
如所述之改变声音声调及减少其噪声的装置，其中模拟信号为依序由输出时帧位于比较数据之前的数字数据及平滑化的数字数据转换而成。
换言之，本申请之改变声音声调及减少其噪声的装置，系针对存有数字数据的时帧进行下列步骤在时帧内决定搜寻点及搜寻范围；计算搜寻范围内，搜寻一段与该时帧的尾端数据最相近的比较数据，并根据比较数据决定最佳连接点；利用比较数据及尾端数据进行平滑化处理，以产生平滑化的数字数据；以及依序输出时帧位于尾端数据之前的数字数据、平滑化的数字数据及位于比较数据后的段落数据。
如所述之改变声音声调及减少其噪声的装置，其中改变声音声调及减少其噪声的装置使声音声调系变高。
如所述之改变声音声调及减少其噪声的装置，其中由数字模拟转换器(DAC)依序输出时帧位于尾端数据之前的数字数据、平滑化的数字数据及段落数据。
当然本申请之改变声音声调及减少其噪声的装置，亦可针对存有数字数据的时帧进行下列步骤在时帧内决定搜寻点及搜寻范围；
计算搜寻范围内，搜寻一段与时帧的尾端数据最相近的比较数据，以决定最佳连接点；利用比较数据及尾端数据进行平滑化处理，以产生平滑化的数字数据；以及依序输出时帧位于比较数据之前的数字数据及平滑化的数字数据。
如所述之改变声音声调及减少其噪声的装置，其中改变声音声调及减少其噪声的装置使该声音声调系变低。
如所述之改变声音声调及减少其噪声的装置，其中由数字模拟转换器(DAC)依序输出时帧位于比较数据之前的数字数据及平滑化的数字数据。

图1为本申请的系统方框图。
图2为本申请两个时帧语音数据交替运算顺序。
图3为本申请提高声调运算装置一(direction＝0)。
图4为本申请提高声调运算装置二(direction＞0)。
图5为本申请提高声调运算装置三(direction＜0)。
图6为本申请降低声调运算装置一(direction＝0)。
图7为本申请降低声调运算装置二(direction＞0)。
图8为本申请降低声调运算装置三(direction＜0)。
图号对照1声音数据时帧31尾端数据32比较数据61尾端数据62比较数据许多人有这样的经验，当我们将唱盘的转速加快时，音调会升高，但播放的时间会缩短，反之若将转速减慢，则音调会下降，但播放的时间会拉长。我们可以将这种原理应用在数字音讯处理过程中，将放音的频率加快(音调升高)或变慢(音调降低)，就可改变声调高低。但是，这种做法会造成声音数据处理后，放音时间和原来说话者的时间长度不一样，所以无法直接应用于实时性改变声调的场合。本申请提出一装置用来解决该项问题，经过处理后的语音数据，可维持相同音讯时间长度，达到声调升降的效果，而且该装置只需少量的运算量及存储器储存量即可完成。
图1为本申请的系统方块图，设模拟数字转换器11(ADC，Analog to DigitalConverter)的取样频率(Sampling Rate)为SR1，要将声调提高或下降r倍(r＞1表示提高，r＜1表示下降，r＝1则不变)，则取样得到的数据，经过声调改变运算器12处理后，再经由数字模拟转换器13(DAC，Digital to AnalogConverter)以取样频率SR2(SR2＝r×SR1)送出。
下面详细说明声调改变运算法则，参考图2，设两个声音数据时帧(frame)A和B，当ADC取样的数据存入时帧A时，时帧B同时进行声调改变法则运算及DAC送出数据的动作。当ADC数据写入时帧A的空间已满时，则继续由时帧B的起头写入数据；DAC送完时帧B的数据时，则继续由时帧A的起头送出数据，如此重复交换时帧A和B的角色。
设每个时帧的时间长度为t1，ADC在取样频率SR1时得到L(data
～data[L-1])笔数据，可是DAC取样频率是SR2(＝r*SR1)，要送出去的数据数量为r*L，因此必须对L笔数据做处理，以便在t1时间内，DAC能有r*L笔数据可送出。
首先定义参数r声调升高或降低的比例，一般为0.6～1.9。(r＞1表示提高，r＜1表示下降，r＝1不变)。
x依r计算出来的连接位置。
p搜寻后较佳连接点的位置，其中p初始值设为x。
direction搜寻方向指标，direction＝x-p。
L取样频率SR1时，声音时帧数据的长度，一般为20～30ms。
H搜寻范围，一般为4～6ms。
N距离值的计算范围，一般为4～6ms。
b搜寻启始点。
e搜寻结束点。
(1)声调提高的情况r＞1以下说明当1＜r＜2的施行步骤，r≥2的情况可依相似的程序处理。
要提高声调，必须增加(r*L-L)＝(r-1)*L笔数据。参考图3～5，x的位置在(2-r)*L处，x至该时帧的结束点共有(r-1)*L笔数据。所以DAC送出数据的顺序，可以是data
～data[L-1]＋data[x]～data[L-1]，共有r*L笔数据。然而在data[L-1]和data[x]连接的地方因不连续的现象，会造成杂音；我们采用下列程序来去除不连续，消除杂音。详细步骤如下步骤一、先决定搜寻范围，该步骤的目的在限制搜寻范围于x点附近1.若direction＝0搜寻启始点b＝data[x-H] 搜寻结束点e＝data[x+H](参考图3)2.若direction＞0搜寻启始点b＝data[x+1] 搜寻结束点e＝data[x+H](参考图4)
3.若direction＜0搜寻启始点b＝data[x-H] 搜寻结束点e＝data[x-1](参考图5)步骤二、计算搜寻范围内，各可能连接点的距离值(distance value)在连接点m的距离值dis(m)，即比较数据32与尾端数据31进行比较，找出每一可能连接点m尾端数据31与比较数据32的相近程度，距离值dis(m)愈小代表二者愈接近。dis(m)&equiv;Σj=1N|data[m-j]-data[L-j]|---b≤m&GreaterEqual;e]]>当然，找出二段数据相近与否也可利用其它方式，例如看二段数据的斜率或曲率等。
步骤三、最佳连接点p≡argmin(dis(m))，b≤m≤e。亦即距离值最小者的连接点m即为最佳连接点P。
步骤四、计算新的direction值，direction＝x-p，使搜寻的范围固定在连接点x左右，不会一直偏向某一边。
步骤五、进行平滑化(smoothing)处理，因为在时帧内数据data(0)～data(L-1)输出后必须再输出一段落数据data(P)～data(L-1)才能满足同时间t1，DAC以较高的取样频率SR2输出模拟数据，进而提高声调，但是在尾端数据3 1与下一个要输出的段落数据data(P)～data(L-1)的连接点P还是会有某些程度的不连续，要消除连接点P不连续的现象，只要进行下面的平滑化处理即可。平滑化的运算式如下smdata[n]＝{data[L-N+n]*(N-1-n)+data[p-N+n]*n}/{N-1}，其中0n＜N，smdata[n]为平滑化数字数据。
步骤六、DAC送出数据顺序为data
～data[L-N-1](时帧位于该尾端数据之前之数字数据)+smdata
～smdata[N-1](平滑化的数字数据，由原尾端数据平滑化而来)+data[p]～data[L-1](多输出的段落数据，由最佳连接点P到原时帧1尾端L-1的数据)。
步骤七、重回(1)步骤一，继续下一时帧。
(2) 声调下降的情况(r＜1)要降低声调，必须减少(L-r*L)＝(1-r)*L笔数据。参考图6～8，x的位置在r*L处，该时帧的启始点至(x-1)处共有r*L笔数据。所以DAC送出数据的顺序，可以是data
～data[x-1]，共有r*L笔数据。然而在data[x-1]和下一时帧的启始点data
间(跳过data[x]~data[L-1]的无效数据)不连续的现象，会造成杂音；我们采用下列程序来去除不连续，消除杂音。详细步骤如下步骤一、先决定搜寻范围，该步骤的目的在限制搜寻范围于x点附近。
1.若direction＝0 搜寻启始点b＝data[x-H] 搜寻结束点e＝data[x+H](参考图6)2.若direction＞0 搜寻启始点b＝data[x+1] 搜寻结束点e＝data[x+H](参考图7)3.若direction＜0搜寻启始点b＝data[x-H] 搜寻结束点e＝data[x-1](参考图8)步骤二、计算搜寻范围内各可能连接点的距离值(distance value)，在连接点m的距离值dis(m)，即找出比较数据62与尾端数据61最相近者。Dis(m)&equiv;Σj=1N|data[m-j]-data[L-j]|,b≤m≤e]]>步骤三、最佳连接点p≡argmin(dis(m))b≤m≤e步骤四、计算新的direction值，direction＝x-p步骤五、进行平滑化(smoothing)处理，其运算式如下smdata[n]＝{data[p-N+n]*(N-1-n)+data[L-N+n]*n}/{N-1}其中0 n＜N，smdata[n]为平滑化数据。
步骤六、DAC送出数据顺序为data
～data[p-N-1](时帧位于该比较数据之前之数字数据)+smdata
～smdata[N-1](平滑化的数字数据)。
步骤七、重回(2)步骤一，继续下一时帧综上述，本申请系利用二个数据时帧轮流存取数字数据，来达到节省存储器的功效，而透过存取间不同的取样频率SR1，SR2可改变声音声调，并省去繁复的运算，最重要的是，本申请在输出模拟信号时，以原声音数据时帧的数字数据作了相近度及平滑化的处理，消除输出的声音时帧(里面的数据在提高声调时比声音数据时帧多，在降低时，比较少)不连续的现象，进而消除杂音及噪声，其进步性、实用性及新颖性具足，爰依法提起专利之申请，惟上述实施例尚不足以涵盖本创作之全部，故提出申请专利范围如附。
权利要求
1.一种改变声音声调及减少其噪声的装置，其特征在于包含模拟数字转换器，用于以第一取样频率将输入模拟信号转换为数字数据；数字模拟转换器，用于以第二取样频率将所述数字数据转换为输出模拟信号；声调改变运算器，用于将所述数字数据依序存入第一时帧，并在所述第一时帧存满后，再从第二时帧依序存入所述数字数据，并从所述第二时帧依序取出至所述数字模拟转换器，而在所述第二时帧取完后，再从所述第一时帧依序取出至所述数字模拟转换器；其中由于所述第二取样频率与所述第一取样频率不同，所以在将所述数字数据取出至所述数字模拟转换器之前，进行平滑化处理，以消除不连续现象。
2.如权利要求1所述之改变声音声调及减少其噪声的装置，其特征在于当所述第一取样频率小于所述第二取样频率时，该声音声调系变高。
3.如权利要求2所述之改变声音声调及减少其噪声的装置，其特征在于由于所述第一取样频率小于所述第二取样频率，所以所述输出模拟信号的增加来自所述时帧取出一段落数据转换而成。
4.如权利要求3所述之改变声音声调及减少其噪声的装置，其特征在于利用所述时帧的尾端数据及所述段落数据前的比较数据产生平滑化的数字数据。
5.如权利要求4所述之改变声音声调及减少其噪声的装置，其特征在于所述模拟信号为依序由输出所述时帧位于所述尾端数据之前的数字数据、所述平滑化的数字数据及所述段落数据转换而成。
6.如权利要求1所述的改变声音声调及减少其噪声的装置，其特征在于当所述第一取样频率大于所述第二取样频率时，该声音声调系变低。
7.如权利要求6所述之改变声音声调及减少其噪声的装置，其特征在于由于所述第一取样频率大于所述第二取样频率，所以所述输出的模拟信号转换时从所述时帧中扣除无效数据。
8.如权利要求7所述之改变声音声调及减少其噪声的装置，其特征在于所述无效数据位于所述时帧之后端，且包含尾端数据，而所述无效数据为需经所述平滑化处理的比较数据。
9.如权利要求8所述之改变声音声调及减少其噪声的装置，其特征在于所述比较数据与所述尾端数据经平滑化处理后产生平滑化的数字数据。
10.如权利要求9所述之改变声音声调及减少其噪声的装置，其特征在于所述模拟信号依序由输出所述时帧位于所述比较数据之前的数字数据及所述平滑化的数字数据转换而成。
全文摘要
本申请为一种改变声音声调及减少其噪声的装置,包含:模拟数字转换器,以第一取样频率,将输入模拟信号转换为数字数据;数字模拟转换器,以第二取样频率,将该数字数据转换为输出模拟信号;声调改变运算器;系将该数字数据依序存入第一时帧,并于该第一时帧存满后,再从第二时帧依序存入该数字数据,并从该第二时帧依序取出至该数字模拟转换器,而于该第二时帧取完后,再从该第一时帧依序取出至该数字模拟转换器。
文档编号G10L21/00GK1341917SQ00126900
公开日2002年3月27日申请日期2000年9月4日优先权日2000年9月4日
发明者陈文源, 钟启仁申请人:华邦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈文源;钟启仁
技术所有人：华邦电子股份有限公司
我是此专利的发明人

上一篇：数字信号处理设备和数字信号处理方法
上一篇：自动新词提取方法和系统的制作方法