专利名称:用于鉴别话音信号的非话音和清音的方法和装置的制作方法
技术领域:
本发明涉及于鉴别话音信号的非话音和清音的方法和装置,和特别是可以容易彼此分离非话音和清音的鉴别话音信号的非话音和清音的方法和装置,使得当以可变重放速度重放该信号时在不恶化对应于清音的信号的情况下,可调制非话音的长度。
记录在记录介质上的话音信号被重放同时变化其重放速度的情况下,由于重放速度的变化导致信号的恶化使重放的话音音色不同于原来的音色。例如,重放是以高速进行时,被重放的话音信号在其频率上发生了变化,因此脱离了原来话音的水平。结果,听到的是“唧唧”声。在低重放速度下,产生通常称为“磁带松弛的声音”。
作为用于防止这种现象的一种常规的方法,日本特许公开平成4-168499(1992年6月16日)公开了一种部分重放由存储器缓冲器读出的话音信号的方法。按照这种方法,当重放速度被加倍时,由存储器缓冲器读出的话音信号被以这样一种方式重放,即,仅其两个连续的时片之一被重放。
在按照上述的常规方法以两倍速度重放一个“(I go to school with Jane)”的声音记录时,原来的话音的各个部分中分别对应于
图1所示的阴影部分被消除了,以至于仅话音“I to with Jane”可被重放。
因为常规方法以较高速度仅重放一部分话音,以便保持话音的音色,但该话音原来的意思丢失了。结果,理解利用常规重放设备的话音意思是非常困难的。另外,使听者很不舒服。
为了解决这样一些问题,即当变化重放速度时防止发生恶化音色或丢失话音信号,本发明人已经提出了一种速度可变话音信号重放方法,如以名称为“速度可变声音重放设备”在韩国特许申请No.94-24514中所公开的。
为了说明利用上述的可变速度声音信号重放设备进行的话音信号的长度调制,必须说明话音信号的基本形式。当话音信号以它的波形被检测时,可以发现该波形是由各种声音,即由如图2所示的与噪声分量在一起的清音、浊音和非话音组成的。浊音是包括人的发音器官的震动声音,它包括元音、鼻音和气流音。另一方面,清音是诸如由发音器官诸如舌、齿或唇形成的发音点产生的噪音。一般来说,无规则产生的清音是指示相应声音的特性。另一方面,有规则产生的浊音是指示除相应话音信号的特性外的相应声音的长度。
例如,当分析声音“ka”时,可以发现它是由同时产生的两个声音组成的,即,一个对应于“k”清音“a”和一个对应于“a”的真正浊音。当这个声音“ka”在长度上被调制的情况下,仅对应于浊音的波形的数目在变化。在这种情况下,清音是不变化的。
这将结合图3更详细地进行描述。如图3所示,声音“ka”被分析为由对应“k”的清音部分和对应“a”的浊音波形组成。另一方面,声音“ka-”被分析为由对应“k”的清音部分和对应“a-”的两个浊音波形组成。另外,声音“ka-”被分析为由对应“k”的清音部分和对应“a-”的三个浊音波形组成。
正如从图3所见,每个话音是由即使对应的话音信号长度改变时其波形也不变的清音和具有多个波形相同数量可变的浊音组成的。
在这方面, 由本发明人提出的可变速度话音重放设备的基本原理是通过复制或消除对应于该话音信号的浊音的多个相同波形的一部分,不调制该话音信号的清音,从而再合成它们,实现在变速重放话音信号的同时防止任何在音色恶化和话音信号丢失。
为了更有效地在可变重放速度下重放话音信号,不仅希望变化一个话音信号的浊音的长度,而且希望变化该话音信号的非话音的长度。
同时,清音具有一种很不规则的波形特性。非话音包括具有一种基本上类似于那些清音的波形的噪声分量。在这一方面,为了在可变重放速度下实现重放功能,从非声音中鉴别这种清音是非常重要的。
但是,利用常规方法实现这种鉴别是困难的。在非声音的噪声分量按照清音相同的方式来鉴别的场合,实现非声音的调制是不可能的。
另一方面,当包含在非声音中的噪声分量具有高于一预定电平的电压电平的情况下,可以按照清音来识别。在这种情况下,噪声可以与清音一起处理。结果,存在一个问题,即,噪声在正常重放模式或在可变重放模式中的原来的声音被一起重放。
因此,本发明的一个目的在于解决上述的问题并提供一种用于鉴别话音信号的非声音和清音的方法,该话音信号包括包含噪声分量和清音的非声音信号,该非声音信号可以容易地鉴别和彼此分离非声音的和清音的信号。
本发明的另一个目的在于提供一种用于鉴别话音信号的非声音和清音的设备,该话音信号包括包含噪声分量和清音的非声音信号,该非声音信号可以容易地鉴别和彼此分离非声音的和清音的信号。
按照一个方案,本发明提供一种用于在以可变重放速度重放话音时从记录在磁带上的话音信号中鉴别非声音和清音的方法,包括以下步骤在对应非声音的电压电平和对应清音的电压电平之间设置一个最佳值作为参考电压电平;检测话音信号的每个波形的音调分量;比较检测的音调分量的电压电平与该参考电压电平的绝对值;和根据比较的结果分离与检测的音调分量相关的一个话音信号,然后将其输出。
最好是,该方法包括第一步骤,以一预定时间间隔分割话音信号的每个波形;第二步骤,调制在第一步骤得到的每个话音信号的波形,因此从调制的话音信号波形中去掉DC分量;第三步骤,检测在第二步骤调制的每个话音信号波形的音调分量电平;第四步骤,比较在第三步骤检测的音调分量的电压电平与初始设置的参考电压电平的绝对值;和第五步骤,根据在第四步骤进行比较的结果选择性地输出在第一步骤得到的每个话音信号波形。
第五步骤最好包括当在第四步骤进行的比较结果对应于第一状态时,把与检测的音调分量相关的话音信号认作非声音,而当比较的结果对应于第二状态时,把话音信号认作清音,和通过分开的线路分别输出非声音的和清音信号。
该方法还包括在第五步骤其进行输出之前滤波非声音信号的步骤,因此去掉包括在其中的噪声分量。
按照另一个方案,本发明提供一种用于以可变重放速度在重放话音信号时从记录在磁带上话音信号中鉴别非声音和清音的设备,包括用于以一种预定的时间间隔分割话音信号的每个波形的波形分割器;用于调制由波形分割器的分割操作得到的每个话音信号波形电平的电平调制器,因此去掉包含在话音信号波形中的DC分量;用于检测由电平调制器电平调制的每个话音信号波形音调分量电压电平的音调检测器;用于比较由音调检测器检测的音调分量的电压电平与初始设置的参考电压电平的绝对值的比较器;和用于根据由比较器的比较结果,选择性地转换由波形分割器的分割操作得到的每个话音信号的波形的开关。
参考电压电平可以设置得高于由音调检测器检测的非声音的音调分量的电压电平的绝对值,但低于由音调检测器检测的清音的电压电平的绝对值。
最好是,当由比较器的比较结果对应于第一状态时,控制该开关通过第一线输出由波形分割器的分割操作得到的每个话音信号波形,而当比较的结果对应于第二状态时,通过第二线输出话音信号波形。
该设备还可以包括连接到该开关的一个端子上的噪声滤波器,以适合输出具有电压电平低于参考电压电平的音调分量的话音信号,该噪声滤波器用于滤除通过该开关的端子的话音信号波形输出中的噪声分量。
本发明的其他各目的和方案从下面结合附图对实施例的详细描述中将是显而易见的,其中图1是说明常规的话音信号重放方法的图;图2是一般话音信号的波形图;图3是表示随着话音信号的长度变化的话音信号中的清音和浊音的波形图;图4是表示一种常规速度变化话音信号重放方法的波形图;图5是示意性地表示按照本发明的一种用于鉴别话音信号的非声音和清音的设备的方框图;和图6A到6F是分别从图5的各个构成单元中输出的波形图。
图5表示按照本发明的用于鉴别话音信号的非声音和清音的一种设备。如图5所示,该设备包括波形分割器1,用于以一种希望的时间间隔从记录介质(未示出)检测的话音信号的波形;电平调制器2,用于调制由波形分割器1的分割操作得到的每个话音信号波形的电平;和音调检测器3,用于检测由电平调制器2电平调制的每个话音信号波形的音调分量。还设置比较器4,用作比较由音调检测器3检测的音调分量的电平与一个被初始设置的参考电平。该设备还包括用于根据比较器4的比较结果转换由波形分割器1的分割操作得到的每个话音信号波形的开关5和用于滤除通过开关5接收的话音信号波形的噪声分量的滤波器6。
现在,结合图6将要描述具有上述结构的设备的操作。
当将如图6A所示的话音信号开始施加到该设备时,波形分割器1以一种预定的时间间隔分割接收的话音信号。然后每个从话音信号分割的话音信号波形被电平调制器2进行电平调制,同时去掉其DC分量。话音信号波形的电平调制是由下述方程表达的V=Vn-V(n-1)其中,n表示取样的次数,是一个大于1的自然数。
当每个样值电平与前一样值电平之间的差在n值足够大的条件下,如图6B所示,输出基本上类似电平调制以前的调制波形。由电平调制器2调制的话音信号波形电平以与电平调制以前的话音信号波形相同的速率增加或减少。
然后将每个已经被电平调制的话音信号波形施加到预定检测器3,该检测器3依次检测如图6C所示波形的音调分量。由音调检测器3检测的波形音调分量指示相应波形的电压电平。该单元电压电平的绝对值被施加到比较器4的非反相端(+)。
比较器4还在其反相端接收参考电压电平。比较器4包括施加到其上的两个电压电平(图6D),因此输出一个逻辑“高”或“低”状态的控制信号。
来自比较器4的控制信号被施加到开关5,控制开关5的转换操作。因为开关5的端子(a)连接到波形分割器1的输出端,从波形分割器1向端子(a)馈送的话音信号按照开关5的开关状态被选择性地输出。
例如,在由音调检测器3检测的音调分量的电压电平的绝对值低于按一个高于噪声音调分量的电压电平的绝对值的预定值设置的参考电压,但是低于清音的电压电平的绝对值的情况下,则由波形分割器1分割的相应话音信号波形对应于包括噪声分量的非声音信号。在这种情况下,比较器4的输出具有逻辑”低“电平,因此使开关5的端子(a)偶合到端子(b)。结果来自波形分割器的话音信号通过端子(a)和(b)被施加到噪声滤波器6。因此,仅输出无噪声分量的非声音分量。
另一方面,在由音调检测器3检测的音调分量的电压电平的绝对值高于参考电压电平的情况下,相应的由波形分割器1分割的话音信号波形对应于包括清音和具有电压电平高于清音的浊音的波形。在这种情况下,比较器4的输出具有逻辑“高”电平,因此使开关5的端子(a)连接到端子(c)。结果,来自波形分割器1的话音信号波形通过端子(a)和(b),不通过噪声滤波器6输出(图6F)。
因此可以实现非声音和清音的鉴别和分离。
正如上面所描述的那样,本发明通过了一种用于从话音信号中鉴别包括噪声的非声音和清音并且将它们彼此分离的方法和装置。按照本发明,当重放话音信号时,有可能以可变重放速度重放话音信号的非声音分量。因此可以有效地实现以可变的重放速度重放话音信号。
按照本发明,使用包括在非声音中的噪声来从清音中分离非声音并通过一个噪声滤波器从非声音中去除。因此,有可能不仅重放更为清晰的原来的声音,而且当以可变重放速度重放话音信号时还防止噪声的产生。
虽然为了说明的目的已经公开了本发明的优选实施例,但是在不脱离所附的权利要求书所披露的本发明的精神和范围的情况下,本专业的技术人员应该理解各种修改、增加和替换都是可能的。
权利要求
1.一种用于以可变重放速度重放话音信号时,从记录在磁带的话音信号中鉴别非声音和清音的方法,包括以下步骤在对应非声音的电压电平和对应清音之间设置一个最佳值作为参考电压电平;检测话音信号的每个波形的音调分量;比较检测的音调分量的电压电平和参考电压电平的绝对值;以及根据比较的结果分离与检测的音调分量相关的话音信号,并将其输出。
2.按照权利要求1的方法,其中检测步骤包括(a)以一个预定的时间间隔分割话音信号的每个波形;(b)调制在步骤(a)得到的每个话音信号波形的电平,因而从调制的话音信号波形中去掉CD分量,和(c)检测在步骤(b)电平调制的每个话音信号波形的音调分量;比较步骤包括(d)比较在步骤(c)检测的音调分量的电压电平和初始设置的参考电压电平的绝对值;以及分离步骤包括(e)根据在步骤(d)进行比较的结果选择性地输出在步骤(a)得到的每个话音信号波形。
3.按照权利要求2的方法,其中步骤(c)包括以下步骤当在步骤(d)进行比较的结果对应于第一状态时,把与检测的音调分量相关的话音信号认作非声音,而当比较结果对应于第二状态时,把话音信号认作清音;和通过分离电路分别输出非声音和清音。
4.按照权利要求3的方法,还包括以下步骤在步骤(e)将其输出之前滤波非声音信号,从而去掉包括在其中的噪声分量。
5.一种用于以可变重放速度重放话音信号时,从记录在磁带的话音信号中鉴别非声音和清音的装置,包括用于以一种预定的时间间隔分割话音信号的每个波形的波形分割器;用于调制由波形分割器的分割操作得到的每个话音信号波形电平的电平调制器,因此去掉包含在话音信号波形中的DC分量;用于检测由电平调制器电平调制的每个话音信号波形音调分量电压电平的音调检测器;用于比较由音调检测器检测的音调分量的电压电平与初始设置的参考电压电平的绝对值的比较器;用于根据由比较器的比较结果,选择性地转换由波形分割器的分割操作得到的每个话音信号波形的开关。
6.按照权利要求5的装置,其中参考电压电平可以被设置为高于由音调检测器检测的非声音的音调分量的电压电平的绝对值,但是低于由音调检测器检测的清音的电压电平的绝对值。
7.按照权利要求5的装置,其中当由比较器的比较结果对应于第一状态时,控制该开关通过第一线输出由波形分割器的分割操作得到的每个话音信号波形,而当比较的结果对应于第二状态时,通过第二线输出话音信号波形。
8.按照权利要求6的装置,还包括连接到该开关的一个端子上的噪声滤波器,适合输出具有其电压电平低于参考电压电平的音调分量的话音信号,该噪声滤波器用作滤除通过该开关的端子的话音信号波形输出中的噪声分量。
全文摘要
一种用于当以可变重放速度重放话音信号时从记录在磁带上的话音信号中鉴别非声音和清音的方法和装置。该方法包括在对应非声音电压电平和对应清音电压电平之间设置一最佳值作为参考电压电平,检测话音信号的音调分量,比较检测的音调电平和参考电平的绝对值,以及根据比较的结果分离相关的话音信号,然后将其输出。该装置包括波形分割器,用于调制每个话音信号电平调制器,因此去掉DC分量,用于检测每个调制的话音信号波形电平的音调检测器,用于比较音调分量电平与参考电平的比较器,以及用于根据由比较器的比较结果,选择性地转换话音信号的开关。
文档编号G10L11/06GK1148231SQ96109380
公开日1997年4月23日 申请日期1996年8月8日 优先权日1995年9月30日
发明者金哲弘, 裵点汉 申请人:三星电子株式会社