汉语语音合成处理方法

文档序号:6407893阅读:704来源:国知局
专利名称:汉语语音合成处理方法
技术领域
本发明属于计算机领域,特别是在计算机上处理汉语语音的方法。
目前在计算机上进行汉语语音合成的系统很多,但是它们的主要缺点有,一个是语音一次合成,发音效果不可改动,另一个是音库的语音信息不全,这也是语音发音效果不可改动的原因。比如,现在处理的汉语语音处理方法其大至过程为,将待处理的汉语文本放进内存,由汉语语音编辑处理软件包,自动将汉语文本文件中的汉字组词并赋音,每个汉字经赋音后,自动产生一个汉语拼音代码串,经用算法表示的汉语语流一般性发音规律处理,代表每个汉语单字音节的音节属性代码中的音高、音长及音节间的静音间隔各项即被赋上值,形成音节属性代码串,并直接送语音卡放音,用以上方法放出的声音,可听性差,语调单一,也就是没有抑扬顿挫的感觉和轻重缓急的效果,更不能对同一句话处理出不同的发音效果或编辑出不同的感情色彩。
本发明的目的是为了克服上述缺点,提供一种可在计算机键盘上编辑调整音高、音长及音节的汉语合成处理方法。
汉语是单音节语系,即一个汉字是一个音节,一个音节由辅音和元音组成,音节具有音高、音长、音强三个基本物理属性。一个音节在不同语流中.它的物理三属性的物理量会依据说话人当时想要表达的意思或要抒发的情感而发生变化,也就是说,一个音节在不同情况下,物理三属性的物理量是变化的、不定的。
根据语音流中音节的这些特点,我们对音素库的录制采用以辅音和元音为基本音素单元的结构。对元音的采制做两项改进,使音素库达到极大的信息量,以保证了对语流的编辑调节,使计算机能合成出自然度较强、有抑扬顿挫感、有感情、同一语句可发出不同含义语音的语流,例如对元音的采制采用八级音高的方法录制,就一个韵母(元音)在音素库中的状况(ing举例)
本系统对一个元音分八级音高的录制,是根据被录音人的音域范围,分成八级,用乐音的音阶来定义,也就是被录音人的八级音高定义在比中音C低一度半的#A、中音C、中音D、中音E、中音#F、中音#G、中音#A和高音C这八个音高上。不同的被录音人,八级音高定义不同。
另一个改进就是对计算机采录的元音声波数据中的每个周期做出周期起点和周期终点标记,对每个周期的起点和它的终点,人为地加入一个值为0的16进制数,做为控制软件的识别标志。当需要延长一个元音时,由软件自动将此元音的主音段(声能最强的部分)中的每个周期重复需要的次数合成输出,缩短此元音则是平均抽出主音段中的若干声波周期不做合成输出。由于以上两项的改进,就可以实现在计算机键盘上对语流中单音节在音高、音长、音节间静音间隔的编辑。
附图
为本发明方法的流程中(1)为汉语文本文件(2)为构词赋音(3)为语音代码自动编辑(4)为语音代码人工编辑(5)为音素提取(6)为放音为实现汉语语音编辑处理,计算机的整个运转过程为,待处理的汉语文本文件(1)(在内存中),由汉语语音编辑处理软件包参照CVPS(汉语语音处理系统),汉语词库,自动将汉语文本文件中的汉字组词并赋音(2),每个汉字经赋音后,自动产生一个汉语拼音代码串,经用算法表示的汉语语流一般性发音规律自动编辑(3)处理,代表每个汉语单字音节的音节属性代码中的音高、音长及音节间的静音间隔各项即被赋上值,CVPS根据拼音代码串从计算机硬盘中存贮的CVPS音素库中提取相应的音素(5),依据音节属性代码中的音长值做相应的周期波形的处理,拼接形成语音波形数据流,然后送语音卡放音(6)。若经CVPS处理后的语音效果还达不到要求的话,这时可在汉语语音编辑处理软件包的人机交互界面下,根据操作者的意愿,人工编辑(4)调整音节的音高、音长及音节间的静音间隔,形成不同语义、不同情感的拼音及音节属性代码串。同时还可进行多音字的处理,再送语音卡放音(6)。
实施例
设备386微机、语音卡(本系统用声霸卡)以汉字“行”为例,假设该字在一个汉语文本文件中(仅此一字也可)“行”字的汉字内码,由汉语语音编辑软件包参照CVPS汉语词库,与“行”字的前后字(多字)判断组词关系,组成单字词或多字词,确定其读音,形成该字的拼音代码(此处定为银行的“行”字)HANG2,其中H为声母,ANG为韵母,2表示阳平,按汉语语流一般性发音规律,给“行”字赋予其音高及音长值,此处假定为#G调,拼音代码则为HANG52,其中5表示#G调,音长及音节间静音间隔值赋在该字的音节属性代码中。若认为自动赋予的各项值不合适,所通过汉语语音编辑处理软件包的人机交互界面调整。假设提高一个音高,即改为HANG62。若想改变读音,也可通过界面改为XING52。
CVPS根据拼音代码串从计算机硬盘中存贮的CVPS音素库中提取相应的音素,依据音节属性代码中的音长值做相应的周期波形的处理,拼接成语言波形数据流,送语音卡放音。
权利要求
1.一种包括计算机和语音卡的汉语语音合成处理方法,其特征在于,其运作过程为,在内存中汉语文本文件(1)经构词赋音(2)之后,形成语音代码的自动编辑(3),或经语音代码的人工编辑(4)后,在硬盘中提取音素(5),送放音卡(6)。
2.按权利要求1所述的汉语语音合成处理方法,其特征在于,对音素库中每个元音做八级音高的方法录制。
3.按权利要求1、2所述的汉语语音合成处理方法,其特征在于对元音数据中的声波周期数据做周期起始和终止标记。
4.按权利要求2、3所述的汉语语音合成处理方法,其特征在于,利用计算机键盘对语流中单音节在音高、音长、音节间静音间隔的编辑。
全文摘要
本发明属于计算机领域,特别是利用计算机来处理汉语语音的方法。本发明包括计算机和语音卡,其运作过程为,汉语文本文件(1)经构词赋音(2)之后,形成语音代码的自动编辑(3),或经语言代码的人工编辑(4)后,提取音素(5),送放音(6)。音素库中对每个元音做八级音高的方法录制,并对元音数据中的声波周期数据做周期起始和终止标记,可利用计算机键盘对语流中单音节在音高、音长、音节间静音间隔的编辑。
文档编号G06F3/16GK1115442SQ94107420
公开日1996年1月24日 申请日期1994年7月20日 优先权日1994年7月20日
发明者金明, 骆菲林, 杨少康, 刘念 申请人:金明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1