一种中文语音信号处理方法、装置和助听设备的制作方法

文档序号：2835930阅读：239来源：国知局

专利名称：一种中文语音信号处理方法、装置和助听设备的制作方法
技术领域：
本发明涉及数字信号处理技术领域，特别是一种中文语音信号处理方法、装置和助听设备。
背景技术：
根据2006年的统计数据，我国大约有2780万人存在听力障碍。助听技术作为听力障碍的有效解决手段，越来越受到人们的关注。而伴随着科技的进步，数字信号处理技术逐步应用到助听领域。耳聋分为传导性耳聋、感音神经性耳聋及混合型耳聋，其中，罹患感音神经性耳聋的耳聋患者占了相当大的比例。感音神经性耳聋又可以分为蜗性(也叫感音性)耳聋、蜗后耳聋、以及中枢性耳聋。由于耳蜗的一项重要的功能就是分析处理听觉信息，感音性耳聋患者由于耳蜗受损可能导致语音分析能力下降，声调识别能力变差。目前的助听器侧重于声音振幅的放大，对于传导性耳聋效果很好，而对于感音性耳聋，不能达到理想的助听效果，尤其噪声环境下这种不理想更为明显。因此，对于感音性耳聋，可用于语音分析能力弥补的助听器会带来较好的效果。目前，大部分可用于语音分析能力弥补的助听器是根据西方语音来研究和开发的，中文用户无法使用。这是由于中文语音与西方语音存在多方面不同，如(I)中文语音为单音节带调语言；(2)中文语音为辅音与元音结合的结构，不同于西方语音存在多个辅音串的结构。由于中文语音和西方语音存在的差异，迫切需要一种针对中文语音的信号处理方法，提高感音性听障患者的声调识别率，进而提高感音性听障患者的言语理解度。

发明内容
有鉴于此，本发明提出了一种中文语音信号处理方法，用以提高感音性耳聋患者对声调的感知能力。本发明还提供一种中文语音信号处理装置及一种助听设备。因此，根据本发明一实施例，提供一种中文语音信号处理方法，包括对待处理中文语音信号进行音节切分，得到该待处理中文语音信号包含的至少一个音节；确定所述至少一个音节中每个音节对应的基频曲线；增大所述基频曲线的斜率；合成所述斜率增大后的基频曲线对应的音节。根据本发明另一实施例，提供一种中文语音信号处理装置，该装置包括音节切分模块11，用于对待处理中文语音信号进行音节切分，得到该待处理中文语音信号包含的至少一个音节；基频曲线确定模块12，用于确定所述至少一个音节中每个音节对应的基频曲线；增强模块13，用于增大所述基频曲线的斜率；
合成模块14，用于合成所述斜率增大后的基频曲线对应的音节。根据本发明另一实施例，提供一种助听设备，该助听设备包括所述中文语音信号
处理装置。根据本发明实施方式，针对中文语音声调具有辨别词意的重要特性，通过增大中文语音信号中每个音节对应的基频曲线的斜率对每个音节对应的基频曲线进行调整，并可以通过调整后的基频曲线合成对应的音节，从而提高感音性耳聋患者对每个音节声调的识别率，进而提高感音性耳聋患者对中文语音的分辨能力。根据本发明实施方式，还包括确定合成的每个音节与对待处理中文语音信号进行音节切分获得的每个音节的对应关系，按照切分后获得的每个音节在所述待处理中文语音信号中的先后顺序，依次输出切分后获得的每个音节对应的合成后的音节的步骤，使得感音性耳聋患者可以完整地理解连续的中文语音信号的含义。根据本发明实施方式，可以利用以下方式中的一种确定待处理中文语音信号将设定时长内接收到的中文语音信号作为所述待处理中文语音信号，或者，对已接收到的中文语音信号进行端点检测，将检测出的每一段中文语音信号依次作为所述待处理中文语音信号。根据本发明实施方式，在确定每个音节对应的基频曲线时，具体可以获得一个音节在每个采样时刻的基频，利用获得的每个采样时刻的基频确定该音节对应的基频曲线。根据本发明实施方式，提供了一种具体的公式来增大基频曲线的斜率，并提供了一种具体的公式来增大基频曲线的斜率和平均值。根据本发明实施方式,可以根据音节对应的声调种类，增大基频曲线的斜率，从而可以针对每个声调种类分别确定对应的斜率增大方式，提高声调的识别率。

下面将通过参照附图详细描述本发明的优选实施例，使本领域的普通技术人员更清楚本发明的上述及其它特征和优点，附图中图1为根据本发明一实施例的中文语音信号处理方法的步骤流程图；图2(a)、图2(b)、图2(c)和图2(d)为根据本发明一实施例的基频曲线增大斜率和平均值前后的对照示意图；图3为本发明另一实施例的中文语音信号处理装置的结构示意图。
具体实施例方式
本发明实施例中，利用中文语音声调可以辨别词意的的特性，针对中文语音中的声调进行强调，从而提高使用者对中文语音的识别率。为使本发明的目的、技术方案和优点更加清楚，以下举实施例对本发明进一步详细说明。本发明一实施例提供一种中文语音信号处理方法，图1为该方法的步骤流程图，该方法包括步骤101、对待处理中文语音信号进行音节切分，得到该待处理中文语音信号中包含的至少一个音节。
本发明实施例提供的中文语音信号处理方法，可以是针对待处理中文语音信号中每个音节的处理方法，也可以是针对待处理中文语音信号中部分音节的处理方法。因此，需要将连续的待处理中文语音信号进行音节切分，从而获得该待处理中文语音信号包括的至少一个音节，以便于后续处理。在本实施例中，可以利用以下方式中的任意一种来确定一个待处理中文语音信号方式一、将设定时长内接收到的中文语音信号作为待处理中文语音信号。在这种确定待处理的中文语音信号的方式下，可以通过选择适当的设定时长，保证中文语音信号的实时处理，使得感音性耳聋患者可以及时获得声调增强之后的中文语音信息。该设定时间越短，越利于耳聋患者及时的接收到调整后的中文语音信息。方式二、对已接收到的中文语音信号进行端点检测，将检测出的每一段中文语音信号依次作为待处理中文语音信号。在通过端点检测方式来确定待处理中文语音信号时，确定出的待处理中文语音信号中去除了由于说话的间歇等原因形成的静音信号，从而可以仅对已接收到的中文语音信号中的有效语音信号进行处理，提高对中文语音信号的处理速度。中文语音信号可以是通过麦克风等声音输入设备接收，并经过模拟/数字(A/D)转换设备转换后得到的数字信号。步骤102、确定切分得到的至少一个音节中每个音节对应的基频曲线。中文语音中声调的变化在声学层面上的表现为基频的变化，也即基频曲线。因此，为了对中文语音的声调进行增强，以提高感音性耳聋患者对中文语音声调的识别率，可以对中文语音信号的基频曲线进行处理。本步骤中，可以针对切分得到的每个音节，确定该音节在每个采样时刻的基频，根据所述每个采样时刻的基频确定该音节对应的基频曲线。具体的，由于切分得到的每个音节对应的时间长度可能不同，因此，可以对切分得到的每个音节对应的时间长度进行归一化处理，并确定每个音节对应的基频曲线。步骤103、增大每个基频曲线的斜率。在本实施例中，可以通过增大基频曲线的斜率的方法来强调音节的声调特征。较优的，增大一个基频曲线的斜率可以为增大一个基频曲线的斜率和平均值，所述平均值是指该基频曲线在每个采样时刻的基频的平均值。具体的，可以通过以下公式，增大一个基频曲线的斜率FOnew (n) =CX (FOorigin (n) -FOmean)其中，η为正整数；F0new(n)表示增大后的基频曲线在第η个采样时刻的基频；FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频；Η)_η表示增大前的基频曲线的平均值；C表示斜率调整参数,且C大于I。具体的，可以通过以下公式，增大一个基频曲线的斜率和平均值FOnew (n) =CX (FOorigin (n) -FOmean) + (1+Μ) X FOmean
其中，η为正整数；FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频；FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频；FOmean表示增大前的基频曲线的平均值；C表示斜率调整参数,且C大于I ;M表示平均值调整参数，且M大于O。所述斜率调整参数C和平均值调整参数M均可以是通过声学测试的方法来确定的。所述斜率调整参数C和平均值调整参数M还可以因人而异，从而可以针对每个人的需要对中文语音的声调特征进行强调，提高其听到的中文语音的清晰度。以阴平、阳平、上声和去声四种声调为例，针对每种声调的音节，增大斜率和平均值前的基频曲线、增大斜率和平均值后的基频曲线的对照图可以如图2(a)至图2(d)所示。其中，图2(a)表示一个阴平声调的音节对应的基频曲线，在斜率和平均值增大前和增大后的对照示意图，图2(b)表示一个阳平声调的音节对应的基频曲线，在斜率和平均值增大前和增大后的对照示意图，图2(c)表示一个上声声调的音节对应的基频曲线，在斜率和平均值增大前和增大后的对照示意图，图2(d)表示一个去声声调的音节对应的基频曲线，在斜率和平均值增大前和增大后的对照示意图。步骤104、根据每个斜率增大后的基频曲线，分别合成每个处理后的基频曲线对应的音节。具体的，可以使用基于时域波形修改的语音合成算法基频同步叠加PSOLA(PitchSynchronous OverLap and Add)来实现音节的合成。步骤105、输出合成的每个音节。在本步骤中，为了保证感音性耳聋患者可以完整地理解连续的中文语音信号的含义，可以确定合成的每个音节与对待处理中文语音信号进行音节切分得到的每个音节的对应关系，按照切分得到的每个音节在所述待处理中文语音信号中的先后顺序，依次输出切分得到的每个音节对应的合成后的音节。根据中文语音中存在多种声调的特点，为了在强调音节的声调特征时能够有效提高声调增强的有效性，可以针对音节的声调种类来强调该音节的声调特征。则，较优的，在步骤101之后，步骤103之前，所述方法还可以进一步包括步骤102’，步骤102’与步骤102的执行不分先后步骤102’、确定每个音节的声调种类。所述声调种类可以是按照声调识别方法，确定出的阴平，阳平、上声和去声四种声调种类，也可以是先根据其他声调分类方法，确定出的声调种类。所述中文语音信号的声调种类可以是通过聚类分析方法确定的。在本实施例的方案包括确定音节的声调种类的步骤时，步骤103具体包括根据每个音节的声调种类，增大每个音节对应的基频曲线的斜率。如，在通过公式F0new(n) =CX (FOorigin(n)-FOmeJ+ (1+M) Xi7Omean 增大一个音节对应的基频曲线的斜率时，可以根据该音节的声调种类，来确定对应的斜率调整参数C和平均值调整参数Μ，从而增大该音节对应的基频曲线的斜率。
较优的，为了保证步骤105的顺利执行，在步骤102至步骤104中(包括步骤102’)，可以按照切分得到的每个音节在待处理中文语音信号中的先后顺序，在对一个音节确定基频曲线、确定声调种类、增大基频曲线的斜率以及合成该音节的操作完成后，继续对另一个音节进行相同的处理，即对待处理中文语音信号包含的每个音节，按照其先后顺序进行串行处理。当然，也可以将待处理中文语音信号包含的至少两个音节进行并行处理。本发明另一实施例提供一种中文语音信号处理装置，图3为该装置的结构示意图，该装置包括音节切分模块11用于对待处理中文语音信号进行音节切分，得到该待处理中文语音信号包含的至少一个音节；基频曲线确定模块12用于接收所述音节切分模块11进行音节切分后得到的音节，并确定所述至少一个音节中每个音节对应的基频曲线；增强模块13用于接收所述基频曲线确定模块12确定出的基频曲线，并增大所述基频曲线的斜率；合成模块14用于接收所述增强模块13增大斜率后的基频曲线，并合成所述斜率增大后的基频曲线对应的音节。该装置还可以包括输出模块15 输出模块15用于接收所述合成模块14合成的音节，并确定合成的每个音节与所述至少一个音节中每个音节的对应关系，按照所述至少一个音节中每个音节在所述待处理中文语音信号中的先后顺序，依次输出所述至少一个音节中每个音节对应的合成后的音节。具体的，所述输出模块15可以包括用于确定所述合成模块14合成的每个音节与所述至少一个音节中每个音节的对应关系，按照所述至少一个音节中每个音节在所述待处理中文语音信号中的先后顺序，依次将所述至少一个音节中每个音节对应的合成后的音节所对应的数字信号转换为模拟信号的D/A转换子模块151和将所述D/A转换子模块151转换后的模拟信号依次输出的语音输出子模块(如扬声器)152。所述装置还可以进一步包括待处理信号确定模块10 待处理信号确定模块10用于将设定时长内接收到的中文语音信号作为所述待处理中文语音信号，或者，对已接收到的中文语音信号进行端点检测，将检测出的每一段中文语音信号依次作为所述待处理中文语音信号，并将确定出的待处理中文语音信号提供给所述音节切分模块11。所述基频曲线确定模块12具体用于针对所述至少一个音节中的每个音节，获得该音节在每个采样时刻的基频，利用获得的每个采样时刻的基频确定该音节对应的基频曲线。所述增强模块13具体用于增大所述基频曲线的斜率和平均值，所述平均值是指该基频曲线在所述每个采样时刻的基频的平均值。所述增强模块13具体用于对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率FOnew (n) =CX (FOorigin (n) -FOmean)其中，n为正整数；F0new(n)表示增大后的基频曲线在第η个采样时刻的基频；
FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频；FOmean表示增大前的基频曲线的平均值；C表示斜率调整参数,且C大于I。所述增强模块13还可以具体用于对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率和平均值FOnew(n) =CX (FOorigin(n)-FOmean) + (1+Μ) XFOmean其中，η为正整数； FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频；FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频；R)_n表示增大前的基频曲线的平均值；C表示斜率调整参数,且C大于I ;M表示平均值调整参数,且M大于O。所述装置还可以进一步包括声调种类确定模块16用于接收所述音节切分模块11切分后的音节，并确定所述至少一个音节中每个音节的声调种类；所述增强模块13具体用于根据所述至少一个音节中每个音节的声调种类，增大该音节对应的基频曲线的斜率。如图2所示，所述装置还可以进一步包括用于接收语音输入的语音输入模块17 (如麦克风)，用于对所述语音输入模块17接收到语音进行模数转换的A/D转换模块18，且所述A/D转换模块18可以将模数转换后得到的中文语音信号提供给所述待处理信号确定模块10。所述合成模块14可以使用基于时域波形修改的语音合成算法基频同步叠加(PSOLA)来实现语音的合成。本发明另一实施例提供一种助听设备，该助听设备可以包括本发明实施例提供的中文语音信号处理装置，即该助听设备可以包括本发明实施例提供的中文语音信号处理装置的各功能模块，并执行相应的功能。本发明公开了一种中文语音信号处理方法、装置和助听设备，针对中文语音声调具有辨别词意的重要特性，通过增大中文语音信号中每个音节对应的基频曲线的斜率对每个音节对应的基频曲线进行调整，并可以通过调整后的基频曲线合成对应的音节，从而提高感音性耳聋患者对每个音节声调的识别率，进而提高感音性耳聋患者对中文语音的分辨能力。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种中文语音信号处理方法，所述方法包括对待处理中文语音信号进行音节切分，得到该待处理中文语音信号包含的至少一个音节; 确定所述至少一个音节中每个音节对应的基频曲线；增大所述基频曲线的斜率；合成所述斜率增大后的基频曲线对应的音节。
2.如权利要求1所述的方法，其中，所述方法适用于助听设备；所述合成所述斜率增大后的基频曲线对应的音节之后，所述方法进一步包括确定合成的每个音节与所述至少一个音节中每个音节的对应关系；按照所述至少一个音节中每个音节在所述待处理中文语音信号中的先后顺序，依次输出所述至少一个音节中每个音节对应的合成后的音节。
3.如权利要求1所述的方法，其中，在所述对待处理中文语音信号进行音节切分之前，所述方法进一步包括将设定时长内接收到的中文语音信号作为所述待处理中文语音信号；或者对已接收到的中文语音信号进行端点检测，将检测出的每一段中文语音信号依次作为所述待处理中文语音信号。
4.如权利要求1所述的方法，其中，所述确定所述至少一个音节中每个音节对应的基频曲线，包括针对所述至少一个音节中的每个音节，获得该音节在每个采样时刻的基频；利用获得的每个采样时刻的基频确定该音节对应的基频曲线。
5.如权利要求4所述的方法，其中，所述增大所述基频曲线的斜率，具体包括增大所述基频曲线的斜率和平均值，所述平均值是指该基频曲线在所述每个采样时刻的基频的平均值。
6.如权利要求4所述的方法，其中，所述增大所述基频曲线的斜率，包括对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率FOnew(n) = CX (FOorigin(n)-FOmeJ 其中， η为正整数； FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频； FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频； Η)_η表示增大前的基频曲线的平均值； C表示斜率调整参数，且C大于I。
7.如权利要求5所述的方法，其中，所述增大所述基频曲线的斜率和平均值，包括对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率和平均值FOnew(n) = CX (FOorigin(n)-FOmeJ+ (1+M) XFOmean其中， η为正整数； FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频；FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频； Η)_η表示增大前的基频曲线的平均值； C表示斜率调整参数，且C大于I ; M表示平均值调整参数，且M大于O。
8.如权利要求1至7中任一项所述的方法，其中，在所述增大所述基频曲线的斜率之前，所述方法进一步包括确定所述至少一个音节中每个音节的声调种类；所述增大所述基频曲线的斜率，具体包括根据所述至少一个音节中每个音节的声调种类，增大该音节对应的基频曲线的斜率。
9.一种中文语音信号处理装置，所述装置包括音节切分模块(11)，用于对待处理中文语音信号进行音节切分，得到该待处理中文语音信号包含的至少一个音节；基频曲线确定模块(12)，用于确定所述至少一个音节中每个音节对应的基频曲线；增强模块(13)，用于增大所述基频曲线的斜率；合成模块(14)，用于合成所述斜率增大后的基频曲线对应的音节。
10.如权利要求9所述的装置，其中，所述装置进一步包括输出模块(15)，用于确定合成的每个音节与所述至少一个音节中每个音节的对应关系，按照所述至少一个音节中每个音节在所述待处理中文语音信号中的先后顺序，依次输出所述至少一个音节中每个音节对应的合成后的音节。
11.如权利要求9所述的装置，其中，所述装置进一步包括待处理信号确定模块(10)，用于将设定时长内接收到的中文语音信号作为所述待处理中文语音信号，或者，对已接收到的中文语音信号进行端点检测，将检测出的每一段中文语音信号依次作为所述待处理中文语音信号。
12.如权利要求9所述的装置，其中，所述基频曲线确定模块(12)，具体用于针对所述至少一个音节中的每个音节，获得该音节在每个采样时刻的基频，利用获得的每个采样时刻的基频确定该音节对应的基频曲线。
13.如权利要求12所述的装置，其中，所述增强模块(13)，具体用于增大所述基频曲线的斜率和平均值，所述平均值是指该基频曲线在所述每个采样时刻的基频的平均值。
14.如权利要求12所述的装置，其中，所述增强模块(13)，具体用于对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率FOnew(n) = CX (FOorigin(n)-FOmeJ其中， η为正整数； FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频； FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频； Η)_η表示增大前的基频曲线的平均值； C表示斜率调整参数，且C大于I。
15.如权利要求13所述的装置，其中，所述增强模块(13)，具体用于对于所述基频曲线中的每一个基频曲线，通过以下公式增大该基频曲线的斜率和平均值FOnew(η) = CX (FOorigin(η)-FOmeJ+ (1+M) XFOmean其中，η为正整数；FOnew(η)表示增大后的基频曲线在第η个采样时刻的基频；FOorigin(η)表示增大前的基频曲线在第η个采样时刻的基频；Η)_η表示增大前的基频曲线的平均值；C表示斜率调整参数，且C大于I ;M表示平均值调整参数，且M大于O。
16.一种助听设备，该助听设备包括如权利要求9至15中任一项所述的装置。
全文摘要
本发明公开了一种中文语音信号处理方法、装置和助听设备，针对中文语音声调具有辨别词意的重要特性，通过增大中文语音信号中每个音节对应的基频曲线的斜率对每个音节对应的基频曲线进行调整，并可以通过调整后的基频曲线合成对应的音节，从而提高感音性耳聋患者对每个音节声调的识别率，进而提高感音性耳聋患者对中文语音的分辨能力。
文档编号G10L25/00GK103035237SQ20111030008
公开日2013年4月10日申请日期2011年9月30日优先权日2011年9月30日
发明者杨晨, 蔡莲红, 周卫申请人:西门子公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨晨;蔡莲红;周卫
技术所有人：西门子公司
我是此专利的发明人

上一篇：语言模型训练方法及系统的制作方法
上一篇：一种机顶盒的声控方法及机顶盒的制作方法