语音处理方法、装置、存储介质以及计算机设备与流程

文档序号：35357371发布日期：2023-09-08 00:37阅读：20来源：国知局

本申请涉及语音，具体而言，涉及一种语音处理方法、装置、存储介质和计算机设备。

背景技术：

1、随着语音技术的蓬勃发展，越来越多的电子设备都具有语音识别、语音通话以及语音控制等基于语音技术实现的相关功能。由于日常生活会存在各式各样的语音，则电子设备所采集到的语音帧必定包含着一定量的噪声，而这些噪声均会在一定程度上影响电子设备的相关功能。因此，现有技术中，电子设备采集到语音帧后，会对语音帧进行降噪处理。

技术实现思路

1、本申请提供一种语音处理方法、装置、存储介质以及计算机设备，可以解决如何提高目标语音帧的清晰度的技术问题。

2、第一方面，本申请实施例提供一种语音处理方法，该方法包括：

3、在语音信号中采集初始语音帧，获取所述初始语音帧对应的初始频谱以及全局语音存在概率，基于所述初始频谱获取初始功率谱，所述初始功率谱包括多个频点以及所述多个频点中各频点的功率值；

4、基于所述初始功率谱，在所述多个频点中确定满足噪声渐强阶段的各目标频点，并获取所述各频点对应的局部语音存在概率；

5、基于所述全局语音存在概率，对所述各目标频点对应的局部语音存在概率进行概率修正，得到所述各目标频点对应的目标语音存在概率；

6、基于所述各目标频点对应的目标语音存在概率以及其它频点对应的局部语音存在概率，获取所述各频点对应的增益因子，所述其它频点为所述多个频点中未处于噪声渐强阶段的频点；

7、基于所述各频点对应的增益因子，对所述初始频谱进行增益处理，得到目标频谱，基于所述目标频谱生成所述初始语音帧对应的目标语音帧。

8、第二方面，本申请实施例提供一种语音处理装置，包括：

9、功率谱获取模块，用于在语音信号中采集初始语音帧，获取所述初始语音帧对应的初始频谱以及全局语音存在概率，基于所述初始频谱获取初始功率谱，所述初始功率谱包括多个频点以及所述多个频点中各频点的功率值；

10、频点确定模块，用于基于所述初始功率谱，在所述多个频点中确定满足噪声渐强阶段的各目标频点；

11、概率获取模块，用于获取所述各频点对应的局部语音存在概率；

12、概率修正模块，用于基于所述全局语音存在概率，对所述各目标频点对应的局部语音存在概率进行概率修正，得到所述各目标频点对应的目标语音存在概率；

13、因子获取模块，用于基于所述各目标频点对应的目标语音存在概率以及其它频点对应的局部语音存在概率，获取所述各频点对应的增益因子，所述其它频点为所述多个频点中未处于噪声渐强阶段的频点；

14、语音帧生成模块，用于基于所述各频点对应的增益因子，对所述初始频谱进行增益处理，得到目标频谱，基于所述目标频谱生成所述初始语音帧对应的目标语音帧。

15、第三方面，本申请实施例提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序适于由处理器加载并执行上述方法的步骤。

16、第四方面，本申请实施例提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述的方法的步骤。

17、在本申请实施例中，通过先识别出功率谱中处于噪声渐强阶段中的目标频点，然后基于初始语音帧的全局语音存在概率，针对性地对目标频点对应的局部语音存在概率进行概率修正，提高了各频点对应的局部语音存在概率的准确度，从而提高基于局部语音存在概率计算得到的增益因子的准确度，进而减少了基于初始语音帧得到的目标语音帧中残留的噪声信号以及语音失真的情况，提高了目标语音帧的清晰度。

技术特征：

1.一种语音处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述初始功率谱，在所述多个频点中确定满足噪声渐强阶段的各目标频点，包括：

3.根据权利要求2所述的方法，其特征在于，还包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述第二频点所属语音帧的语音帧位置和所述当前语音周期中的设定位置范围，确定目标语音周期中所述第一频率指示的第三频点对应的音频阶段，包括：

5.根据权利要求2所述的方法，其特征在于，所述获取所述各频点对应的局部语音存在概率，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一频点的功率值以及所述第二最小功率值获取所述第一频点对应的局部语音存在概率，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述各目标频点对应的目标语音存在概率以及其它频点对应的局部语音存在概率，获取所述各频点对应的增益因子，包括：

8.根据权利要求1所述的方法，其特征在于，所述在语音信号中采集初始语音帧，获取所述初始语音帧对应的初始频谱以及全局语音存在概率，基于所述初始频谱获取初始功率谱，所述初始功率谱包括多个频点以及所述多个频点中各频点的功率值，包括：

9.一种语音处理装置，其特征在于，包括：

10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的语音处理方法。

11.一种计算机设备，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1-8任意一项所述的语音处理方法的步骤。

技术总结
本申请公开了一种语音处理方法、装置、存储介质和计算机设备，方法包括：在语音信号中采集初始语音帧，获取初始语音帧对应的初始频谱和全局语音存在概率，基于初始频谱获取初始功率谱；基于初始功率谱确定噪声渐强阶段的各目标频点，获取各频点对应的局部语音存在概率；基于全局语音存在概率，对各目标频点对应的局部语音存在概率进行概率修正，得到各目标频点对应的目标语音存在概率；基于各目标频点对应的目标语音存在概率和其它频点对应的局部语音存在概率获取各频点对应的增益因子；基于各频点对应的增益因子，对初始频谱进行增益处理得到目标频谱，基于目标频谱生成初始语音帧对应的目标语音帧。采用本申请，提高目标语音帧的清晰度。

技术研发人员：鄢聪
受保护的技术使用者：广州视源电子科技股份有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鄢聪
技术所有人：广州视源人工智能创新研究院有限公司
我是此专利的发明人

上一篇：一种环保型工业炉的制作方法
上一篇：一种移动储能应急供电装置的制作方法