一种短波地空语音质量评价方法、装置及存储介质与流程

文档序号：35972147发布日期：2023-11-09 13:24阅读：43来源：国知局

本发明属于语音质量评价，具体涉及一种短波地空语音质量评价方法、装置及存储介质。

背景技术：

1、常用的语音质量评价可分为主观评价方式和客观评价方式。当前常用的主观评价方式为是绝对等级评分acr(absolute category rating)方法，该方法受主观因素影响很大，且评估标准不统一，容易存在较大的评估误差。由于短波地空通信话音背景噪声很大，使用5级话音质量评价方法acr很难区分出相邻分值间细微的差别，因此5级评价标准不适用于短波地空话音质量评估。

2、语音质量客观评估方法通过运行评估算法来评测语音质量，该方法无法实时获得纯净的话音输入作为参考，因此只能依靠“输出”来对短波地空话音信号质量进行判断；容易导致存在较大的评估误差。

技术实现思路

1、本发明提供了一种短波地空语音质量评价方法、装置及存储介质，对高噪声短波地空语音质量的无参考客观实时评价，降低了对短波地空语音质量的评估误差并且提高了评价效率。

2、为达到上述目的，本发明所采用的技术方案是：

3、本发明第一方面提供了一种短波地空语音质量评价方法，包括：

4、采集实时短波地空话音信号并进行预处理后，根据时域能量值将预处理后的实时短波地空话音信号分为含噪人声部分和静噪部分；由所述含噪人声部分中提取前导无话段；根据所述含噪人声部分的前导无话段计算出噪声平均功率谱值pn(k)；去除实时短波地空话音信号中的静噪部分获得短波地空话音信号y(m)，所述短波地空话音信号y(m)包含l段含噪人声话音信号；

5、对每段含噪人声话音信号分别进行加窗分帧处理和快速傅里叶变换获得频域的含噪人声话音信号，计算第l段第i帧含噪人声话音信号的幅度谱yil(k)和相位谱

6、调用vad函数将频域的含噪人声话音信号分为有话帧数据和无话帧数据；根据噪声平均功率谱值pn(k)修正无话帧数据的噪声平均功率谱值λd(k)；

7、利用幅度谱yil(k)和噪声平均功率谱值λd(k)计算有话帧数据的后验信噪比γi(k)，基于后验信噪比γi(k)计算先验信噪比通过先验信噪比推导出所述有话帧数据对应的维纳滤波器；

8、将有话帧数据的幅度谱yil(k)输入至所述维纳滤波器获得幅度谱使用幅度谱和相位谱进行傅里叶逆变换获得减噪后的时域短波话音信号

9、对短波话音信号利用子带谱熵法进行话音激活检测获得含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise；根据含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise；将短波地空话音信号y(m)分为含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)；基于含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)计算信噪比snr，基于信噪比snr对实时短波地空话音信号进行评价。

10、优选的，对实时短波地空话音信号进行预处理方法包括：

11、将实时短波地空话音信号输入高通滤波器进行预加重处理，表达公式为：

12、x(n)＝x0(n)-ax0(n-1)

13、公式中，x0(n)表示为第n次采集的实时短波地空话音信号，x0(n-1)表示为第n-1次采集的实时短波地空话音信号；x(n)表示为预加重处理后的实时短波地空话音信号；a表示为设定的权重值；

14、对短波地空话音信号x(n)进行分帧加窗处理获得预处理后的实时短波地空话音信号。

15、优选的，根据时域能量值将预处理后的实时短波地空话音信号分为含噪人声部分和静噪部分的方法包括：

16、计算预处理后的实时短波地空话音信号中每帧短波语音信号的短时能量均方根值，表达公式为：

17、

18、公式中，xi(j)表示第i帧短波话音信号第j个采样点的时域能量值，ei表示预处理后的实时短波地空话音信号中第i帧的短时能量均方根值；n表示为采样点的数量；

19、计算能量阈值η，表达公式为：

20、η＝aemax+bemin

21、公式中，emax为各短时能量均方根值ei中的最大值，emin为各短时能量均方根值ei中的最小值，a为最大值emax的比例系数，b为最小值emin的比例系数；

22、将短时能量均方根值ei与能量阈值η进行对比，若短时能量均方根值ei大于能量阈值η，将预处理后的实时短波地空话音信号中第i帧短波话音信号分为含噪人声部分；若短时能量均方根值ei小于能量阈值η，将预处理后的实时短波地空话音信号中第i帧短波话音信号分为静噪部分。

23、优选的，比例系数a和比例系数b的确定方法包括：

24、设置比例系数a的初始值为a0，比例系数b的初始值为b0，比例系数a的迭代步长为sa，比例系数b的迭代步长为sb；

25、计算比例系数a和比例系数b的迭代次数，表达公式为：

26、和

27、公式中，p表示为比例系数a的迭代次数；q表示为比例系数b的迭代次数；表示向下取整；

28、计算能量阈值η的可能取值，表达公式为：

29、ηpq＝apemax+bqemin

30、ap＝a0+psa

31、bq＝b0+qsb

32、公式中，ηpq表示为能量阈值η的可能取值；ap表示为第p个比例系数a的可能取值，p表示为比例系数a的可能取值的序号；bq表示为第q个比例系数b的可能取值，q表示为比例系数b的可能取值的序号；

33、根据各可能取值ηpq计算平均值选取最接近且大于平均值的可能取值ηpq作为能量阈值η的最优值，将能量阈值η的最优值对应的可能取值ap和可能取值bq作为最终确认的比例系数a和比例系数b。

34、优选的，利用幅度谱yil(k)和噪声平均功率谱值λd(k)计算有话帧数据的后验信噪比γi(k)，基于后验信噪比γi(k)计算先验信噪比的方法包括：

35、

36、

37、公式中，α表示为平滑参数。

38、优选的，通过先验信噪比推导出所述有话帧数据对应的维纳滤波器，将有话帧数据的幅度谱yil(k)输入至所述维纳滤波器获得幅度谱表达公式为：

39、

40、

41、公式中，hi(k)表达为第i帧的维纳滤波器函数。

42、优选的，根据含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)计算信噪比snr的方法包括：

43、根据含噪人声部分yvoice+noise(m)计算短时能量均值evoice+noise，表达公式为：

44、

45、根据纯噪声部分ynoise(m)计算短时能量均值enoise，表达公式为：

46、

47、短时能量均值enoise和短时能量均值evoice+noise计算信噪比snr，表达公式为：

48、

49、公式中，表示为含噪人声部分yvoice+noise(m)中第t帧第k个采样点的时域短时能量值；n表示为每一帧中的采样点数；fvoice+noise表示为含噪人声部分yvoice+noise(m)的总帧数；表示为纯噪声部分ynoise(m)中第g帧第k个采样点的时域短时能量值；fnoise表示为纯噪声部分ynoise(m)的总帧数。

50、优选的，基于信噪比snr对实时短波地空话音信号进行评价的方法包括：

51、由数据库中获取历史短波地空话音信号，所述历史短波地空话音信号分为三个等级；

52、计算历史短波地空话音信号的信噪比snr，将历史短波地空话音信号的三个等级与snr值建立一一对应的量化评价阈值；

53、根据量化评价阈值对实时短波地空话音信号进行分级，完成对实时短波地空话音信号的评价。

54、本发明第二方面提供了一种短波地空语音质量评价装置，包括：

55、预处理单元，用于采集实时短波地空话音信号并进行预处理后，根据时域能量值将预处理后的实时短波地空话音信号分为含噪人声部分和静噪部分；由所述含噪人声部分中提取前导无话段；根据所述含噪人声部分的前导无话段计算出噪声平均功率谱值pn(k)；去除实时短波地空话音信号中的静噪部分获得短波地空话音信号y(m)，所述短波地空话音信号y(m)包含l段含噪人声话音信号；

56、加窗分帧单元，用于对每段含噪人声话音信号进行加窗分帧处理和快速傅里叶变换获得频域的含噪人声话音信号，分别计算第l段第i帧的含噪人声话音信号的幅度谱yil(k)和相位谱调用vad函数将频域的含噪人声话音信号分为有话帧数据和无话帧数据；

57、降噪单元，用于根据噪声平均功率谱值pn(k)修正无话帧数据的噪声平均功率谱值λd(k)；利用幅度谱yil(k)和噪声平均功率谱值λd(k)计算有话帧数据的后验信噪比γi(k)，基于后验信噪比γi(k)计算先验信噪比通过先验信噪比推导出所述有话帧数据对应的维纳滤波器；将有话帧数据的幅度谱yil(k)输入至所述维纳滤波器获得幅度谱使用幅度谱和相位谱进行傅里叶逆变换获得减噪后的时域短波话音信号

58、评价单元，用于对短波话音信号利用子带谱熵法进行话音激活检测获得含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise；根据含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise将短波地空话音信号y(m)分为含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)；基于含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)计算信噪比snr，基于信噪比snr对实时短波地空话音信号进行评价。

59、本发明第三方面提供了计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述短波地空语音质量评价方法的步骤。

60、与现有技术相比，本发明的有益效果：根据时域能量值将预处理后的实时短波地空话音信号分为含噪人声部分和静噪部分，合理设定阈值，有效区分静噪部分和准话音部分，并将静噪部分去除，只保留含噪人声部分，有效降低了后续处理的短波地空话音数据量，提高了短波地空语音质量评价的针对性和有效性。

61、本发明对所述含噪人声话音信号进行加窗分帧处理和快速傅里叶变换获得频域的含噪人声话音信号；计算含噪人声话音信号的幅度谱yil(k)和相位谱将有话帧数据的幅度谱yil(k)输入至所述维纳滤波器获得幅度谱使幅度谱和相位谱后进行傅里叶逆变换获得时域的短波话音信号对短波话音信号每一段每一帧信号进行维纳滤波法降噪；通过对所述含噪人声话音信号进行降噪，使短波地空话音信号的评价根据准确客观。

62、本发明对短波话音信号利用子带谱熵法进行话音激活检测获得含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise；对短波话音信号每一段每一帧信号进行子带谱熵法话音激活检测后，根据含噪人声帧标记labelvoice+noise和纯噪声帧标记labelnoise将短波地空话音信号y(m)分为含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)；基于含噪人声部分yvoice+noise(m)和纯噪声部分ynoise(m)计算信噪比snr，基于信噪比snr对实时短波地空话音信号进行评价，对高噪声短波地空语音质量的无参考客观实时评价，降低了对短波地空语音质量的评估误差并且提高了评价效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪晗李瑞王坤胡绘斌汤强晋
技术所有人：中国人民解放军94860部队
我是此专利的发明人

上一篇：一种燃料电池整车尾排处理系统的制作方法
上一篇：用于高电压存储器的冷却器的可插接的接头元件的制作方法