基于元学习的小样本无参考源语音质量评价方法及装置

文档序号：33907736发布日期：2023-04-21 12:01阅读：48来源：国知局

本发明涉及语音质量评价，尤其涉及基于元学习的小样本无参考源语音质量评价方法及装置。

背景技术：

1、语音质量好坏是评价语音通信系统优劣的重要标准之一。语音质量评价一般分为主观评价方法和客观评价方法。主观评价方法依靠评听者意见对语音质量做出判决，是直接反映用户对系统好坏的观点，其中itu-t建议p.830提出的mos(mean opinion score)是一种广泛使用的主观评价方法。但是，主观评价方法重复性差，难以组织实施不够灵活，容易受人的主观因素影响，不利于在生产过程和现场实验中应用。

2、客观评价方法杜绝了人为因素可能产生的影响，针对语音信号的特定特征，采用信号处理的方式实现语音质量的评价过程。客观评价方法根据是否需要参考源信号(干净语音)分为有参考源(intrusive)客观评价方法和无参考源(non-intrusive)客观评价方法。有参考源客观评价方法以语音系统的输入信号和输出信号之间的误差大小判别语音质量的好坏，是一种误差度量，其中itu-t建议p.862提出的pesq感知语音质量评价是目前性能较好的有参考源客观评价方法，能够较好的识别通信时延，环境噪声和错误。然而，pesq以及其他有参考源客观评价方法需要使用输入语音(干净语音)作为参考，不能在只有失真信号的应用领域中使用。

3、itu-t建议p.563是目前无参考源客观评价方法的标准，能够应用于无参考信号的voip和电信网络性能的监测，但其运算复杂度高，不利于实时评价语音质量，且评价性能不及pesq。基于统计模型的客观评价方法主要基于高斯混合模型(gmm)和矢量量化(vectorquantization)，该类方法在模型训练过程中将干净语音训练为参考模型和参考码本，测试时将失真语音与参考模型与参考码本进行失真计算，误差结果映射为最终的客观质量评分。基于统计模型在模型训练过程中不仅需要大量的干净语音数据，而且其评价性能与pesq相差较大。目前主流的深度学习的无参考源音质客观评价方法需要大量的训练数据来获得好的模型，并且仅针对常见的失真条件。而实际应用中，音质评价面对的语音编码器和环境噪声造成的失真条件复杂多样，为每类可能遇到的失真情况收集足量的有标签训练样本并不容易，大规模语音训练数据库的构建成本较高。

技术实现思路

1、本发明的目的是为了至少解决现有技术的不足之一，提供基于元学习的小样本无参考源语音质量评价方法及装置。

2、为了实现上述目的，本发明采用以下的技术方案，

3、具体的，提出基于元学习的小样本无参考源语音质量评价方法，包括以下：

4、基于深度神经网络模型构建元学习器；

5、获取语音样本任务集，所述语音样本任务集通过n类k样本策略进行采样构建；

6、以任务作为基本单位将所述语音样本任务集划分为多个任务，每个任务为一类信道失真以及环境噪声污染的语音样本集合，所述语音样本集合∈语音样本任务集；

7、对所述元学习器进行训练，所述元学习器的训练以任务为基本单位，所述元学习器的参数在多个训练任务的基础上通过随机梯度下降方法计算获得；

8、对所述元学习器进行测试，将未参与训练的任务定义为新任务，采用新任务里支持集的语音样本训练元学习器来获得新任务对应的模型参数，并采用新任务里查询集的语音样本进行测试；

9、基于完成测试的元学习器进行语音质量客观评价。

10、进一步，具体的，基于深度神经网络模型构建元学习器，包括，

11、所述元学习器fθ采用10卷积层的全卷积神经网络构建，θ为模型参数，其中包括5个编码模块，当中卷积层当中的卷积核大小为6x6，步长为(2，2)，通道数为90；包括5个解码模块，当中卷积层当中卷积核大小为7x5，步长为(2，2)，通道数为90。

12、进一步，具体的，获取语音样本任务集，所述语音样本任务集通过n类k样本策略进行采样构建，包括，

13、采用多种信道失真和环境噪声污染的语音失真样本构建训练库dtrain，并从dtrain利用n类k样本策略采样m个元训练任务t＝{t1,t2...,tm}，其中每个元训练任务ti包含支持集si和查询集qi，支持集si＝{ν11,νi2...,νis}＝{(xi1,yi1),(xi2,yi2)...,(xis,yis)}，其中s＝1:|si|，xis为失真语音训练样本，yis为样本的对应语音质量评分，

14、dtrain的训练样本包含c1种语音失真条件，首先从c1中随机采样含c2种失真条件的样本，c1＞c2，表示为c，这样从dtrain中获得了子集dc，然后，从dc中随机采样c2×k个样本构建支持集si，最后，从dc剩下的样本中随机采样p个样本构建查询集qi，组合支持集si和查询集qi构建完整的元训练任务ti，任务采样的流程定义如下：

15、(1)c←随机采样(c1，c2)；

16、(2)si←随机采样(dc，c2×k)；

17、(3)qi←随机采样(dc-si,p)；

18、(4)ti←si+qi；

19、(5)重复步骤(1)-(4)m次。

20、进一步，具体的，对所述元学习器进行训练，包括，

21、对于ti任务，将其支持集si的语音样本作为元学习器的输入，ti任务的模型的损失函数定义为元学习器输出和标签之间的均方误差：

22、

23、在不同训练任务基础上，采用随机梯度下降方法学习元学习器模型参数θ：

24、

25、其中β是元学习器的学习率，p(t)是元训练任务的分布。

26、进一步，具体的，对所述元学习器进行测试，包括，

27、新任务tmt的模型参数只需利用其支持集的语音样本在元学习器θ基础上更新来获得：

28、

29、其中α是元学习器的学习率，

30、tmt里查询集的语音样本xq的音质评分yq通过新任务tmt更新后的模型计算：

31、

32、本发明还提出基于元学习的小样本无参考源语音质量评价装置，包括：

33、元学习器构建模块，用于基于深度神经网络模型构建元学习器；

34、数据集获取模块，用于获取语音样本任务集，所述语音样本任务集通过n类k样本策略进行采样构建；

35、任务划分模块，用于以任务作为基本单位将所述语音样本任务集划分为多个任务，每个任务为一类信道失真以及环境噪声污染的语音样本集合，所述语音样本集合∈语音样本任务集；

36、模型训练模块，用于对所述元学习器进行训练，所述元学习器的训练以任务为基本单位，所述元学习器的参数在多个训练任务的基础上通过随机梯度下降方法计算获得；

37、模型测试模块，用于对所述元学习器进行测试，将未参与训练的任务定义为新任务，采用新任务里支持集的语音样本训练元学习器来获得新任务对应的模型参数，并采用新任务里查询集的语音样本进行测试；

38、质量评价模块，用于基于完成测试的元学习器进行语音质量客观评价。

39、本发明的有益效果为：

40、本发明提出基于元学习的小样本无参考源语音质量评价方法，一方面通过元学习的学会学习能力，本发明从不同音质评价训练任务中学习使元学习器获得较好的泛化能力，从而在面对全新未知的小样本语音失真数据时，能快速有效地完成模型的更新。与其他无参考源客观评价方法相比，本发明在小样本条件下获得较高的主客观评价相关度；另一方面，相对于主流的基于统计模型的无参考源客观评价方法，本发明直接通过元学习器计算客观质量评分，并不需要大量的干净语料训练统计模型，使得算法适用于干净语料缺乏的无参考源客观评价应用领域。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周伟力赖锦雄廖粤涛纪锐杰
技术所有人：佛山科学技术学院
我是此专利的发明人

上一篇：一种轨道交通防护站台门的制作方法
上一篇：一种电芯焊接用的固定机构的制作方法