本申请涉及智能家居,尤其涉及一种智能家电语音性能测试方法、装置、存储介质及电子装置。
背景技术:
1、随着人工智能技术的兴起,各种人工智能设备也开始进入千家万户。从前对普通人可望不可即的人工智能概念,现在已经具化成音箱、眼镜和扫地机等智能家居,成为人们生活中必不可少的一部分。语音交互作为用户最常使用的智能家电的功能,对于各种不同复杂使用场景下的成功率和准确率的要求也越来越高。这就使得对于语音测试的环境要求也越来越复杂和严格,相应的,语音自动化测试的难度也逐步提高。
2、智能家电语音自动化测试主要包括唤醒成功率、唤醒时延、交互成功率和交互时延等指标。目前的测试原理是在播放唤醒和交互语料的同时开启录制进程,将语料和智能家电语音回复录制为一段音频,然后通过分析音频来判断小优是否应答成功,若成功,便分析计算应答时延。
3、当前计算时延的方法普遍是根据音频采样的音量高低来区分某段区间是否为时延区段,但是由于在测试过程中,为了模拟真实的用户使用场景,测试人员会放置多个噪声源参与测试,这就导致录制的音频内存在大量噪声信息,不能单纯根据是否有声音以及声音音量高低来判断测试对象是否应答。
技术实现思路
1、本申请提供一种智能家电语音性能测试方法、装置、存储介质及电子装置,用以解决现有技术中语音测试过程中受噪声干扰导致被测设备识别不准确的缺陷,实现准确识别语料或智能回复,提高语音测试的准确性。
2、本申请提供一种智能家电语音性能测试方法,包括:利用声纹识别,提取在先获取的待测试语音中的语言片段,得到对应语音片段;其中,语言片段用于表征待测试语音中包含语言的声音片段;对各个语音片段进行特征提取,得到对应声音特征;将声音特征与模板声源进行匹配,确定各个语音片段的声源类型,声源类型包括语料声源和智能家居声源;根据各个语音片段的声源类型,确定智能家居是否应答。
3、根据本申请提供的一种智能家电语音性能测试方法,利用声纹识别,提取在先获取的待测试语音中的语言片段,得到对应语音片段,包括:将待测试语音输入至语音分割模型中,得到语音分割模型输出的语音片段;其中,语音分割模型是基于多声源训练样本和多声源训练样本对应的标签训练得到的;语音分割模型用于基于输入的待测试语音进行声纹特征提取,并基于提取的特征进行声纹识别,以及根据声纹识别结果对待测试语音进行语音分割,得到对应语音片段。
4、根据本申请提供的一种智能家电语音性能测试方法,将待测试语音输入至语音分割模型中,得到语音分割模型输出的语音片段,包括:将待测试语音输入至语音分割模型中,以对待测试语音进行声纹特征提取,得到声纹特征;对声纹特征进行声纹识别,得到声源识别结果;根据声源识别结果,按预设声源对待测试语音进行分割,得到对应预设声源的语音片段。
5、根据本申请提供的一种智能家电语音性能测试方法,在对各个语音片段进行特征提取,得到对应声音特征之后,包括:将各声音特征以向量的形式存储至预设声音数组中。
6、根据本申请提供的一种智能家电语音性能测试方法,在将声音特征与模板声源进行匹配之前,包括:基于预设触发条件,激活声音数组,以获取对应声音特征。
7、根据本申请提供的一种智能家电语音性能测试方法,根据各个语音片段的声源类型,确定智能家居是否应答,包括:若各个语音片段的声源类型仅存在语料声源,则确定智能家居未应答、唤醒或交互失败;若各个语音片段的声源类型存在语料声源和智能家居声源,则基于语料声源对应的语音片段与智能家居声源对应的语音片段之间的时延非零,确定智能家居应答、唤醒或交互成功。
8、根据本申请提供的一种智能家电语音性能测试方法,在基于语料声源对应的语音片段与智能家居声源对应的语音片段之间的时延非零,确定智能家居应答、唤醒或交互成功之前,包括:根据语音片段的声源类型,确定语料声源对应的语音片段与智能家居声源对应的语音片段之间的音频差值,得到时延。
9、本申请还提供一种智能家电语音性能测试装置,包括:声纹识别模块,利用声纹识别,提取在先获取的待测试语音中的语言片段,得到对应语音片段;其中,语言片段用于表征待测试语音中包含语言的声音片段;特征提取模块,对各个语音片段进行特征提取,得到对应声音特征;声源匹配模块,将声音特征与模板声源进行匹配,确定各个语音片段的声源类型,声源类型包括语料声源和智能家居声源;应答判断模块,根据各个语音片段的声源类型,确定智能家居是否应答。
10、本申请还提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行实现如上述任一种所述智能家电语音性能测试方法。
11、本申请还提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行实现如上述任一种所述智能家电语音性能测试方法。
12、本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述智能家电语音性能测试方法。
13、本申请提供的智能家电语音性能测试方法、装置、存储介质及电子装置,通过声纹识别,提取待测试语音中的语言片段,以对噪声、蜂鸣器等非语言片段进行过滤,确保只提取语言的声音片段,提高对语言的识别能力,并针对各语音片段进行特征提取,以利用提取的声音特征与模板声源进行匹配,进而确定提取的语言片段对应声源类型,以根据声源类型,确定智能家居是否应答,在避免噪声干扰的情况下,准确识别语音片段的声源,提高语音测试的准确性。
1.一种智能家电语音性能测试方法,其特征在于,包括:
2.根据权利要求1所述的智能家电语音性能测试方法,其特征在于,所述利用声纹识别,提取在先获取的待测试语音中的语言片段,得到对应语音片段,包括:
3.根据权利要求2所述的智能家电语音性能测试方法,其特征在于,将所述待测试语音输入至语音分割模型中,得到所述语音分割模型输出的语音片段,包括:
4.根据权利要求1所述的智能家电语音性能测试方法,其特征在于,在对各个所述语音片段进行特征提取,得到对应声音特征之后,包括:
5.根据权利要求4所述的智能家电语音性能测试方法,其特征在于,在将所述声音特征与模板声源进行匹配之前,包括:
6.根据权利要求1所述的智能家电语音性能测试方法,其特征在于,根据各个所述语音片段的声源类型,确定智能家居是否应答,包括:
7.根据权利要求6所述的智能家电语音性能测试方法,其特征在于,在所述基于所述语料声源对应的语音片段与所述智能家居声源对应的语音片段之间的时延非零,确定所述智能家居应答、唤醒或交互成功之前,包括:
8.一种智能家电语音性能测试装置,其特征在于,包括:
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。