一种智能设备的打断唤醒的测试方法和装置与流程

文档序号：36311308发布日期：2023-12-07 14:21阅读：74来源：国知局

本发明涉及人工智能，尤其涉及一种智能设备的打断唤醒的测试方法和装置。

背景技术：

1、智能设备是指任何一种具有计算处理能力的设备、器械或者机器，通常可以根据图像、语音、手势等识别的指令运行，适用于家居、医疗、教育、交通、办公、娱乐、金融等各种领域。

2、现有的智能设备(如智能音箱)打断唤醒测试中，通常是由测试人员随机下载一些音频文件，通过播放介质向智能音箱播放，智能音箱被打断唤醒后，人工记录唤醒次数并计算智能音箱的打断唤醒率。

3、由于现有的智能音箱唤醒测试使用的音频文件是随机下载的，而且播放设备失真，导致测试环境不符合真实的人声唤醒环境，并且音频文件没有统一标准，导致测试结果极其不准确，测试准确率过低；人工处理方式效率低下且成本高，无法适应多样的智能设备测试环境。

技术实现思路

1、有鉴于此，本发明实施例提供一种智能设备的打断唤醒的测试方法和装置，能够实现智能设备的唤醒测试的自动化，并且可以适用于各种智能设备，应用场景广泛，采用归一化处理的音频文件和仿真播放设备，高度还原真实的人声打断唤醒环境，极大地提高了智能设备打断唤醒率测试的准确性，缩减了人力成本，提高了测试效率。

2、为实现上述目的，根据本发明实施例的一个方面，提供了一种智能设备的打断唤醒的测试方法，包括：

3、获取测试音频；其中，所述测试音频是经过归一化处理得到的；

4、向第一播放设备发送所述测试音频；

5、在一个或多个待测试的智能设备的运行过程中，控制所述第一播放设备根据预设的播放属性播放所述测试音频，使得所述智能设备被所述测试音频打断唤醒；

6、接收所述智能设备发送的打断唤醒记录；

7、根据所述打断唤醒记录，确定所述智能设备的测试结果。

8、可选地，还包括：

9、获取音频语料；其中，所述音频语料包括一个或多个地域、一个或多个年龄段、一种或多种语言、和/或一种或多种语速的人声的打断唤醒语料；

10、根据预设裁剪单位，将所述打断唤醒语料裁剪为多个音频片段，分别确定多个所述音频片段的音频幅值；

11、根据所述音频幅值，对多个所述音频片段进行归一化处理，得到所述测试音频。

12、可选地，所述根据所述音频幅值，对多个所述音频片段进行归一化处理，得到所述测试音频，包括：

13、将多个所述音频幅值进行对比，确定最大的所述音频幅值为目标音频幅值；

14、将与所述目标音频幅值对应的目标音频片段的音频幅值转化为预设的标准音频幅值，确定所述目标音频片段的转化比例；

15、根据所述转化比例，将多个所述音频片段进行转化；

16、根据转化后的多个所述音频片段，生成所述测试音频。

17、可选地，所述预设裁剪单位为一个唤醒词或者一个唤醒句子。

18、可选地，所述播放属性包括播放频率，所述打断唤醒记录包括被打断唤醒次数；所述根据所述唤醒记录，确定所述智能设备的测试结果，包括：

19、根据所述播放频率，确定所述测试音频的总播放次数；

20、根据所述被打断唤醒次数和所述总播放次数之比，确定所述智能设备的打断唤醒率；

21、确定所述打断唤醒率是否高于预设的目标打断唤醒率，如果是，确定所述智能设备的测试结果为测试成功。

22、可选地，还包括：

23、在所述智能设备的运行过程中，控制第二播放设备播放噪声音频，使得所述智能设备在所述噪声音频的播放过程中被所述测试音频打断唤醒。

24、可选地，所述第一播放设备为仿真嘴；和/或，

25、还包括：所述第一播放设备与所述智能设备之间的距离和角度符合预设测试条件。

26、根据本发明实施例的再一个方面，提供了一种智能设备的打断唤醒的测试装置，包括：

27、获取模块，用于获取测试音频；其中，所述测试音频是经过归一化处理得到的；

28、发送模块，用于向第一播放设备发送所述测试音频；

29、测试模块，用于在一个或多个待测试的智能设备的运行过程中，控制所述第一播放设备根据预设的播放属性播放所述测试音频，使得所述智能设备被所述测试音频打断唤醒；

30、接收模块，用于接收所述智能设备发送的打断唤醒记录；

31、结果模块，用于根据所述打断唤醒记录，确定所述智能设备的测试结果。

32、根据本发明实施例的另一个方面，提供了一种智能设备的打断唤醒的测试系统，包括：

33、智能设备的打断唤醒的测试装置、第一播放设备、和一个或多个待测试的智能设备。

34、可选地，还包括第二播放设备。

35、根据本发明实施例的还一个方面，提供了一种智能设备的打断唤醒的测试的电子设备，包括：

36、一个或多个处理器；

37、存储装置，用于存储一个或多个程序，

38、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明提供的智能设备的打断唤醒的测试方法。

39、根据本发明实施例的还一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明提供的智能设备的打断唤醒的测试方法。

40、上述发明中的一个实施例具有如下优点或有益效果：因为采用在智能设备运行过程中，用仿真嘴向其经过归一化处理得到的测试音频，模拟真实人声唤醒环境，使得智能设备被打断唤醒并生成自身的打断唤醒记录，进而服务端根据智能设备的被打断唤醒次数、唤醒词和/或唤醒句子的总播放次数确定智能设备的打断唤醒率，进而确定智能设备的测试结果的技术手段，所以克服了现有的唤醒测试测试环境不符合真实的人声唤醒环境，并且音频文件没有统一标准，导致测试结果极其不准确，测试准确率过低；人工处理方式效率低下且成本高，无法适应多样的智能设备测试环境的技术问题，进而达到能够实现智能设备的唤醒测试的自动化，并且可以适用于各种智能设备，应用场景广泛，采用归一化处理的音频文件和仿真播放设备，高度还原真实的人声打断唤醒环境，极大地提高了智能设备打断唤醒率测试的准确性，缩减了人力成本，提高了测试效率的技术效果。

41、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

技术特征：

1.一种智能设备的打断唤醒的测试方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述音频幅值，对多个所述音频片段进行归一化处理，得到所述测试音频，包括：

4.根据权利要求2所述的方法，其特征在于，所述预设裁剪单位为一个唤醒词或者一个唤醒句子。

5.根据权利要求1所述的方法，其特征在于，所述播放属性包括播放频率，所述打断唤醒记录包括被打断唤醒次数；所述根据所述唤醒记录，确定所述智能设备的测试结果，包括：

6.根据权利要求1所述的方法，其特征在于，还包括：

7.根据权利要求1至6任一所述的方法，其特征在于，所述第一播放设备为仿真嘴；

8.一种智能设备的打断唤醒的测试装置，其特征在于，包括：

9.一种智能设备的打断唤醒的测试系统，其特征在于，包括：如权利要求8所述的智能设备的打断唤醒的测试装置、第一播放设备、和一个或多个待测试的智能设备。

10.根据权利要求9所述的测试系统，其特征在于，还包括第二播放设备。

11.一种智能设备的打断唤醒的电子设备，其特征在于，包括：

12.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结
本发明公开了一种智能设备的打断唤醒的测试方法和装置，涉及人工智能技术领域。该方法的具体实施方式包括：获取测试音频；其中，测试音频是经过归一化处理得到的；向第一播放设备发送测试音频；在一个或多个待测试的智能设备的运行过程中，控制第一播放设备根据预设的播放属性播放测试音频，使得智能设备被测试音频打断唤醒；接收智能设备发送的打断唤醒记录；根据打断唤醒记录，确定智能设备的测试结果。该实施方式能够实现智能设备的唤醒测试的自动化，并且可以适用于各种智能设备，应用场景广泛，采用归一化处理的音频文件和仿真播放设备，高度还原真实的人声打断唤醒，提高了智能设备打断唤醒率测试的准确性和测试效率，缩减人力成本。

技术研发人员：王哲
受保护的技术使用者：北京沃东天骏信息技术有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王哲
技术所有人：北京京东世纪贸易有限公司
我是此专利的发明人