非联网语音识别控制方法、器件、网关及应用

文档序号：38706762发布日期：2024-07-19 15:06阅读：63来源：国知局

本发明涉及语音识别和控制，尤其涉及一种非联网语音识别控制方法、器件、网关及应用。

背景技术：

1、语音识别和控制是人机交互的重要方式之一，是信息技术领域重要的技术之一。随着科技的发展和进步，大规模集群和联网是的语音大模型技术被突破，并开始被广泛应用于自然语言识别和人机交互。

2、目前语义识别和控制设备必须接入互联网，接收云端语音大模型处理后的数据，并完成控制操作。这种语音控制方式必须依赖稳定高速的互联网以及安全可靠的数据中心设备才能够实现。而现实生活中的网络连接并不稳定，数据中心运行并不安全可靠，导致用户无法正常使用设备，或者用户隐私数据被窃取。另外，目前基于特定词汇识别的非联网语音识别技术，只能识别预先导入的有限词汇列表中的特定词汇。

3、因此，非联网语义识别技术就非常必要，并且如何提高非联网语音识别控制的准确度和效率是重中之重。

技术实现思路

1、发明目的：提出一种非联网语音识别控制方法，并且提出一种可以实现上述控制方法的器件，还进一步提出一种基于上述器件制作的控制网关及应用，以解决现有技术存在的上述问题。

2、本发明的第一个方面，提出一种非联网语音识别控制方法，该方法步骤如下：

3、s1、采集环境中的声音信息，转换成数字信号，并对所述数字信号进行预处理；

4、s2、将预处理后的数字信号导入本地语言识别模型，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，得到运算结果，所述运算结果即为控制信号；

5、s3、解析所述控制信号，将其转换为相应的控制指令；

6、s4、将所述控制指令转换成无线信号发射到环境中。

7、在第一方面进一步的实施例中，步骤s1中所述预处理包括降噪、人声过滤、人声增强。

8、在第一方面进一步的实施例中，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，包括如下步骤：

9、识别并存储所述数字信号中的声音特征信息；

10、将当前声音特征信息与预定时间段内存储的历史声音特征信息进行关联运算，存储运算结果，并将所述运算结果发送给所述信号控制模块。

11、在第一方面进一步的实施例中，将当前声音特征信息与预定时间段内存储的历史声音特征信息进行关联运算，得到运算结果，数学表达式如下：

12、

13、式中，表示控制信号；表示在t时刻的状态集；表示在t+1时刻的状态集；表示在t时刻的执行指令；表示在t时刻的执行反馈；表示在给定当前状态和采取特定动作后下一个状态的概率分布；表示的状态分布；表示反馈函数；为可变系数。

14、在第一方面进一步的实施例中，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，还包括：

15、根据所述运算结果调整所述本地语言识别模型；

16、所述本地语言识别模型可自行增加参数，将上一次的运算结果作为下一次预算的参数：

17、

18、式中，是可变参数集{0, 0.1, 1}；表示上一次执行指令；表示当前语音控制指令。

19、在第一方面进一步的实施例中，上一次执行指令的数学表达式如下：

20、

21、式中，t是回合长度，即在执行或学习一个任务时，每个回合所包含的步骤或时间段的长度；k是字符串长度；为当前声音特征信息，为执行结果。

22、在第一方面进一步的实施例中，当前语音控制指令的数学表达式如下：

23、

24、式中，是第次声音特征信息；是所述大模型预测关键词的概率分布；s表示状态集。

25、作为本发明的第二个方面，提出一种非联网语音识别控制器件，该器件可执行上述第一方面及其进一步的实施例所公开的非联网语音识别控制方法，该器件包括：

26、音频处理模块，用于采集环境中的声音信息，转换成数字信号，并对所述数字信号进行预处理；

27、本地语音识别模块，用于将预处理后的数字信号导入本地语言识别模型，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，处理结果即为所需的控制信号；

28、信号控制模块，用于解析所述控制信号，将其转换为相应的控制指令；

29、信号发射模块，用于将所述控制指令转换成无线信号发射到环境中。

30、第三方面，在第二方面公开的非联网语音识别控制器件的基础之上，本发明还公开一种网关，该网关除了包含第二方面所公开的非联网语音识别控制器件之外，还包括网络输入端、网络输出端。网络输入端和网络输出端可以是有线形式和/或无线形式；网关可以作为中枢网关、从网关、蓝牙mesh网关；所述网关用于实现智能家居本地化控制。

31、此外，作为本发明的第四个方面，还提出如第一方面所述的非联网语音识别控制方法在智能家居本地化控制场景下的应用，可以实现非联网非特定词汇的意图识别并发送控制信号实现对无线设备的控制，无需依赖网络环境，且具有更高的语音识别控制的准确度和效率。

32、有益效果：本发明提出的非联网语音识别控制方法、器件、网关及应用，可以实现非联网非特定词汇的意图识别并发送控制信号实现对无线设备的控制。具有集成度高，操作方法简单，能够大幅提升控制效率，具备有效保护用户信息的优势。

技术特征：

1.一种非联网语音识别控制方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的非联网语音识别控制方法，其特征在于，步骤s1中所述预处理包括降噪、人声过滤、人声增强。

3.根据权利要求1所述的非联网语音识别控制方法，其特征在于，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，包括如下步骤：

4.根据权利要求3所述的非联网语音识别控制方法，其特征在于，将当前声音特征信息与预定时间段内存储的历史声音特征信息进行关联运算，得到运算结果，数学表达式如下：

5.根据权利要求3所述的非联网语音识别控制方法，其特征在于，利用所述本地语言识别模型对所述数字信号进行自然语言识别处理，还包括：

6.根据权利要求5所述的非联网语音识别控制方法，其特征在于，上一次执行指令的数学表达式如下：

7.根据权利要求5所述的非联网语音识别控制方法，其特征在于，当前语音控制指令的数学表达式如下：

8.一种非联网语音识别控制器件，可执行如权利要求1至7中任一项所述的非联网语音识别控制方法；其特征在于，所述非联网语音识别控制器件包括：

9.一种网关，其特征在于包括网络输入端、网络输出端，以及如权利要求8所述的非联网语音识别控制器件；

10.如权利要求1至7中任一项所述的非联网语音识别控制方法在智能家居本地化控制场景下的应用。

技术总结
本发明提供了一种非联网语音识别控制方法、器件、网关及应用，涉及语音识别和控制技术领域。该语音识别控制方法步骤如下：采集环境中的声音信息，转换成数字信号，并对数字信号进行预处理；将预处理后的数字信号导入本地语言识别模型，利用本地语言识别模型对所述数字信号进行自然语言识别处理，得到运算结果，所述运算结果即为控制信号；解析控制信号，将其转换为相应的控制指令；将控制指令转换成无线信号发射到环境中。本发明提出的非联网语音识别控制方法、器件、网关及应用，可以实现非联网非特定词汇的意图识别并发送控制信号实现对无线设备的控制。具有集成度高，操作方法简单，能够大幅提升控制效率，具备有效保护用户信息的优势。

技术研发人员：代倩,于永亚,陈皓,陈欣雨,李一鸣
受保护的技术使用者：金陵科技学院
技术研发日：
技术公布日：2024/7/18

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：代倩,于永亚,陈皓,陈欣雨,李一鸣
技术所有人：金陵科技学院
我是此专利的发明人