一种语音识别方法、系统、设备及介质与流程

文档序号：35916305发布日期：2023-10-30 08:47阅读：106来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及人工智能，特别是涉及一种语音识别方法、系统、设备及介质。

背景技术：

1、目前，随着人工智能技术的快速发展，语音识别技术在日常生活中的应用越来越广泛。

2、现有技术中，以及市场中已经有许多智能语音助手，如苹果的siri、亚马逊的alexa以及谷歌助手等，它们可以帮助用户完成各种任务，例如播放音乐、查询天气、设置提醒等。

3、然而，这些设备的使用需要用户对指令进行准确的语音输入，一旦遇到一些具有口音、或口音较重、或语速较快的用户来说，语音输入的准确性以及语音识别的准确性则会降低，这导致语音识别存在一定的困难。

技术实现思路

1、本发明的目的在于，针对现有技术中的上述问题，提供一种语音识别方法、系统、设备及介质，进而解决现有技术中人工智能对于口音语音数据以及较快语速的语音数据的识别精确度较低，导致语音识别存在一定的困难的问题。

2、为解决上述技术问题，本发明的具体技术方案如下：

3、一方面，本发明提供一种语音识别方法，包括以下步骤：

4、模型训练步骤：配置深度学习算法，搭建口音训练数据集，基于所述深度学习算法和所述口音训练数据集训练语音识别模型；

5、语音自适应识别步骤：响应于语音指令的输入，调用所述语音识别模型基于语速适配算法识别所述语音指令，得到识别结果；

6、功能响应步骤：根据所述识别结果进行指令功能实现。

7、作为一种改进的方案，所述搭建口音训练数据集，包括：

8、配置若干种类的口音语音数据作为若干训练数据；

9、将若干所述训练数据作为所述口音训练数据集。

10、作为一种改进的方案，所述调用所述语音识别模型基于语速适配算法识别所述语音指令，得到识别结果，包括：

11、调用训练后的所述语音识别模型对所述语音指令进行识别，得到所述识别结果；

12、对所述语音指令进行识别时，基于所述语速适配算法控制所述语音识别模型的识别速度；

13、所述语速适配算法，包括：识别所述语音指令的语速；控制所述语音识别模型的识别速度与所述语速相匹配。

14、作为一种改进的方案，所述根据所述识别结果进行指令功能实现，包括：

15、将所述识别结果转换为与所述语音指令对应的功能执行控制指令；

16、调用功能执行控制指令触发对应功能模块的功能服务。

17、另一方面，本发明还提供一种语音识别系统，包括：

18、模型训练模块、语音自适应识别模块和功能响应模块；

19、所述模型训练模块，用于配置深度学习算法，搭建口音训练数据集，基于所述深度学习算法和所述口音训练数据集训练语音识别模型；

20、所述语音自适应识别模块，用于响应于语音指令的输入，调用所述语音识别模型基于语速适配算法识别所述语音指令，得到识别结果；

21、所述功能响应模块，用于根据所述识别结果进行指令功能实现。

22、作为一种改进的方案，所述模型训练模块，还用于配置若干种类的口音语音数据作为若干训练数据；所述模型训练模块将若干所述训练数据作为所述口音训练数据集。

23、作为一种改进的方案，所述语音自适应识别模块，还用于调用训练后的所述语音识别模型对所述语音指令进行识别，得到所述识别结果；所述语音自适应识别模块对所述语音指令进行识别时，基于所述语速适配算法控制所述语音识别模型的识别速度；所述语速适配算法，包括：识别所述语音指令的语速；控制所述语音识别模型的识别速度与所述语速相匹配。

24、作为一种改进的方案，所述功能响应模块，还用于将所述识别结果转换为与所述语音指令对应的功能执行控制指令；所述功能响应模块调用功能执行控制指令触发对应功能模块的功能服务。

25、另一方面，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述语音识别方法的步骤。

26、另一方面，本发明还提供一种计算机设备，所述计算机设备包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；其中：

27、所述存储器，用于存放计算机程序；

28、所述处理器，用于通过运行所述存储器上所存放的程序来执行所述语音识别方法的步骤。

29、本发明技术方案的有益效果是：

30、本发明所述的语音识别方法，可以实现针对口音数据进行深度训练集的训练，针对语速语音数据进行不同读取速度的适配，提高语音识别的智能性，提升语音识别的适用范围以及精准性，支持多语言和方言的语音识别，提高适用性和普适性。

31、本发明所述的语音识别系统，可以通过模型训练模块、语音自适应识别模块和功能响应模块的相互配合，进而实现针对口音数据进行深度训练集的训练，针对语速语音数据进行不同读取速度的适配，提高语音识别的智能性，提升语音识别的适用范围以及精准性，支持多语言和方言的语音识别，提高适用性和普适性。

32、本发明所述的计算机可读存储介质，可以实现引导模型训练模块、语音自适应识别模块和功能响应模块进行配合，进而实现本发明所述的语音识别方法，且本发明所述的计算机可读存储介质还有效提高所述语音识别方法的可操作性。

33、本发明所述的计算机设备，可以实现存储并执行所述计算机可读存储介质，进而实现本发明所述的语音识别方法。

技术特征：

1.一种语音识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种语音识别方法，其特征在于：

3.根据权利要求2所述的一种语音识别方法，其特征在于：

4.根据权利要求3所述的一种语音识别方法，其特征在于：

5.一种语音识别系统，其特征在于，包括：模型训练模块、语音自适应识别模块和功能响应模块；

6.根据权利要求5所述的一种语音识别系统，其特征在于：

7.根据权利要求6所述的一种语音识别系统，其特征在于：

8.根据权利要求7所述的一种语音识别系统，其特征在于：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1~4中任一项所述语音识别方法的步骤。

10.一种计算机设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；其中：

技术总结
本发明公开了一种语音识别方法、系统、设备及介质，所述方法包括以下步骤：配置深度学习算法，搭建口音训练数据集，基于深度学习算法和口音训练数据集训练语音识别模型；响应于语音指令的输入，调用语音识别模型基于语速适配算法识别语音指令，得到识别结果；根据识别结果进行指令功能实现；本发明能够针对口音数据进行深度训练集的训练，针对语速语音数据进行不同读取速度的适配，提高语音识别的智能性，提升语音识别的适用范围以及精准性，支持多语言和方言的语音识别，提高适用性和普适性。

技术研发人员：胡焱,邢士武,常绍盈,袭祥亮
受保护的技术使用者：浪潮金融信息技术有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡焱邢士武常绍盈袭祥亮
技术所有人：浪潮金融信息技术有限公司
我是此专利的发明人