一种语音识别系统及方法与流程

文档序号：13664016阅读：512来源：国知局

本发明涉及语音识别领域，具体涉及一种语音识别系统及方法。

背景技术：

随着人工智能走进日常生活中，人们对于语音识别的认识也越来越深，同时对人工智能中语音识别系统的要求也越来越高。现有专利cn103236260a提供了一种语音识别系统，包括：存储单元，用于存储至少一个用户的语音模型；语音采集及预处理单元，用于采集待识别语音信号，对所述待识别语音信号进行格式转换及编码；特征提取单元，用于从编码后的所述待识别语音信号中提取语音特征参数；模式匹配单元，用于将所提取的所述语音特征参数与至少一个所述语音模型进行匹配，确定所述待识别语音信号所属的用户。

虽然现有专利cn103236260a使用mfcc参数，建立说话人的语音特征模型，实现说话人的特征识别算法，能够达到提高说话人检测可靠性。但是在很多现实情况中该专利存在以下弊端：(1)该语音识别系统不能区别管理员和普通用户的特殊语音识别；(2)特定人的语音随着年龄的变化有所改变，原有模型数据库识别正确率降低。

技术实现要素：

本发明的目的在于提供一种语音识别系统及方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种语音识别系统，包括：

语音预处理模块，其包括端点检测模块和信号增强模块，所述端点检测模块分别与声音输入设备和语音增强模块电性连接；

模型处理模块，其包括控制单元、dwt模型处理单元和hmm模型处理单元，所述控制单元分别与所述dwt模型处理单元、hmm模型处理单元、mfcc参数特征提取模块和识别结果显示模块电性连接；

模型数据库，其包括dwt模型数据库和hmm模型数据库，所述dwt模型处理单元与所述dwt模型数据库电性连接，所述hmm模型处理单元与所述hmm模型数据库电性连接。

优选的，所述dwt模型处理模块包括dwt模型训练和dwt模型匹配，所述hmm模型处理模块包括hmm模型训练和hmm模型匹配。

优选的，所述控制单元为arm单片机，且其上面集成了模式开关电路，用于选择模型训练与模型匹配，还集成了模型选择电路，用于选择所述dwt模型处理模块和hmm模型处理模块。

优选的，所述语音增强模块使用的滤波器是维纳滤波器。

优选的，所述mfcc参数特征提取模块集成了信号放大器和模数转换器。

还提供一种语音识别的方法，包括：

第一步：通过所述声音输入设备输入声音，并对所述声音进行声音预处理包括经过所述端点监测模块和语音增强模块的处理得到语音信号；

第二步：通过所述mfcc特征提取模块利用mfcc特征提取技术对第一步中的语音信号进行特征提取得到特征向量并将特征向量传送给所述控制单元；

第三步：所述控制单元根据模式开关电路选择模型训练和模型匹配，若选择模型训练则执行第四步，若选择模型匹配则执行第五步；

第四步：所述控制单元根据模型开关电路选择所述dwt模型处理模块单元和hmm模型处理单元，若选择所述dwt模型处理单元，第二步中的特征向量经dwt模型处理单元训练后得到dwt模板存储在所述dwt模型数据库，若选择hmm模型处理单元，第二步中的特征向量经hmm模型处理单元训练后得到hmm模板存储到所述hmm模型数据库；

第五步：第二步中的特征向量经dwt模型处理单元匹配后得到的最小距离值与dwt预设值比较，若大于dwt预设值，则执行步骤六，若小于dwt预设值，则执行步骤七；

第六步：将第二步中的特征向量经hmm模式匹配后得到匹配结果，并将结果输出；

第七步：判断第五步中的最小距离值是否符合存储条件，若符合则所述控制单元控制地二步中的特征向量经过dwt模型处理单元训练后存储到所述dwt模型数据库,若不符合直接将匹配结果输出。

与现有技术相比，本发明的有益效果是：

本发明采用dwt模式识别和hmm模式识别综合识别并配有dwt模型数据库和hmm模型数据库可以区别识别管理员和普通用户的语音；同时通过从dwt模式识别结果中选出优选特征向量经dwt模型训练后存储dwt模型数据库，以避免管理员因为年龄变化或声音渐变而降低语音识别正确率的弊端。

附图说明

图1为本发明的语音识别系统构示意图；

图2为本发明的语音识别系统的使用方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如附图1所示，一种语音识别系统，包括：语音预处理模块，包括端点检测模块和信号增强模块，端点检测模块分别与声音输入设备和语音增强模块电性连接，模型处理模块，包括控制单元、dwt模型处理单元和hmm模型处理单元，控制单元分别与dwt模型处理单元、hmm模型处理单元、mfcc参数特征提取模块和识别结果显示模块电性连接。模型数据库，包括dwt模型数据库和hmm模型数据库，dwt模型处理单元与dwt模型数据库电性连接，hmm模型处理单元与hmm模型数据库电性连接。dwt模型处理模块包括dwt模型训练和dwt模型匹配，hmm模型处理模块包括hmm模型训练和hmm模型匹配，控制单元为arm单片机，且其上面集成了模式开关电路，用于选择模型训练与模型匹配，还集成了模型选择电路，用于选择所述dwt模型处理模块和hmm模型处理模块。语音增强模块使用的滤波器是维纳滤波器，mfcc参数特征提取模块集成了信号放大器和模数转换器。

当语音输入设备接收到声音后，将声音信号传送给语音预处理模块，在语音预处理过程中先将声音信号进行端点监测模块获得连续的语音信号，再将语音信号通过语音增模块强去除噪音获得纯净的语音信号，将语音信号进行mfcc参数提取得到特征矢量，特征矢量传送到控制单元，控制单元根据模式选择电路的通断和模型控制电路的通断进行特征矢量训练或者特征向量匹配，若进行特征向量训练则将训练后的模型存储到模型数据库，若进行特征向量匹配则将匹配后的结果输出。

如附图2所示，一种语音识别的方法：

第一步：通过声音输入设备输入声音，并对声音进行声音预处理包括经过端点监测模块和语音增强模块的处理得到语音信号；

第二步：通过mfcc特征提取模块利用mfcc特征提取技术对第一步中的语音信号进行特征提取得到特征向量并将特征向量传送给控制单元；

第三步：控制单元根据模式开关电路选择模型训练和模型匹配，若选择模型训练则执行第四步，若选择模型匹配则执行第五步；

第四步：控制单元根据模型开关电路选择dwt模型处理模块单元和hmm模型处理单元，若选择dwt模型处理单元，第二步中的特征向量经dwt模型处理单元训练后得到dwt模板存储在dwt模型数据库，若选择hmm模型处理单元，第二步中的特征向量经hmm模型处理单元训练后得到hmm模板存储到hmm模型数据库；

第六步：将第二步中的特征向量经hmm模式匹配后得到匹配结果，并将结果输出；

第七步：判断第五步中的最小距离值是否符合存储条件，若符合则控制单元控制地二步中的特征向量经过dwt模型处理单元训练后存储到dwt模型数据库,若不符合直接将匹配结果输出。

当mfcc参数特征提取模块提取后得到特征向量，控制单元根据模式选择电路的通断和模型控制电路的通断做出判断，若模式选择电路断开则进行训练模式，若模型控制电路断开则选择的为dwt模型训练，则特征向量经过dwt模型训练后得到dwt模型存储到dwt模型数据库；若模型控制电路连通则选择的为hmm模型训练，则特征向量经过hmm模型训练后得到hmm模型存储到hmm模型数据库；若模式选择电路连通则选择匹配模式，则进行dwt模型匹配得到dwt最小距离值及其对应的识别结果，dwt最小距离值小于预设值则判断为管理员语音指令，并对dwt最小距离值做出评估判断是否以该特征向量作为dwt模型基础，若是，则将该特征向量经过dwt模型训练后存储到dwt模型数据库中同时输出该识别结果，若否，则输出该识别结果；若dwt模型匹配得到的dwt最小距离值大于预设值则进行hmm模型匹配得到识别结果，并将识别结果输出。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王冬
技术所有人：安徽硕威智能科技有限公司
我是此专利的发明人