一种语音处理的方法和终端的制作方法

文档序号：8261272阅读：342来源：国知局

一种语音处理的方法和终端的制作方法
【技术领域】
[0001]本发明涉及通信技术领域，尤其涉及一种语音处理的方法和终端。
【背景技术】
[0002]进入90年代以后，在语音识别的系统框架方面和语音识别技术的应用及产品化方面出现了很大的进展。语音识别技术的应用领域非常广泛，例如工业控制、教育、通信等。随着3G手机逐渐走进普通消费者的生活，人们可以使用手机进行越来越多的功能，随着时代的发展和进步，通过语音转成文字或拼音；文字或拼音转成语音的技术越来越成熟，语音模型库的容量也越做越大，一般地在用于进行语音识别以及说话者识别的语音处理中，涉及的语音模型库的信息量都比较大。
[0003]移动终端的内存容量有限，目前一种方式是通过云服务器来存储语音模式数据库，是一种基于WEB (网页)服务，整合了计算、存储与网络资源的服务，具备按需使用远程查询服务。
[0004]但是，这样的语音识别方式在进行语音识别时由于网络连接原因容易造成查询响应不及时的问题，尤其是网络链路情况不是很好的情况下容易出现无法识别或者错误识另IJ，使之进行错误的操作。并且当设备进行语音识别判断时输入语音信号，由于服务器端存储的语音模型库信息量较大，导致语音识别查询匹配过程耗时较长，容易导致反应速度下降甚至判断时识别率下降。
[0005]因此在进行语音识别时，在保证识别率的前提下，如何提高语音识别灵活性、可控性、扩展性及资源复用性，是一个待解决的问题。

【发明内容】

[0006]本发明要解决的技术问题是提供一种语音处理的方法和终端，减少了用户在远端服务器进行模式数据库匹配查询的耗时。
[0007]为了解决上述技术问题，本发明提供了一种语音处理的方法，包括:
[0008]调取服务器端中使用频率达到指定值的语音信息，将所述语音信息保存到本地；
[0009]接收到输入的信息后，从所述信息中识别出语音特征信息并转化为语音指令；
[0010]根据所述语音指令在本地保存的语音信息中进行匹配，如未匹配到对应的语音信息，则将所述语音指令发送到服务器端进行匹配。
[0011]进一步地，上述方法还具有下面特点:所述调取服务器端中使用频率达到指定值的语音信息，包括:
[0012]接收到指令后或定期调取服务器端中使用频率达到指定值的语音信息。
[0013]进一步地，上述方法还具有下面特点:将所述语音信息保存到本地，包括:
[0014]当所述语音信息的数目超出本地指定缓存模块的存储空间时，将所述缓存模块中栈底的数据删除，然后保存所述语音信息。
[0015]为了解决上述问题，本发明还提供了一种终端，其中，包括:
[0016]调取模块，用于调取服务器端中使用频率达到指定值的语音信息，将所述语音信息保存到本地；
[0017]识别模块，用于接收到输入的信息后，从所述信息中识别出语音特征信息并转化为语首指令；
[0018]匹配模块，用于根据所述语音指令在本地保存的语音信息中进行匹配，如未匹配到对应的语音信息，则将所述语音指令发送到服务器端进行匹配。
[0019]进一步地,上述终端还具有下面特点:
[0020]所述调取模块，具体用于接收到指令后或定期调取服务器端中使用频率达到指定值的语首?目息。
[0021]进一步地,上述终端还具有下面特点:还包括，
[0022]所述语音缓存模块，用于保存所述调取模块调取的所述语音信息。
[0023]进一步地,上述终端还具有下面特点:
[0024]所述语音缓存模块，具体用于当所述语音信息的数目超出本地存储空间时，将栈底的数据删除，然后保存所述语音信息。
[0025]综上，本发明提供一种语音处理的方法和终端，可以在保证识别率的前提下，提高语音识别灵活性、可控性、扩展性及资源复用性。本发明在保证设备的语音识别率不下降的前提下，对语音识别系统进行了优化，减少了用户根据语音做识别时产生的错误概率，通过从服务器端的语音模型库中根据用户使用频率动态调取出优先级最高的一部分语音信息保存到终端本地进行优先匹配查询操作，使语音判别时识别速度大大提高，通过云服务器中保存全部的语音模型库，节约了终端本地的存储空间。
【附图说明】
[0026]图1为本发明实施例的语音识别系统的示意图。
[0027]图2为本发明实施例的一种语音处理的方法的流程图。
[0028]图3为本发明应用示例的语音处理方法的流程图。
【具体实施方式】
[0029]为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。
[0030]图1为本发明实施例的语音识别系统的示意图，本实施例的语音识别系统包括通过网络互相连接的至少一用户终端和至少一服务器端。
[0031]所述用户终端为移动设备终端，可以包括手机和平板电脑等移动终端。用户终端根据语音识别匹配数据库相关信息的频率设置存在服务器端中的语音模型库，可以动态调整将一定时间段内使用频率最高的一部分数据库信息保存到终端本地，在进行语音识别匹配时优先在终端本地查询匹配，终端判断本地的语音模型库是否已经检索完毕，如果是继续在远端服务器进行匹配查询。
[0032]如图1所示，本实施例的终端可以包括以下模块:
[0033]调取模块，用于调取服务器端中使用频率达到指定值的语音信息，将所述语音信息保存到本地；
[0034]识别模块，用于接收到输入的信息后，从所述信息中识别出语音特征信息并转化为语首指令；
[0035]匹配模块，用于根据所述语音指令在本地保存的语音信息中进行匹配，如未匹配到对应的语音信息，则将所述语音指令发送到服务器端进行匹配。
[0036]其中，所述调取模块可以接收到指令后或定期调取服务器端中使用频率达到指定值的语首?目息。
[0037]在一优选实施例中，所述终端还可以包括:
[0038]语音缓存模块，用于保存所述调取模块调取的所述语音信息。
[0039]其中，所述语音缓存模块，具体用于当所述语音信息的数目超出本地存储空间时，将栈底的数据删除，然后保存所述语音信息。
[0040]语音缓存模块设置一定的存储空间；保存当从服务器端中查询匹配的语音信息，当数目超出所述语音缓存模块的存储空间时，将语音缓存模块中的栈底的数据进行删除操作，直至存储空间足够存放。
[0041]其中，所述识别模块用于收集用户发出的语音，将语音转为文字或语音指令；或者用于收集用户输入的文本，将文字转为语音。
[0042]所述服务器端为服务器包括一语音模型库，语音模型库包含所有用户语音识别信息，语音模型库负责将用户终端提取的语音信号或

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贾鑫;
技术所有人：中兴通讯股份有限公司;
我是此专利的发明人

上一篇：一种采用总变化量因子的语种识别方法及系统的制作方法
上一篇：使用地理信息的声学模型适配的制作方法