专利名称:嵌入式智能语音处理引擎的制作方法
技术领域:
本发明设计一种远程语音处理系统,尤其设计一种分布嵌入式智能语音处理引擎。
背景技术:
分布式语音识别伴随着无线网络的推广应运而生,其基本思路是将语音识别过程分成几个功能相对独立的模块,将这几个模块的计算分布到网络上的不同设备,通过定义和规范模块接口使模块协同工作,共同完成语音识别,提高了语音识别性能。它的优点是对终端计算能力和存储量要求低、灵活性强,为嵌入式系统的语音技术应用开辟了新道路。语音合成技术在2000年时已达到用户基本可接受的准实用水平,2005年开始获得了较为广泛的应用。未来语音合成技术将从清晰度和自然度的要求上升至对个性化合成 的要求,如对语音、语调、情绪的丰富性要求等。
发明内容
针对以上亟待解决的问题的提出,本发明提供了一种嵌入式智能语音处理引擎一种嵌入式智能语音处理引擎的实现方法,其特征在于包括如下步骤用户客户端从音频文件中提取文件的语音特征参数,上传至服务器;服务器接收文件后,识别语音参数,进行特征比对和语句判别,并从数据库中调取相应的语音文件,将该语音文件返回客户端。所述客户端包括语音识别集群SRC (Speech recognize Cluster)和语音合成集群SSC(Speech Synthesis Cluster)。语音识别集群SRC(Speech recognize Cluster)和语音合成集群 SSC(SpeechSynthesis Cluster)米用 Master/Slave 结构,该 Master/Slave 架构中 Master 负责 Slave的调度管理。由于采用了上述技术方案本发明提供的分布式智能语音处理引擎具有如下突出的特点I.模块的小型化,为适应分布式的系统模式,将庞大的语料库与相应的计算处理进行动态调度,实施网络分布式管理,减小客户端承载压力。2.分布式并行计算对于语音识别,引擎在客户端对接收的发音信号进行实时运算,实时提取其语音特征后提交服务器进行多服务器分布式联动匹配计算,获取对应音素数据后返回。对于语音识别,引擎将待合成文本直接提交到后台进行分布式处理。
本发明只有一幅附I为本发明的结构示意图
具体实施例方式图I为本发明的结构示意图,如图I所示一种嵌入式智能语音处理引擎的实现方法,包括用户客户端从音频文件中提取文件的语音特征参数,上传至服务器;服务器 接收文件后,识别语音参数,进行特征比对和语句判别,并从数据库中调取相应的语音文件,将该语音文件返回客户端。语音识别分为特征提取和特征比对、词句判别两个阶段,分布式语音识别(DSR)技术采用客户机/服务器方法,整个处理过程分布于终端和网络两端。终端执行语音特征参数提取任务,是语音识别系统的前端。提取的特征参数传输至服务器端识别器。服务器端识别器负责特征比对和词句判别。所述客户端包括语音识别集群SRC (Speech recognize Cluster)和语音合成集群SSC(Speech Synthesis Cluster)。语音识别集群SRC(Speech recognize Cluster)和语音合成集群 SSC(SpeechSynthesis Cluster)米用 Master/Slave 结构,该 Master/Slave 架构中 Master 负责 Slave的调度管理。语音识别和合成的后台服务基于分布式架构,主要采用Master/Slave结构,Master负责Slave的调度管理,在Slave失效时进行其他Slave节点的动态迁移。计算时,运用Map/Reduce原理进行运算的分解,最终将结果整合起来反馈给客户端。
权利要求
1.一种嵌入式智能语音处理引擎的实现方法,其特征在于包括如下步骤 用户客户端从音频文件中提取文件的语音特征参数,上传至服务器; 服务器接收文件后,识别语音参数,进行特征比对和语句判别,并从数据库中调取相应的语音文件,将该语音文件返回客户端。
2.根据权利要求I所述的一种嵌入式智能语音处理引擎的实现方法,其特征还在于所述客户端包括语音识别集群Speech recognize Cluster和语音合成集群SpeechSynthesis Cluster。
3.根据权利要求2所述的一种嵌入式智能语音处理引擎的实现方法,其特征还在于语音识别集群SRC和语音合成集群SSC采用Master/Slave结构,该Master/Slave架构中Master负责Slave的调度管理。
全文摘要
本发明提供了一种嵌入式智能语音处理引擎一种嵌入式智能语音处理引擎的实现方法,其特征在于包括如下步骤用户客户端从音频文件中提取文件的语音特征参数,上传至服务器;服务器接收文件后,识别语音参数,进行特征比对和语句判别,并从数据库中调取相应的语音文件,将该语音文件返回客户端。具有如下特点1.模块的小型化,为适应分布式的系统模式,将庞大的语料库与相应的计算处理进行动态调度,实施网络分布式管理,减小客户端承载压力。2.分布式并行计算对于语音识别,引擎在客户端对接收的发音信号进行实时运算,实时提取其语音特征后提交服务器进行多服务器分布式联动匹配计算,获取对应音素数据后返回。
文档编号G10L15/30GK102956232SQ201110236368
公开日2013年3月6日 申请日期2011年8月17日 优先权日2011年8月17日
发明者李世英, 姚曙光, 罗毅, 王小龙, 刘德欣 申请人:大连永佳电子技术有限公司