专利名称:一种语音控制方法、装置及移动终端的制作方法
技术领域:
本发明属于语音控制技术领域,尤其涉及一种语音控制方法、装置及移动 终端。
背景技术:
现有技术中,由于语音识別技术尚无法识別整个语句,匹配多个音节的键 元素非常困难,如"设置周边检索的范围"等多个音节的键元素无法识別。且 匹配的目标键元素越多,识别率越低,故复杂功能的软件和硬件设备无法设置 很多的目标键元素,所以只能将有限的几个功能设置成语音识别的功能,导致 无法完全用语音进行所有功能的控制。
在接收到用户的语音输入后,计算机精确斥企索到用户语音输入的目标命令, 将这些目标命令作为指令词库内的键元素,查找出相关指令词集并通过专有界 面输出这些最终相关的指令词集供用户选择或确认,然后匹配、响应用户进一 步选择或确认的指令词,实现交互控制。
譬如用户语音输入"目的地",现有技术将"目的地"作为键元素,搜 索与其有关的、已预先建立关联并存储的关联命令,此时,专有界面将可能展 示"快拼检索"、"周边,,,"地址簿,,,"家,,,"办公室,,等关联指令条 目。由于现有语音识别无法识別很多音节的元素,且存在由于个人发音特点而 导致的语音识别匹配度差,需要通过专有界面再一次展现最终相关的指令词, 等待用户进一步精确指定,因此导致了4喿作过程烦瑣。
另一方面,现有技术中,由于存在很多的关联指令条目,但用户在同一枯 燥的专有界面下,根本无法记忆、联想到如此众多的关联指令条目。
综上所述,现有技术中,能够进行语音识别的功能非常有限,无法完全实 现语音对复杂软件和硬件的控制,且语音控制的方法匹配度差,以及需要用户 进一步确认,因而操作效率很低,适用性极差,容易导致误操作,在导航系统 中使用时会造成沿错误路径导航和导航到错误的目的地,甚至诱发交通事故。
发明内容
本发明实施例的目的在于提供一种语音控制方法,旨在解决现有技术中无 法完全实现语音对复杂软件和硬件的控制,且语音控制的方法匹配度差,以及 需要用户进一步确认,操作效率很低,适用性极差,容易导致误操作的问题。
本发明实施例是这样实现的, 一种语音控制方法,其特征在于,所述方法
包括以下步骤
将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;
接收并识别语音指令;
根据所述语音指令查找相应的编号;
根据所述编号查找相应的控制符号;
根据所述控制符号执行相应操作。
本发明实施例的另一目的在于提供一种语音控制装置,其包括语音识别模 块,用于接收语音输入,根据该语音输入匹配相应的语音指令,所述装置还包 括
编号显示模块,用于将控制符号和与其关联的编号进行显示,其中,所述 编号对应有语音指令;
编号查找^t块,用于根据接收到的语音指令查找相应的编号;
控制符号查找才莫块,用于才艮据所述编号查找相应的控制符号;
操作执行才莫块,用于根据所述控制符号执行相应操作。
本发明实施例的另一目的在于提供一种移动终端,所述移动终端还包括有 一种语音控制装置,其包括语音识别模块,用于接收语音输入,根据该语音输
入匹配相应的语音指令,所述装置还包括
编号显示模块,用于将控制符号和与其关联的编号进行显示,其中,所述
编号对应有语音指令;
编号查找模块,用于根据接收到的语音指令查找相应的编号;
控制符号查找模块,用于一艮据所述编号查找相应的控制符号;
操作执行模块,用于根据所述控制符号执行相应操作。
本发明实施例通过将控制符号和与其关联的编号进行显示,在用户进行语 音输入后,接收并识别语音指令,根据该语音指令查找相应的编号,根据查找 到的编号查找相应的控制符号,并根据查找到的控制符号执行相应操作,实现 了语音完全对复杂的多界面多按键功能的软件和硬件的控制,且将复杂的语音 《建元素转化为有限的几个符号,增加了匹配度,不再需用户进一步确认,节约 了使用的时间成本,增加了语音控制的适用性。
图1是本发明实施例提供的语音控制方法的流程图; 图2是本发明实施例提供的实质功能界面图A; 图3是本发明实施例提供的实质功能界面图B; 图4是本发明实施例提供的移动终端的结构图。
具体实施例方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅 仅用以解释本发明,并不用于限定本发明。
本发明实施例为一运行在Window CE上的导航软件,通过将控制符号和与 其关联的编号进行显示,在用户进行语音输入后,接收并识别语音指令,根据 该语音指令查找相应的编号,根据查找到的编号查找相应的控制符号,并根据
查找到的控制符号执行相应操作。
图1示出了本发明实施例提供的移动终端控制方法的流程,详述如下。
在步骤S101中,将实施例的控制符号与语音指令建立关联,并将建立的
关联关系进行存储。其中,实施例的控制符号包括软件和硬件的按钮和按键。 在具体实施过程中,需要确立按钮类型及按键类型的控制符号的编号方案,
并建立各编号和语音指令的关联关系。
本发明实施例也充许采用多个编号方案,并根据交互界面的需要进行动态
切换激活,譬如编号方案可以为阿拉伯数字,希腊数字,或者适合界面的"上
一步、下一步,,"春、夏、秋、冬,,,"东、南、西、北,,,以及针对按键的
"上,下,左,右,确定","Up, Down, Left, Down, OK"等。
各方案中编号也可以有对应多个语音指令的对应关系。譬如,编号方案同 时面向普通话用户及英语用户,那么编号为"2"的按4丑,母语为普通话的用户 发出"二(6r)"的语音指令可以操控,而母语为英文的用户发出"two[tu:]"的 语音指令也可以控制。
由于采用本发明实施例的编号方案较为简单明了 ,使用语音识别功能的失 误率大为减小,用户接受该方案也是轻而易举。
在控制符号的编号方案确定之后,再根据各界面上的按钮个数以及位置等 信息,对各界面上的按钮进行编号并进行存储,同时根据各界面的特点,对按 键进行编号并进行存储。
当然,如果某些界面釆用一些有规律性的编号方案,实施例可以在运行时 自动确立按钮与编号的对应关系。例如,本实施例中某些界面通过使用Windows 编程接口 EnumChildWindows ()枚举采用这种自动编号方案的界面上的所有 按钮,通过Windows编程接口 GetWindowRect ()获取该界面上所有按钮的中 心坐标按从左到右,从上到下排列,分列与阿拉伯自然数字1, 2,...依次关联。
在具体的实施过程中,同样的按键针对不同的界面,实现的功能可以有所 不同。例如按4建"取消",请参阅图2及图3, 在图2的主功能界面A中,该
按键的功能相当于点击界面A上的"后退"按钮;而在图3的主功能界面B中, 该按键的功能相当于点击界面B上的"取消"按钮。针对这个情况,在图2界 面A中分配给"取消"按键的的编号为"后退",其语音命令为"后退(h6utu i)",在图3界面B中分配给"取消"按键的的编号为"取消",其语音命令 为"取消(qC xUo)"。
在图2界面A及图3界面B中,由于"左","右,,,"上,,,"下", "确定"五个4务i的功能一致,因此,在这两个界面中,这些4^建分配到的编 号分别为"左","右,,,"上","下","确定",这此编号的语音指令 分别是"左(zu6)","右(y")","上(sh"g)","下(x"),,,"确 定(qu 6 d i ng),,。
在步骤S102中,在进入语音指令识别状态后,将控制符号与语音指令建 立的关联进行显示,引导用户进行相应的语音输入。
譬如,附图2界面A的按钮"后退","退出,,,"目的地","浏览地 图,,,"回家,,编号分别编号为1, 2, 3, 4, 5;附图3界面B的按钮"确定,,, "取消"编号编号分别为l, 2。
再如,上方向键,下方向键,左方向键,右方向键,确定键,取消键,这 些键(控制符号)在附图2界面A中的编号情况显示为""T (上)丄(下)—(左)— (右,(确定)Esc(后退)",在附图3界面B中的编号情况显示为"T (上)i (下) —(左)—(右)B(确定)Esc(取消)"。
这时,因编号和语音指令已确定对应关系,从而也就确定了各按钮的语音 指令。
譬如,附图2中的"目的地,,4姿钮,它的编号为"3",因此,用户输入语 音指令"三(san)"就可以触发"目的地"按钮的功能。
在步骤S103中,判断用户的输入是否为语音输入,当用户的输入为语音 输入时,进行步骤S104;当用户的输入不是语音输入时,按照用户的输入的其 它命令形式进行控制。
在步骤S104中,接收语音输入,才艮据接收到的语音输入匹配相应的语音 指令。
该步骤有两类数据的输入 一是语音接收器所输入的语音指令数据;二是 和具体界面相关的待选语音指令集。譬如附图2的界面A下,待选的语音指令 集为一(yl), 二Or), 三(san), 四(s i ), 五(wti),左(zu6),右(y 6 u),上(sh & ng),下(xi & ),确定(qu 6 d i ng),后退(h 6 u tu i ),语音识 别模块利用用户输入的语音指令数据,在待选语音指令集中搜寻最接近的语音 指令。
在步骤S105中,判断匹配到的语音指令对应的为按钮或者4务建。
由于语音指令已经确定因此可以找到该语音指令对应的控制符号,通过判
断控制符号的属性就可辨别语音指令对应的为按钮或者按键。
当判断接收到的语音指令为按钮编号对应的语音指令,进行步骤S106;当
语音指令对应的是控制符号的按一睫时,进行步骤S107。
步骤S106,触发该编号所对应按^組的点击,响应该4务組功能。 在步骤S107中,触发该编号所对应"fe^:的点击,响应该4要一睫功能。 当语音指令对应的不是控制符号时,显示提示,并继续对接收到的语音指
令进行判断。
本发明实施例还提供了一种移动终端,包括有一种语音控制装置,请参阅图3。
编号方案确定模块11确定编号方案。
编号模块12对系统交互界面上的控制符号进行编号,其中,该控制符号包 括有设备的按键和功能界面的按钮。
关联建立模块13按照确定的编号方案将编号与相应的语音指令建立关联, 当然,在具体实施过程中,针对不同软件交互界面,对电子设备的按键和语音 指令进行关联,具体的建立关联的过程在前文已述,此处就不再赘述。
关联关系存储模块14将建立的关联关系进行存储。
在进入语音控制模式后,编号显示模块15将控制符号和与其关联的编号进 行显示,其中,所述编号对应有语音指令。
语音识别才莫块16接收语音输入,根据该语音输入匹配相应的语音指令。 编号查找模块17根据接收到的语音指令查找相应的编号。 控制符号查找模块18根据查找到的编号根据关联关系存储模块14存储的 关联关系查找相应的控制符号。
操作执行模块19根据查找到的控制符号执行相应操作。 本发明实施例通过将将控制符号和与其关联的编号进行显示,在用户进行 语音输入后,接收并识别语音指令,根据该语音指令查找相应的编号,根据查 找到的编号查找相应的控制符号,并根据查找到的控制符号执行相应操作,实 现了语音完全对复杂的多界面多4^t功能的软件和硬件的控制,且将复杂的语 音键元素转化为有限的几个符号,增加了匹配度,不再需用户进一步确认,节 约了使用的时间成本,增加了语音控制的适用性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发 明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明 的保护范围之内。
权利要求
1、一种语音控制方法,其特征在于,所述方法包括以下步骤将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;接收并识别语音指令;根据所述语音指令查找相应的编号;根据所述编号查找相应的控制符号;根据所述控制符号执行相应操作。
2、 如权利要求1所述的移动终端控制方法,其特征在于,所述控制符号包 括有设备的按键和功能界面的按钮。
3、 如权利要求1或2所述的移动终端控制方法,其特征在于,所述编号是 通过以下步骤建立关联确定编号方案;对系统交互界面上的控制符号进行编号; 按照确定的编号方案将编号与相应的语音指令建立关联; 将建立的关联关系进行存储。
4、 如权利要求1所述的移动终端控制方法,其特征在于,针对不同软件交 互界面,对电子设备的按键和语音指令进行关联。
5、 一种语音控制装置,其包括语音识别模块,用于接收语音输入,根据该 语音输入匹配相应的语音指令,其特征在于,所述装置还包括编号显示4莫块,用于将控制符号和与其关联的编号进行显示,其中,所述 编号对应有语音指令;编号查找才莫块,用于根据接收到的语音指令查找相应的编号; 控制符号查找;漠块,用于才艮据所述编号查找相应的控制符号; 操作执行模块,用于根据所述控制符号执行相应操作。
6、 如权利要求5所述的语音控制装置,其特征在于,所述控制符号包括有 设备的按键和功能界面的按钮。
7、 如权利要求5或6所述的语音控制装置,其特征在于,所述装置还包括 编号方案确定模块,用于确定编号方案;编号模块,用于对系统交互界面上的控制符号进行编号;关联建立模块,用于按照确定的编号方案将编号与相应的语音指令建立关联;关联关系存储模块,用于将建立的关联关、系进行存储。
8、 如权利要求5所述的语音控制装置,其特征在于,针对不同软件交互界 面,对电子设备的按键和语音指令进行关联。
9、 一种移动终端,,其特征在于,所述移动终端还包括有一种语音控制装 置,其包括语音识别才莫块,用于接收语音输入,根据该语音输入匹配相应的语 音指令,所述装置还包括编号显示4莫块,用于将控制符号和与其关联的编号进^f亍显示,其中,所述 编号对应有语音指令;编号查找才莫块,用于根据接收到的语音指令查找相应的编号; 控制符号查找才莫块,用于才艮据所述编号查找相应的控制符号; 操作执行才莫块,用于根据所述控制符号执行相应操作。
10、 如权利要求9所述的移动终端,其特征在于,所述控制符号包括有设 备的按键和功能界面的按钮。
11、 如权利要求9或IO所述的移动终端,其特征在于,所述装置还包括 编号方案确定^^块,用于确定编号方案编号模块,用于对系统交互界面上的控制符号进行编号;关联建立才莫块,用于按照确定的编号方案将编号与相应的语音指令建立关联;关联关系存储模块,用于将建立的关联关系进行存储。
12、 如权利要求9所述的移动终端,其特征在于,针对不同软件交互界面, 对电子设备的按键和语音指令进行关联。
全文摘要
本发明适用于语音控制技术领域,提供了一种语音控制方法、装置及移动终端,所述方法包括以下步骤将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;接收并识别语音指令;根据所述语音指令查找相应的编号;根据所述编号查找相应的控制符号;根据所述控制符号执行相应操作。本发明解决了现有技术中语音控制方法匹配度差,以及需要用户进一步确认,增加了使用时间成本的问题,从而提高了语音控制的适用性。
文档编号G10L15/00GK101188108SQ20071012504
公开日2008年5月28日 申请日期2007年12月17日 优先权日2007年12月17日
发明者张文星 申请人:凯立德欣技术(深圳)有限公司