本发明涉及语音控制技术领域,特别是涉及一种语音控制光标移动的方法和一种语音控制光标移动的装置。
背景技术:
光标(包括鼠标指针)用于显示光标控制输入设备在操作界面上的位置。目前,光标控制输入设备采用最多的是鼠标,而通过鼠标控制光标移动的方式主要有两种,一种是在桌面上移动鼠标,通过改变坐标相对值的方式来实现光标移动,另一种是空中移动鼠标,通过陀螺仪产生相对值的变化来实现光标移动。以上两种方式均需要手动操作,对于手部有缺陷的人群使用起来极其不方便,且实际工作和生活中,人们常常无法腾出手来操作。
随着通讯技术的不断发展,终端的控制方式越来越丰富,也越来越智能。在人机交互应用中,语音识别技术逐渐进入我们的日常生活,如现有的智能手机、平板电脑、智能电视等都附带有语音识别功能。虽然现有的语音识别技术可以实现指定范围内较为简单的单一指令任务,例如“打开相机”的操作。但是,现有的语音识别技术与当前操作界面上显示的内容无关,交互性小,且不能控制光标在操作界面上移动。
技术实现要素:
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音控制光标移动的方法和相应的一种语音控制光标移动的装置。
为了解决上述问题,本发明实施例公开了一种语音控制光标移动的方法,包括
将操作界面划分为若干区域;
对每个所述区域预设关联的区域语音标识;
接收区域语音指令;
将所述区域语音指令在所述区域语音标识的集合中进行匹配;
匹配成功,则将所述区域语音标识对应的区域确定为目标区域;
将光标移动至所述目标区域。
在一优选实施方式中,在所述将光标移动至所述目标区域的步骤之后,还包括:
判断所述光标是否指向所述目标区域的目标操作对象;
若否,则将所述目标区域作为操作界面,并重新执行所述将操作界面划分为若干区域的步骤。
在一优选实施方式中,还包括:
若是,则接收触发语音指令以触发所述目标区域的目标操作对象。
在一优选实施方式中,以所述操作界面的左下角设为坐标原点建立直角坐标系,将所述操作界面显示的单个像素的宽度设为所述直角坐标系的两条数轴的单位长度,所述将光标移动至所述目标区域的步骤,包括:
确定所述目标区域的中心像素在所述直角坐标系的坐标位置;
将所述光标移动至所述目标区域的中心像素的坐标位置。
在一优选实施方式中,在所述将光标移动至所述目标区域的步骤之后,还包括:
接收方位语音指令;
根据所述方位语音指令移动所述光标。
在一优选实施方式中,所述操作界面具有若干特定位置,对所述特定位置预设关联的特定位置语音标识,所述方法还包括:
接收到特定位置语音指令;
将所述特定位置语音指令在所述特定位置语音标识的集合中进行匹配;
当匹配成功时,将所述特定位置语音标识对应的特定位置确定为目标区域;
将所述光标移动至所述特定位置语音标识对应的特定位置。
在一优选实施方式中,在所述将操作界面划分为若干区域的步骤之前,还包括:
进入语音控制模式。
在一优选实施方式中,所述进入语音控制模式的步骤,包括:
接收语音控制模块启动命令;
根据所述语音控制模式启动命令进入语音控制模式。
在一优选实施方式中,所述对每个所述区域预设关联的区域语音标识的步骤,包括:
在所述操作界面显示每个所述区域的界线;
在每个所述区域内显示关联的区域语音标识。
为了解决上述问题,本发明实施例公开了一种语音控制光标移动的装置,包括:
操作界面划分模块,用于将操作界面划分为若干区域;
关联模块,用于对每个所述区域预设关联的区域语音标识;
接收区域语音指令模块,用于接收区域语音指令;
语音匹配模块,用于将所述区域语音指令在所述区域语音标识的集合中进行匹配;
目标区域确定模块,用于在匹配成功时,将所述区域语音标识对应的区域确定为目标区域;
光标移动模块,用于将光标移动至所述目标区域。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例中,通过将操作界面划分为若干区域,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;从而实现语音控制光标移动,使光标指向操作界面的任意目标区域,以提高语音识别技术与操作界面的交互性。
附图说明
图1是本发明的一种语音控制光标移动的方法实施例一的步骤流程图;
图2a-2c是本发明实施例一语音控制光标移动的操作示意图;
图3是本发明的一种语音控制光标移动的方法实施例二的步骤流程图;
图4a-4c是本发明实施例二语音控制光标移动的操作示意图;
图5是本发明实施例二基于图2a-2c语音控制光标移动的操作示意图;
图6是本发明的一种语音控制光标移动装置实施例三的结构框图;
图7是本发明的一种语音控制光标移动装置实施例四的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,通过将操作界面划分为若干区域,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;从而实现语音控制光标移动,使光标指向操作界面的任意目标区域,以提高语音识别技术与操作界面的交互性。
下面,通过以下具体实施例分别对本发明的方案进行详细介绍。
实施例一:
参照图1,示出了本发明的一种语音控制光标移动的方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101,将操作界面划分为若干区域。
在本发明实施例中,将终端设备的操作界面划分为若干区域,所述操作界面可以是电脑屏幕显示界面、手机屏幕显示界面、平板电脑屏幕显示界面、智能电视屏幕显示界面等。将操作界面划分为若干区域,其中,可以是按照操作界面的面积均分成若干区域,也可以是按照操作界面的功能分布特点进行划分。如图2a所示,将操作界面均分为九个区域。在一优选实施例中,在所述操作界面的最上层虚拟一个与所述操作界面大小相同的半透明窗口,所述将操作界面划分为若干区域,可以理解为将所述半透明窗口划分为若干区域。
步骤102,对每个所述区域预设关联的区域语音标识。
在对操作界面划分区域后,对每个所述区域预设关联的区域语音标识。所述区域语音标识是终端能够识别的字符串,可以对应终端所支持的控制操作。每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的。如图2b所示,对图2a的九个区域分别预设关联的区域语音标识:“0-9”,需要说明的是,为了提高语音识别是准确性,一般采用数字或字母这类较为简单的语音作为区域语音标识,当然并不限于上述举例。
步骤103,接收区域语音指令。
本实施例中,终端设备具备语音接收模块,在操作界面划分为若干区域并且对每个区域预设关联的区域语音标识之后,开启语音接收模块,通过语音接收模块接收用户输入的语音指令。
例如,语音接收模块接收用户输入的区域语音指令为“8”。
步骤104,将所述区域语音指令在所述区域语音标识的集合中进行匹配。
所述区域语音标识的集合包括当前界面所划分的所有区域的区域语音标识的集合。在一优选实施例中,所述当前界面划分的所有区域,可以理解为,所述半透明窗口划分的所有区域。将所述区域语音指令在所述区域语音标识的集合中进行匹配,可以但不限于理解为,从所述区域语音标识的集合中寻找与所述区域语音指令相同的区域语音标识。
例如,从所述区域语音标识的集合中寻找与用户输入的语音指令为“8”相同的区域语音标识,即寻找的区域语音标识为“8”。
步骤105,匹配成功,则将所述区域语音标识对应的区域确定为目标区域。
每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的,通过确定的区域语音标识,可以确定其关联的唯一确定的区域,并将该区域确定为目标区域。例如,确定区域语音标识为“8”后,可以确定“8”对应的区域,并将该区域设为目标区域。
若匹配失败,则终端可以不执行任何操作,也可以发出提示语音或提示窗口提醒用户输入的区域语音指令不符合当前界面所支持的操作,当然,本领域技术人员可以根据实际需要设置其他的操作方式,本发明实施例对此并不加以限制。
步骤106,将光标移动至所述目标区域。
所述目标区域为与所述区域语音指令对应的唯一确定的区域,并将光标移动至目标区域中的任意位置。如图2c,将光标移动至操作界面的区域8的任意一个位置。在一实施例中,当将光标移动至所述目标区域后,所述操作界面的最上层虚拟的与所述操作界面大小相同的半透明窗口消失。
本实施例在操作界面的最上层虚拟一个与所述操作界面大小相同的半透明窗口,通过将所述半透明窗口划分为若干区域,实现将操作界面划分为若干区域;接着,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;从而实现语音控制光标移动,使光标指向操作界面的任意目标区域,以提高语音识别技术与操作界面的交互性。
实施例二:
参照图3,示出了本发明的一种语音控制光标移动的方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201,进入语音控制模式。
终端进入语音控制模式后,用户可以向终端输入语音指令,实现语音控制功能。
在本发明的一种优选实施例中,当终端接收到语音控制模式启动命令时,可以根据语音控制模式启动命令进入语音控制模式。
用户可以通过触发终端按键发出语音控制模式启动命令,也可以通过对终端语音输入模块发出语音控制模式启动命令以启动语音控制模式。所述语音控制模式启动命令可以由终端提前预设,也可以由用户自定义设置后存储到终端中。
例如,当用户按下光标移动按键时,即可启动语音控制模式;或者,当用户朝终端语音输入模块发出“0”时,即可启动语音控制模式。当语音控制模式启动时,在所述操作界面的最上层会自动虚拟一个和所述操作界面相同大小的半透明窗口,所述半透明窗口恰好覆盖所述操作界面;所述半透明窗口上设有与分辨率一样大小的定位方格,每个方格用数字标识,每个方格都有对应的绝对值坐标。
步骤202,将操作界面划分为若干区域。
将操作界面划分为若干区域,其中,可以是按照操作界面的面积均分成若干区域,也可以是按照操作界面的功能分布特点进行划分。本实施例中,所述将操作界面划分为若干区域,可以理解为,将所述半透明窗口划分为若干区域。
在本发明的一种优选实施例中,以所述操作界面的左下角设为坐标原点建立直角坐标系,将所述操作界面显示的单个像素的宽度设为所述直角坐标系的两条数轴的单位长度,所述操作界面具有若干特定位置,所述特定位置包括操作界面的左上角像素点、右上角像素点、左下角像素点、右下角像素点及操作界面的中心像素点。如图4a所示,所述操作界面显示的分辨率为1920*1080,该操作界面的左下角像素点对应的坐标为(0,0),该操作界面的右下角像素点对应的坐标为(0,1920),该操作界面的左上角像素点对应的坐标为(0,1080),该操作界面的右上角像素点对应的坐标为(1920,1080),该操作界面的中心像素点对应的坐标为(960,540)。需要说明的是,在本实施例中,可以将所述操作界面理解为所述半透明窗口。
步骤203,对每个所述区域预设关联的区域语音标识。
在对操作界面划分区域后,对每个所述区域预设关联的区域语音标识。所述区域语音标识是终端能够识别的字符串,可以对应终端所支持的控制操作。每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的。如图2b所示,对图2a的九个区域分别预设关联的区域语音标识:“0-9”,需要说明的是,为了提高语音识别是准确性,一般采用数字或字母这类较为简单的语音作为区域语音标识,当然并不限于上述举例。
在本发明的一种优选实施例中,所述对每个所述区域预设关联的区域语音标识的步骤,包括以下子步骤:
在所述操作界面显示每个所述区域的界线;
在每个所述区域内显示关联的区域语音标识。
所述在所述操作界面显示每个所述区域的界线的步骤,可以理解为,在所述半透明窗口显示每个所述区域的界线。所述在每个所述区域内显示关联的区域语音标识的步骤,可以理解为,在所述半透明窗口的每个区域内显示关联的区域语音标识。用户根据界线显示和区域语音标识的显示可以明确目标操作对象所在的目标区域。所述目标操作对象是用户欲使光标最终指向的操作对象。
本实施例中,还包括对所述特定位置预设关联的特定位置语音标识。例如,对左上角像素点预设关联的特定位置语音标识为“左上角”,对右上角像素点预设关联的特定位置语音标识为“右上角”,对左下角像素点预设关联的特定位置语音标识为“左下角”,对右下角像素点预设关联的特定位置语音标识为“右下角”,对中心像素点预设关联的特定位置语音标识为“中间”。
在本发明的一种优选实施例中,所述对每个所述区域预设关联的区域语音标识的步骤,还包括预设方位语音指令,所述方位语音指令与光标关联,所述方位语音指令包括方向指令和数字指令,光标根据接收到的所述方位语音指令朝对应的方向移动对应数字的步数。单位步数可以设为一个像素的宽度,也可以根据实际情况设置,此处不作限定。
步骤204,接收区域语音指令。
终端设备具备语音接收模块,在操作界面划分为若干区域并且对每个区域预设关联的区域语音标识之后,开启语音接收模块,通过语音接收模块接收用户输入的语音指令。所述语音指令包括区域语音指令和特定位置语音指令。
步骤205,将所述区域语音指令在所述区域语音标识的集合中进行匹配。
所述区域语音标识的集合包括当前界面所划分的所有区域的区域语音标识的集合。所述当前界面划分的所有区域,可以理解为,所述半透明窗口划分的所有区域。将所述区域语音指令在所述区域语音标识的集合中进行匹配,可以但不限于理解为,从所述区域语音标识的集合中寻找与所述区域语音指令相同的区域语音标识。
本实施例中,还包括:
将所述特定位置语音指令在所述特定位置语音标识的集合中进行匹配。
当终端接收到语音指令为特定位置语音指令时,将所述特定位置语音指令在所述特定位置语音标识的集合中进行匹配。
例如,如图4b,当所述特定位置语音指令为“左上角”,将所述特定物位置语音指令为“左上角”在所述特定位置语音标识集合中进行匹配,所述特定位置语音标识集合包括“左上角”、“右上角”、“左下角”、“右下角”及“中间”。
步骤206,匹配成功,则将所述区域语音标识对应的区域确定为目标区域。
每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的,通过确定的区域语音标识,可以确定其关联的唯一确定的区域,并将该区域确定为目标区域。
本实施例中,当特定位置语音指令匹配成功时,将所述特定位置语音标识对应的特定位置确定为目标区域。
当所述特定位置语音指令“左上角”与所述特定位置语音标识中的“左上角”匹配成功时,将所述“左上角”对应的“左上角像素”的位置确定为目标区域。
步骤207,将光标移动至所述目标区域。
所述目标区域为与所述区域语音指令对应的唯一确定的区域,并将光标移动至目标区域中的任意位置。
本实施例中,当所述目标区域为特定位置时,将所述光标移动至所述特定位置语音标识对应的特定位置。如图4b所示,所述目标区域为“左上角”,则将所述光标移动至“左上角”对应的“左上角像素”的位置,即坐标为(0,1080)的像素点位置。
在本发明一优选实施例中,所述将光标移动至所述目标区域的步骤,还包括:
确定所述目标区域的中心像素在所述直角坐标系的坐标位置;
将所述光标移动至所述目标区域的中心像素的坐标位置。
在本发明另一实施例中,所述将光标移动至所述目标区域的步骤之后,还包括:
接收方位语音指令;
根据所述方位语音指令移动所述光标。
例如,如图4c,所述方位语音指令包括方向指令和数字指令,光标根据接收到的所述方位语音指令朝对应的方向移动对应数字的步数。单位步数设为十个像素的宽度,即步数为1时,移动10个单位坐标长度。当接收的方位语音指令为“右3”时,光标从图4b坐标为(0,1080)的位置向右移动30个单位坐标长度,即移动至图4c坐标为(30,1080)的位置。采用此步骤,可以使光标定位更加准确。
步骤208,判断所述光标是否指向所述目标区域的目标操作对象。
步骤209,若否,则将所述目标区域作为操作界面,并重新执行所述将操作界面划分为若干区域的步骤。
步骤210,若是,则接收触发语音指令以触发所述目标区域的目标操作对象。
在将光标移动至目标区域之后,判断光标是否指向目标区域的目标操作对象。当光标未指向目标区域的目标操作对象时,则将所述目标区域作为操作界面,并返回步骤202,此时,所述步骤202中的操作界面为步骤209中的目标区域,同时删除所述目标区域外的其他区域的界线和关联的语音标识,如图5所示,图5是基于图2a-2c后进行步骤210操作的操作示意图。
在另一实施例中,当光标未指向目标区域的目标操作对象时,则将所述半透明窗口缩小至与所述目标区域相同大小,并返回步骤202,此时,所述步骤202中的操作界面为所述半透明窗口,即对应为所述步骤209中的目标区域。
在又一实施例中,当光标未指向目标区域的目标操作对象时,则将所述目标区域放大至当前操作界面的大小,并将所述目标区域作为操作界面,返回步骤202。
当光标指向目标区域的目标操作对象时,则接收触发语音指令以触发所述目标区域的目标操作对象。所述触发语音指令与光标相关联,包括“打开”和“查看”指令,所述“打开”指令相当于鼠标左键功能,用于选中和/或打开目标操作对象,所述“查看”指令相当于鼠标右键功能,用于弹出与目标操作对象相关的菜单。所述触发语音指令可以由终端提前预设,也可以由用户自定义设置后存储到终端中。在一优选实施例中,当接收所述触发语音指令时,所述半透明窗口消失。
进一步的,在所述语音控制光标移动的方法中,还包括预设返回指令,所述返回指令用于当用户误操作或在操作过程中改变目标操作对象时,通过返回指令返回至上一步骤。当用户想要返回至步骤201时,可以通过发出语音控制模式启动命令返回。本实施例通过接收语音控制模式启动命令进入语音控制模式,在操作界面的最上层自动虚拟一个和所述操作界面相同大小的半透明窗口,通过将所述半透明窗口划分若干区域,实现将操作界面划分为若干区域;接着,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;接着再判断光标是否指向目标区域的目标操作对象,当光标未指向目标操作对象时,将目标区域作为操作界面并返回将操作界面划分为若干区域的步骤,从而实现语音控制光标移动,使光标指向操作界面的目标操作对象,此外,通过接收触发语音指令,对目标操作对象进行语音控制,以提高语音识别技术与操作界面的交互性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例三:
参照图6,示出了本发明的一种语音控制光标移动装置实施例的结构框图,具体可以包括如下模块:
操作界面划分模块301,用于将操作界面划分为若干区域;
关联模块302,用于对每个所述区域预设关联的区域语音标识;
接收区域语音指令模块303,用于接收区域语音指令;
语音匹配模块304,用于将所述区域语音指令在所述区域语音标识的集合中进行匹配;
目标区域确定模块305,用于在匹配成功时,将所述区域语音标识对应的区域确定为目标区域;
光标移动模块306,用于将光标移动至所述目标区域。
本实施例的装置用于执行上述实施例中的方法步骤,在此不再赘述。
本实施例在操作界面的最上层虚拟一个与所述操作界面大小相同的半透明窗口,通过将所述半透明窗口划分为若干区域,实现将操作界面划分为若干区域;接着,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;从而实现语音控制光标移动,使光标指向操作界面的任意目标区域,以提高语音识别技术与操作界面的交互性。
实施例四:
参照图7,示出了本发明的一种语音控制光标移动装置实施例的结构框图,具体可以包括如下模块:
语音控制模式启动模块401,用于进入语音控制模式。
在本发明的一种优选实施例中,所述语音控制模式启动模块401包括如下子模块:
语音控制模式启动命令接收子模块,用于接收语音控制模式启动命令;
语音控制模式进入子模块,用于根据所述语音控制模式启动命令进入语音控制模式。
用户可以通过触发终端按键发出语音控制模式启动命令,也可以通过对终端语音输入模块发出语音控制模式启动命令以启动语音控制模式。所述语音控制模式启动命令可以由终端提前预设,也可以由用户自定义设置后存储到终端中。
例如,当用户按下光标移动按键时,即可启动语音控制模式;或者,当用户朝终端语音输入模块发出“0”时,即可启动语音控制模式。当语音控制模式启动时,在所述操作界面的最上层会自动虚拟一个和所述操作界面相同大小的半透明窗口,所述半透明窗口恰好覆盖所述操作界面;所述半透明窗口上设有与分辨率一样大小定位方格,每个方格用数字标识,每个方格都有对应的绝对值坐标。
操作界面划分模块402,用于将操作界面划分为若干区域。
将操作界面划分为若干区域,其中,可以是按照操作界面的面积均分成若干区域,也可以是按照操作界面的功能分布特点进行划分。本实施例中,所述将操作界面划分为若干区域的实现,是将所述半透明窗口划分为若干区域。
在本发明的一种优选实施例中,以所述操作界面的左下角设为坐标原点建立直角坐标系,将所述操作界面显示的单个像素的宽度设为所述直角坐标系的两条数轴的单位长度,所述操作界面具有若干特定位置,所述特定位置包括操作界面的左上角像素点、右上角像素点、左下角像素点、右下角像素点及操作界面的中心像素点。当所述操作界面显示的分辨率为1920*1080时,该操作界面的左下角像素点对应的坐标为(0,0),该操作界面的右下角像素点对应的坐标为(0,1920),该操作界面的左上角像素点对应的坐标为(0,1080),该操作界面的右上角像素点对应的坐标为(1920,1080),该操作界面的中心像素点对应的坐标为(960,540)。需要说明的是,在本实施例中,可以将所述操作界面理解为所述半透明窗口。
关联模块403,用于对每个所述区域预设关联的区域语音标识。
在对操作界面划分区域后,对每个所述区域预设关联的区域语音标识。所述区域语音标识是终端能够识别的字符串,可以对应终端所支持的控制操作。每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的。为了提高语音识别是准确性,一般采用数字或字母这类较为简单的语音作为区域语音标识,当然并不限于上述举例。
在本发明的一种优选实施例中,所述关联模块403包括以下子模块:
区域界线显示子模块,用于在所述操作界面显示每个所述区域的界线;可以理解为,在所述半透明窗口显示每个所述区域的界线
区域语音标识显示子模块,用于在每个所述区域内显示关联的区域语音标识;可以理解为,在所述半透明窗口的每个区域内显示关联的区域语音标识。
进一步的,所述关联模块403还用于对所述特定位置预设关联的特定位置语音标识。例如,对左上角像素点预设关联的特定位置语音标识为“左上角”,对右上角像素点预设关联的特定位置语音标识为“右上角”,对左下角像素点预设关联的特定位置语音标识为“左下角”,对右下角像素点预设关联的特定位置语音标识为“右下角”,对中心像素点预设关联的特定位置语音标识为“中间”。
进一步的,所述关联模块403还包括:
方位语音指令关联子模块,用于对光标预设关联的方位语音指令。所述方位语音指令包括方向指令和数字指令,光标根据接收到的所述方位语音指令朝对应的方向移动对应数字的步数。单位步数可以设为一个像素的宽度,也可以根据实际情况设置,此处不作限定。
接收区域语音指令模块404,用于接收区域语音指令。
终端设备具备语音接收模块,在操作界面划分为若干区域并且对每个区域预设关联的区域语音标识之后,开启语音接收模块,通过语音接收模块接收用户输入的语音指令。所述语音指令包括区域语音指令和特定位置语音指令。
语音匹配模块405,用于将所述区域语音指令在所述区域语音标识的集合中进行匹配。
所述区域语音标识的集合包括当前界面所划分的所有区域的区域语音标识的集合。所述当前界面划分的所有区域,可以理解为,所述半透明窗口划分的所有区域。将所述区域语音指令在所述区域语音标识的集合中进行匹配,可以但不限于理解为,从所述区域语音标识的集合中寻找与所述区域语音指令相同的区域语音标识。
进一步的,所述语音匹配模块405还包括如下子模块:
特定位置语音标识匹配子模块,用于将所述特定位置语音指令在所述特定位置语音标识的集合中进行匹配。
当终端接收到语音指令为特定位置语音指令时,将所述特定位置语音指令在所述特定位置语音标识的集合中进行匹配。
例如,当所述特定位置语音指令为“左上角”,将所述特定物位置语音指令为“左上角”在所述特定位置语音标识集合中进行匹配,所述特定位置语音标识集合包括“左上角”、“右上角”、“左下角”、“右下角”及“中间”。
目标区域确定模块406,用于在匹配成功时,将所述区域语音标识对应的区域确定为目标区域。
每个区域预设一个关联的区域语音标识,且每个区域关联的区域语音标识都是唯一的,通过确定的区域语音标识,可以确定其关联的唯一确定的区域,并将该区域确定为目标区域。
本实施例中,所述目标区域确定模块406还包括如下子模块:
特定位置确定子模块,用于在特定位置语音指令与特定位置语音标识匹配成功时,将所述特定位置语音标识对应的区域确定为目标区域。
当特定位置语音指令匹配成功时,将所述光标移动至所述特定位置语音标识对应的特定位置。当所述特定位置语音指令“左上角”与所述特定位置语音标识中的“左上角”匹配成功时,将所述“左上角”对应的“左上角像素”的位置确定为目标区域。
光标移动模块407,用于将光标移动至所述目标区域。
所述目标区域为与所述区域语音指令对应的唯一确定的区域,并将光标移动至目标区域中的任意位置。
本实施例中,所述光标移动模块407还包括如下子模块:
光标移至特定位置子模块,用于将所述光标移动至所述特定位置语音标识对应的特定位置。
当所述目标区域为特定位置时,将所述光标移动至所述特定位置语音标识对应的特定位置。例如,所述目标区域为“左上角”,则将所述光标移动至“左上角”对应的“左上角像素”的位置,即坐标为(0,1080)的像素点位置。
在本发明一优选实施例中,所述光标移动模块407还包括如下子模块:
中心像素坐标确定子模块,用于确定所述目标区域的中心像素的坐标;
光标移至中心像素子模块,用于将所述光标移动至所述目标区域的中心像素的坐标位置。
在本发明另一实施例中,还包括:
方位语音指令接收模块,用于接收方位语音指令;
光标跟随方位语音指令移动模块,用于根据所述方位语音指令移动所述光标。
所述方位语音指令包括方向指令和数字指令,光标根据接收到的所述方位语音指令朝对应的方向移动对应数字的步数。当单位步数设为十个像素的宽度时,即步数为1时,移动10个单位坐标长度。接收的方位语音指令为“右3”时,光标向右移动30个单位坐标长度,即纵坐标不变,横坐标增加30。采用此步骤,可以使光标定位更加准确。
目标操作对象判断模块408,用于判断所述光标是否指向所述目标区域的目标操作对象。
操作界面重确定模块409,用于在所述光标未指向所述目标区域的目标操作对象时,将所述目标区域作为操作界面。
目标操作对象触发模块410,用于在所述光标指向所述目标区域的目标操作对象时,接收触发语音指令以触发所述目标区域的目标操作对象。
在将光标移动至目标区域之后,判断光标是否指向目标区域的目标操作对象。当光标未指向目标区域的目标操作对象时,则将所述目标区域作为操作界面,此时,所述操作界面划分模块402中的操作界面为所述操作界面重确定模块409中的目标区域,同时删除所述目标区域外的其他区域的界线和关联的语音标识。
在另一实施例中,当光标未指向目标区域的目标操作对象时,则将所述半透明窗口缩小至与所述目标区域相同大小,此时,所述操作界面划分模块402中的操作界面为所述半透明窗口,即对应为所述操作界面重确定模块409中的目标区域。
在又一实施例中,当光标未指向目标区域的目标操作对象时,则将所述目标区域放大至当前操作界面的大小,并将所述目标区域作为操作界面。
当光标指向目标区域的目标操作对象时,则接收触发语音指令以触发所述目标区域的目标操作对象。所述触发语音指令与光标相关联,包括“打开”和“查看”指令,所述“打开”指令相当于鼠标左键功能,用于选中和/或打开目标操作对象,所述“查看”指令相当于鼠标右键功能,用于弹出与目标操作对象相关的菜单。所述触发语音指令可以由终端提前预设,也可以由用户自定义设置后存储到终端中。在一优选实施例中,当接收所述触发语音指令时,所述半透明窗口消失。
进一步的,在所述语音控制光标移动的装置中,还包括预设返回指令模块,所述预设返回指令模块用于当用户误操作或在操作过程中改变目标操作对象时,通过所述预设返回指令模块退回。当用户想要返回至进入语音控制模式的状态时,可以通过所述语音控制模式启动模块401返回。
本实施例通过接收语音控制模式启动命令进入语音控制模式,在操作界面的最上层自动虚拟一个和所述操作界面相同大小的半透明窗口,通过将所述半透明窗口划分若干区域,实现将操作界面划分为若干区域;接着,对每个区域预设关联的区域语音标识,然后接收区域语音指令,将区域语音指令在区域语言标识的集合中进行匹配,当匹配成功时,将区域语音标识对应的区域确定为目标区域,并将光标移动至目标区域;接着再判断光标是否指向目标区域的目标操作对象,当光标未指向目标操作对象时,将目标区域作为操作界面并返回将操作界面划分为若干区域的步骤,从而实现语音控制光标移动,使光标指向操作界面的目标操作对象,此外,通过接收触发语音指令,对目标操作对象进行语音控制,以提高语音识别技术与操作界面的交互性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种语音控制光标移动方法和一种语音控制光标移动装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。