专利名称:在电子产品中实现语音识别操控的方法
技术领域:
本发明涉及电子产品,特别是涉及电子产品的非特定人语音识别的操控方法。
背景技术:
语音识别技术在不断发展,应用范围也越来越广,从用于玩具的简单应用,到利用语音识别技术的智能家用电子产品。现有的电子产品的语音识别操控方法,通常是在电子产品中设置一语音识别功能模块,为其配置一套命令词构成的控制指令集。然而,由于不同使用者语音特征的差异性较大,由于使用环境的背景声音信号的情形差异性很大,始终不能摆脱误识别、误动作的困扰,从而导致电子产品的语音识别操控应用存在很大的局限性。
发明内容
本发明要解决的技术问题在于改进上述现有技术的不足,而提出一种在电子产品中实现语音识别操控的方法,可以提升抗干扰能力,扩大电子产品的语音识别操控应用。本发明解决上述技术问题采用的技术方案包括,提出一种在电子产品中实现语音识别操控的方法,设置一语音识别功能模块,使其能够工作在三种状态:允许识别命令词的正常状态;只允许识别总命令词的待机状态;以及既不允许识别命令词,也不允许识别总命令词的伪暂停状态,三种状态可通过周期性地检测当前在设定的时间范围内的情形而有条件地切换,状态的切换的同时,上一检测周期结束、下一检测周期开始。本发明的方法,在电子产品开机启动时,使该语音识别功能模块进入待机状态,并开启周期性的检测;在处于待机状态时,如果识别到一总命令词,则转为正常状态;如果没有识别到该总命令词且在一个检测周期内识别到的声音信号次数超出一设定值,则转为伪暂停状态;否则维持在待机状态;在处于正常状态时,如果在一个检测周期内没有识别到一命令词,则转为待机状态;在处于伪暂停状态时,如果在一个检测周期内没有识别到声音信号,则转为待机状态;否则维持在伪暂停状态。本发明的方法,是通过一第一计数器来实现处于待机状态时的声音信号次数累计的;是通过一第二计数器来实现处于伪暂停状态时的声音信号次数累计的。本发明的方法,如果识别到一特定命令词,可以关闭该语音识别功能模块的语音识别功能。本发明的方法,在处于正常状态时,如果在一个检测周期内识别到一命令词,输出对应的操控信号并维持在正常状态。或者,在处于正常状态时,如果在一个检测周期内识别到一命令词,输出对应的操控信号并转为待机状态。本发明的方法,是通过一计时器来实现周期性地设定时间范围的;针对三种状态的设定时间范围可以是相同的,也可以是各异的。本发明的方法,还设置一常规遥控功能模块,使该常规遥控功能模块的功能与语音识别功能模块的功能在输出的操控信号上是互为全部或局部兼容、对应的。本发明的方法,不论该语音识别功能模块处于何种工作状态,该常规遥控功能模块输出的操控信号总是有效的。本发明的方法,使常规遥控功能模块具有全部关闭功能,当该常规遥控功能模块处于全部关闭状态时,该语音识别功能模块的功能能同时被关闭,直到用遥控器退出全部关闭状态,该语音识别功能模块自动进入待机状态。与现有技术相比,本发明的在电子产品中实现语音识别操控的方法,通过使语音识别功能模块能够工作在三种状态,并周期性地检测并依据工作情形而有条件地进行状态切换,可以大大减少误识别、误动作的出现,从而扩大电子产品的语音识别操控应用。
图1为本发明的在电子产品中实现语音识别操控的方法第一实施例的总流程示意。图2为本发明的在电子产品中实现语音识别操控的方法第二实施例的总流程示意。图3为本发明的在电子产品中实现语音识别操控的方法在语音识别处于待机状态时的流程示意。图4为本发明的在电子产品中实现语音识别操控的方法在语音识别处于伪暂停状态时的流程示意。
具体实施例方式以下结合附图所示之实施例作进一步详述。在发明中,有关术语定义如下:(1)命令词:是为语音识别系统指定的各种语音操作指令;(2)总命令词:是为语音识别系统指定的是否启用命令词的一个语音命令词;(3)计时器:是在设定的时间范围内计时;(4)待机状态:是系统仅识别总命令词的一种状态;(5)计数器1:是在计时器有效的范围内,统计待机状态中声音(语音识别结果中未成功识别出总命令词)的次数;(6)识别状态:是识别除总命令词以外的本系统设定的所有命令词的一种状态;(7)伪暂停状态:是拒识包括总命令词在内的本系统设定的所有命令词的一种状态,系统转入只判断是否有声音信号进入,如果有声音进入,并计算次数,有:①在计时器有效的范围内,达到或超过设定的声音次数,系统维持在伪暂停状态;②在计时器有效的范围内,声音次数未达到设定的次数,系统自动转入待机状态;(8)计数器2:是在计时器有效的范围内,统计伪暂停状态中声音(不论语音识别结果)的次数。本发明的方法,设置一语音识别功能模块,使其能够工作在三种状态:允许识别命令词的正常状态;只允许识别总命令词的待机状态;以及既不允许识别命令词,也不允许识别总命令词的伪暂停状态,三种状态可通过周期性地检测当前在设定的时间范围内的情形而有条件地切换,状态的切换的同时,上一检测周期结束、下一检测周期开始。本发明的方法,主要是在语音识别功能模块的软件实现上进行了改进,包括但不限于以下几个方面:1、在语音识别系统上电时,语音识别功能是有条件开启(也就是进入正常状态)的,例如:在语音识别系统上电的前几秒钟内,用总命令词或按键或遥控器的特定按键来启动语音识别功能的;这样,可以防止用户在非主动或不知情的情况下,语音识别功能的启用而带来误动作的可能。2、语音识别功能被启动后,进入语音识别的正常状态。正常状态的保持是有条件的,根据不同的产品,有两种方法可供选择:请参见图1,图3和图4,第一种方法:(一 )进入语音识别的正常状态的同时,计时器和计数器I开始工作,有:①在计时器有效的时间范围内(也就是一个检测周期内),识别到正确的命令词,输出识别的结果,同时,计时器与计数器I的结果均清零、重新开始,并在新的一轮检测周期内维持语音识别的正常状态;②在计时器有效的时间范围内,识别不到正确的命令词,不输出识别结果,且计数器I的结果没有超出设定的范围,语音识别功能转入待机状态;③在计时器有效的时间范围内,识别不到正确的命令词,不输出识别结果,且计数器I的结果超出设定的范围,语音识别功能转入伪暂停状态。( 二)在待机状态,是只识别总命令词的,有:①在待机状态,且在计时器有效的时间范围内,识别到正确的总命令词,转入语音识别的正常状态;②在待机状态,且在计时器有效的时间范围内,识别不到正确的总命令词,且计数器I的结果没有超出设定的范围,维持待机状态;③在待机状态,计时器有效的时间范围内,识别不到正确的总命令词,且计数器I的结果超出设定的范围,转入伪暂停状态。(三)在伪暂停状态,是拒绝识别包括总命令词在内的本系统设定的所有命令词,系统只保留判断是否有声音进入,有:①在伪暂停状态,计时器有效的时间范围内,计数器2的结果小于设定的范围,系统转入待机状态;②在伪暂停状态,计时器有效的时间范围内,计数器2的结果等于或大于设定的范围,系统维持在伪暂停状态。可见,采用这种方法,只要在设定的时间内有正确的命令词被识别,就可以自动延长一个新的设定时间,重新开始计时和计数;再在重新开始计时和计数的设定时间内,如果仍有正确的命令词被识别,系统又会自动延长一个新的设定时间,重新开始计时和计数……以此类推。从使用角度看,只要在设定的时间内,有正确的命令词被识别,系统是一直处于语音识别状态的。直到在最后一个设定的时间内,没有正确的命令词被识别,语音识别系统就转入待机状态。在待机状态时, 系统仅识别一个总命令词,其他任何语音都会被拒绝识别,这样设定亦可提高抗干扰能力。在语音识别状态,系统是需要识别多个命令词的,也是抗干扰相对薄弱的状态,所以,在软件上为语音识别系统设置了待机状态和伪暂停状态作为提高语音识别系统抗干扰能力的措施,可以一并使用。请参见图2、图3和图4,第二种方法:(一 )进入语音识别的正常状态的同时,计时器和计数器I开始工作,有:①在计时器有效的时间范围内,识别到正确的命令词,输出识别的结果,同时,计时器与计数器I的结果均清零,·退出语音识别的正常状态,进入待机状态;②在计时器有效的时间范围内,识别不到正确的命令词,不输出识别结果,且计数器I的结果没有超出设定的范围,退出语音识别的正常状态转入待机状态;③在计时器有效的时间范围内,识别不到正确的命令词,不输出识别结果,且计数器I的结果超出设定的范围,退出语音识别的正常状态转入伪暂停状态。( 二)在待机状态,是只识别总命令词的,有:①在待机状态,且在计时器有效的时间范围内,识别到正确的总命令词,转入语音识别的正常状态;②在待机状态,且在计时器有效的时间范围内,识别不到正确的总命令词,且计数器I的结果没有超出设定的范围,维持待机状态;③在待机状态,计时器有效的时间范围内,识别不到正确的总命令词,且计数器I的结果等于或大于设定的范围,转入伪暂停状态。(三)在伪暂停状态,是拒绝识别包括总命令词在内的本系统设定的所有命令词,系统只保留判断是否有声音进入,有:①在伪暂停状态,计时器有效的时间范围内,计数器2的结果小于设定的范围,系统转入待机状态;②在伪暂停状态,计时器有效的时间范围内,计数器2的结果等于或大于设定的范围,系统维持在伪暂停状态,以此类推。可见,采用这种方法,只要在设定的时间内有正确的命令词被识别,在输出结果的同时,退出语音识别的正常状态,进入待机状态,语音识别的正常状态是一次有效的,最大程度的减少误识的可能;如果需要第二次语音识别,就必须重新用总命令词启动,第二次语音识别完毕,再退出语音识别状态,进入待机状态……以此类推。从使用角度看,只要在设定的时间内,有正确的命令词被识别,就会输出结果,但不论是否有正确的识别,总命令词和命令词都是一次有效的,如果在设定的时间内没有正确的命令词被识别,就不会输出结果,且退出语音识别的正常,进入待机状态。在待机状态时,系统只识别一个总命令词,其他任何语音都会被拒绝识别,这样设定亦可提高抗干扰能力。在语音识别状态,系统是需要识别多个命令词的,也是抗干扰相对薄弱的状态,所以,在软件上为语音识别系统设置了待机状态和伪暂停状态作为提高语音识别系统抗干扰能力的措施,可以一并使用。3、具有语音识别功能的产品可以用常规遥控功能模块,例如:带红外、超声、无线电遥控器(以下,遥控器泛指用以输入指令的发射部分以及装设在电子产品中的接收部分),遥控器的功能与语音识别的功能在输出结果上是互为全部或局部兼容、对应的,即:用语音识别功能输出的结果,可以用遥控器来实现,亦可用遥控器改变其状态,相反,利用遥控器操作而输出的结果,同样可以用语音识别功能来实现,亦可用语音识别功能改变其状态。在语音识别功能与遥控器操作的这两种方式之间,有:不论在语音识别的正常状态、待机状态还是伪暂停状态,遥控器的操作总是有效的,且用遥控器全部关闭输出结果时,语音识别功能是同时被关闭的;直到用遥控器将输出结果改变为非全部关闭时,语音识别功能是自动进入待机状态的。另外,还可以从硬件方面进行考虑:1、在电路上,可以每个命令词对应着一个选择端,可根据实际需要进行选择,且被选择的功能自动无效,即:对应的命令词和相应的功能同时无效。这样,一方面对提高语音识别功能的抗干扰有一定的好处,另一方面可方便的实现不同功能间的组合。2、设定一个命令词,可用该命令词关闭语音识别功能。语音识别功能被关闭后,只有给系统重新上电,才能恢复语音识别功能,其它任何方式都不能恢复语音识别功能的。3、产品结构方面:a)、产品的内部结构,包括机械结构、电路板上元件的布局结构,都对语音识别产品的抗干扰能力有关系;具体做法:电路板上元件的布局,尽量做到供电电路、遥控接收电路与语音识别电路相互隔离,常用的办法是各自屏蔽,也可以用双面线路板或多层线路板的材料做成电路模块,让每个电路模块至少有一层大面积铺铜是接电源地线的;这样可以减少各电路模块间的互相干扰,特别是可以减少开关电源形式的供电电路和无线电遥控接收电路对语音识别电路的干扰;还可以减小产品的体积,使产品更加小巧。如果各功能电路是做成电路模块形式的,那么,各电路模块是通过一块共用的主板相互连接起来的,也可以通过其他的形式相互连接起来;b)、拾音器(如:麦克风、蜂鸣片等)的连线尽可能的短,一般不超过10厘米,有:绞线的效果最佳、屏蔽线的效果次之、独立的导线效果最差;c)、拾音器应尽量处在音源(使用者)的对面或上方位置为佳,以便获取直射的声
曰;d)、拾音器的外部应该经过硅胶、橡胶、海绵、泡沫类的减震材料,才被安装在机壳内或机壳外的;e)、拾音器的拾音孔前面,可设置虑音纸或其他起虑音作用的材料,使进入拾音器的杂首减少,提闻语首识别功能的抗干扰能力;f)、拾音器若是安装在机壳内,应与机壳内壁保持一定的间隙,以便拾音器有一个好的拾音条件,也可以在拾音器的周围设置该间隙;使拾音器的拾音效果最佳。并且,还可以从产品应用方面进行考虑:1、语音识别功能的状态是可以用指示灯指示,例如:a)、未启动或关闭语音识别功能时,指示灯是不亮的;b)、在语音识别状态时,指示灯是闪烁的;c)、语音识别功能处于待机状态时,指示灯是常亮的;
d)、语音识别功能处于伪暂停语音识别状态时,指示灯是灭的,直到系统转为待机状态,指示灯也转为常亮;2、语音识别功能可以播放应答语音,也可以不播放应答语音,语音识别功能均能正常工作;3、语音识别功能可以配遥控器,也可以不配遥控器,语音识别功能均能正常工作;4、语音识别功能的状态是可以用指示灯指示的,也可以不用指示灯来指示,语音识别功能均能正常工作;5、具有语音识别功能的电子产品还可以兼容传统的开关操作,以方便用户使用。6、上述方法不受总命令词、命令词的语种限制,即:所有汉语、外语甚至其它任何的声音,视实际应用需要,均可作为语音识别系统的命令词来使用。以下试通过两个具体实施例,对上述本发明的方法予以进一步详细说明。实施例一在灯具上装设有语音识别功能模块和常规遥控功能模块的操作使用(用“咒语”操作“神灯”)。1、启动智能声控功能:给灯通电, 在看到指示灯闪两次后的8秒内------先说:“阿拉丁”;听到:“有何吩咐? ”;表示启动成功。2、各项功能操作:智能声控功能启动成功后,可以对着灯说出以下命令词,即可对灯的各路光源进行开、关操作:a、“打开小灯”或“关闭小灯”:对应的小灯(LED)会应声开启、关闭;b、“打开节能灯”或“关闭节能灯”:对应的节能灯(白色光源)会应声开启、关闭;C、“打开灯泡”或“关闭灯泡”:对应的灯泡(黄色光源)会应声开启、关闭;d、“打开探照灯”或“关闭探照灯”:对应的射灯会应声开启、关闭;根据不同的灯饰产品,光源种类可能会少于以上的种类,所缺种类的关键词经电路上选择端的选择是自动失效的。3、其他命令词:e、全部打开:开启当前有效的所有光源;f、开灯:开启关灯之前的亮灯状态;g、关灯:关闭当前有效的所有光源;h、延时关灯:其中一路灯会闪一下,15秒钟后自动关灯;4、关闭智能声控功能的特殊命令词:1、我讨厌你了!:系统回应“拜拜!”,然后,关闭智能声控功能;j、用墙壁开关开灯时,不说“咒语”启动智能声控功能,系统是不会开启智能声控功能的;5、关于LED指示灯的状态说明
a、给灯通电,LED指示灯闪两次,表示系统自检正常;b、尚未启动(或不启动)智能声控功能时,LED指示灯是灭的;C、给灯通电,LED指示灯闪过两次后,说“阿拉丁”且回应“有何吩咐? ”后,LED指示灯开始闪动8秒;e、在LED指示灯闪动的8秒内,每说一个正确的关键词,8秒钟重新计时,直到有一个8秒内没有收到正确的关键词,LED指TjV灯转为常売状态,表不进入待机状态,等待再次说“阿拉丁”来启动;f、在待机状态,仍以8秒为单位进行识别统计,在每个8秒内,如果有多次声音(例如3次)进入,但没有正确关键词被识别,系统则认为目前环境噪音大噪音,不宜使用,会暂时关闭智能声控功能,此时,LED指示灯是灭的;直到环境安静下来,系统会自动恢复智能声控功能,LED指示灯转为常亮的待机状态;g、即便是在待机状态(LED指示灯常亮状态),系统仍然以8秒为单位在监测话筒的声音输入,在每个8秒内,如果有多次的声音输入(例如3次)但没有正确的关键词,系统仍然会认为目前环境噪音大,不宜使用,会暂时关闭智能声控功能(此时,LED指示灯是灭的),直到环境安静下来,系统会自动恢复智能声控功能,LED指示灯转为常亮的待机状态。其他,遥控器的学习和使用a、每套智能声控系统可以学习两个或两个以上相同型号的遥控器,学习方法如下:b、先长按遥控器的任意一个键,再用墙壁开关开灯,等待约3秒钟,第一路灯会闪一下,此时,松开遥控器按键,表示学习成功;C、如果在灯闪过之后,不放开遥控器按键,会导致学习失败;d、不论智能声控功能是否启动,均可使用遥控器;实施例二系统的做法与实施例一相似,以下仅列出主要的不同之处。在安全等级较低的各类门(例如内屋的房门、各种柜子的门、抽屉、窗户、窗帘)上装设有语音识别功能模块和常规遥控功能模块的操作使用。一、语音部分:关键词及音效:第一网络:芝麻------回应“有何吩咐?”第二网络:开门------回应“好的”关门------回应“0K”开灯------回应“好的”关灯------回应“0K”我讨厌你了!------回应“拜拜”。二、功能部分1、上电时,默认为没有输出的;2、具有RF 遥控功能;3、每执行一次(例如:芝麻------有何吩咐?------开门)动作,系统立即返回到待机模式,等待下一次口令(例如:芝麻------有何吩咐?------关门);4、在执行开门、关门动作时,要检测到对应的返回(高电平)信号,才停止输出;5、在未执行完开门、关门动作时,收到关门、开门口令时,系统立即响应要求;6、在执行关门动作结束时,自动关灯。三、通过一路蜂鸣片(IKHz)输出,以提供一定的人机交互:a、执行开门、开灯动作时,发出短促的“滴”声;b、执行关门、关灯动作时,发出短促的“滴滴”声;C、执行“有何吩咐”时,发出短促的“滴滴滴”声;d、 执行“拜拜”结果时,发出一秒长“滴……”声。以上,仅为本发明之较佳实施例,意在进一步说明本发明,而非对其进行限定。凡根据上述之文字和附图所公开的内容进行的简单的替换,都在本专利的权利保护范围之列。
权利要求
1.一种在电子产品中实现语音识别操控的方法,其特征在于,设置一语音识别功能模块,使其能够工作在三种状态:允许识别命令词的正常状态;只允许识别总命令词的待机状态;以及既不允许识别命令词,也不允许识别总命令词的伪暂停状态,三种状态可通过周期性地检测当前在设定的时间范围内的情形而有条件地切换,状态的切换的同时,上一检测周期结束、下一检测周期开始。
2.如权利要求1所述的方法,其特征在于, 在电子产品开机启动时,使该语音识别功能模块进入待机状态,并开启周期性的检测; 在处于待机状态时,如果识别到一总命令词,则转为正常状态;如果没有识别到该总命令词且在一个检测周期内识别到的声音信号次数超出一设定值,则转为伪暂停状态;否则维持在待机状态; 在处于正常状态时,如果在一个检测周期内没有识别到一命令词,则转为待机状态; 在处于伪暂停状态时,如果在一个检测周期内识别到的声音信号次数小于一设定值,则转为待机状态;否则维持在伪暂停状态。
3.如权利要求2所述的方法,其特征在于,是通过一第一计数器来实现处于待机状态时的声音信号次数累计的;是通过一第二计数器来实现处于伪暂停状态时的声音信号次数累计的。
4.如权利要求1所述的方法,其特征在于,在处于正常状态时,如果识别到一特定命令词,可以关闭该语音识别功能模块的语音识别功能。
5.如权利要求1所述的方法,其特征在于,在处于正常状态时,如果在一个检测周期内识别到一命令词,输出对应的操控信号并维持在正常状态。
6.如权利要求1所述的方法,其特征在于,在处于正常状态时,如果在一个检测周期内识别到一命令词,输出对应的操控信号并转为待机状态。
7.如权利要求1所述的方法,其特征在于,是通过一计时器来实现周期性地设定时间范围的;针对三种状态的设定时间范围可以是相同的,也可以是各异的。
8.如权利要求1至7任一所述的方法,其特征在于,还设置一常规遥控功能模块,使该常规遥控功能模块的功能与语音识别功能模块的功能在输出的操控信号上是互为全部或局部兼容、对应的。
9.如权利要求8所述的方法,其特征在于,不论该语音识别功能模块处于何种工作状态,该常规遥控功能模块输出的操控信号总是有效的。
10.如权利要求9所述的方法,其特征在于,使常规遥控功能模块具有全部关闭功能,当该常规遥控功能模块处于全部关闭状态时,该语音识别功能模块的功能能同时被关闭,直到用遥控器退出全部关闭状态,该语音识别功能模块自动进入待机状态。
全文摘要
一种在电子产品中实现语音识别操控的方法,设置一语音识别功能模块,使其能够工作在三种状态允许识别命令词的正常状态;只允许识别总命令词的待机状态;以及既不允许识别命令词,也不允许识别总命令词的伪暂停状态,三种状态可通过周期性地检测当前在设定的时间范围内的情形而有条件地切换,状态的切换的同时,上一检测周期结束、下一检测周期开始。本发明可以大大减少误识别、误动作的出现,从而扩大电子产品的语音识别操控应用。
文档编号G10L15/00GK103151038SQ20111041488
公开日2013年6月12日 申请日期2011年12月6日 优先权日2011年12月6日
发明者张国鸿 申请人:张国鸿