用于调整用于激活话音辅助功能的检测阈值的方法及设备的制造方法
【专利说明】用于调整用于激活话音辅助功能的检测阈值的方法及设备
[0001 ] 相关申请案的交叉参考
[0002]本申请案主张2013年9月17日申请的共同拥有的美国非临时专利申请案第14/029,131号的优先权,所述申请案的内容以全文引用的方式并入本文中。
技术领域
[0003]本发明大体上涉及用于激活移动装置中的话音辅助功能的方法。更具体来说,本发明涉及调整用于检测移动装置中的目标关键字的阈值。
【背景技术】
[0004]近年来,例如智能电话及平板计算机等移动装置的使用已变得普遍。此类移动装置一般允许无线网络上的话音及数据通信。通常,这些装置包含额外的特征或应用,其提供经设计以增强用户便利性的多种功能。
[0005]在此类应用或特征之间,话音辅助应用使得移动装置能够从用户接收语音命令以用于响应于所述语音命令操作各种功能或其它应用。例如,话音辅助应用可允许用户说出语音命令以调用所要的电话号码、播放音频文件、拍摄图片、搜索因特网或获得天气信息,而不需要用手物理地操作移动装置。因此,用户可选择使用语音命令在其中用户可能不希望或不可物理地操作移动装置的多种情形中控制移动装置的各种操作。
[0006]常规的话音辅助应用经常响应于用户的物理输入(例如,用手)而被激活。然而,由于使用话音辅助应用的目的中的一者可为在没有物理输入的情况下操作移动装置,所以用户可发现不方便或难以物理地激活话音辅助应用。因此,一些移动装置允许用户通过说出语音命令而激活所述话音辅助应用。
[0007]然而,此类移动装置经常错误地响应于由装置所俘获的各种输入声音而被激活或无法响应于恰当的语音命令而被激活。例如,移动装置可错误地将另一人的话语辨识为恰当的语音命令且激活话音辅助应用。另一方面,在移动装置处于响亮的环境中时,移动装置可归因于背景噪声而辨识不出恰当的语音命令且因此无法激活话音辅助应用。
【发明内容】
[0008]本发明提供用于通过基于阈值检测输入声音流中的目标关键字而激活话音辅助功能的方法及装置,所述阈值可根据装置的情境进行调整。
[0009]根据本发明的一个方面,揭示一种用于激活移动装置中的话音辅助功能的方法。所述方法包含通过声音及接收输入声音流且确定所述移动装置的情境。在此方法中,基于所述情境而调整用于激活所述话音辅助功能的阈值。所述方法基于所述经调整的阈值从所述输入声音流检测目标关键字。如果检测到所述目标关键字,那么所述方法激活所述话音辅助功能。本发明还描述与此方法相关的设备、装置、装置组合及计算机可读媒体。
[0010]根据本发明的另一方面,一种用于激活话音辅助功能的移动装置包含声音传感器、阈值调整单元及话音激活单元。所述声音传感器经配置以接收输入声音流。所述阈值调整单元经配置以通过确定移动装置的情境而调整用于激活话音辅助功能的阈值。所述话音激活单元经配置以在基于经调整的阈值从输入声音流检测到目标关键字的情况下激活所述话音辅助功能。
【附图说明】
[0011]当结合附图阅读时,通过参考以下详细描述将理解本发明的发明性方面的实施例。
[0012]图1说明根据本发明的一个实施例的在确定移动装置的情境是在车辆中时经配置以调整用于激活话音辅助功能的检测阈值的移动装置。
[0013]图2说明根据本发明的一个实施例的在用户可能将清醒时在确定移动装置的情境是在早晨的情况下经配置以调整用于激活话音辅助功能的检测阈值的移动装置。
[0014]图3说明根据本发明的一个实施例的在用户可能睡着时在确定移动装置的情境是在夜晚的情况下经配置以调整用于激活话音辅助功能的检测阈值的移动装置。
[0015]图4说明根据本发明的一个实施例的在确定移动装置的情境是在包袋中时经配置以调整用于激活话音辅助功能的检测阈值的移动装置。
[0016]图5说明根据本发明的一个实施例的在接收文本消息的情境中经配置以调整用于激活话音辅助功能的检测阈值的移动装置。
[0017]图6说明根据本发明的一个实施例的经配置以通过基于移动装置的情境调整用于检测目标关键字的阈值而从输入声音流检测目标关键字的移动装置的框图。
[0018]图7说明根据本发明的一个实施例的移动装置中的经配置以输出用于确定移动装置的情境的声音流及传感器数据的传感器单元的框图。
[0019]图8说明根据本发明的一个实施例的移动装置中的经配置以通过推断移动装置的情境而确定用于激活话音辅助功能的检测阈值的阈值调整单元的框图。
[0020]图9是根据本发明的一个实施例的在移动装置中执行的用于通过推断移动装置的情境而确定用于激活话音辅助功能的检测阈值的方法的流程图。
[0021]图10是根据本发明的一个实施例的在移动装置中执行的用于产生经调整的检测阈值且在指定时间周期之后将检测阈值复位到预定检测阈值的方法的流程图。
[0022]图11说明根据本发明的一个实施例的移动装置中的经配置以通过基于经调整的检测阈值检测输入声音流中的目标关键字而激活话音辅助功能的话音激活单元的框图。
[0023]图12是根据本发明的一个实施例的在移动装置中执行的用于基于经调整的检测阈值检测输入声音流中的目标关键字而激活话音辅助功能的方法的流程图。
[0024]图13说明根据本发明的一个实施例的无线通信系统中的移动装置的框图,其中根据移动装置的情境而调整用于基于检测阈值检测输入声音流中的目标关键字的方法及设备。
【具体实施方式】
[0025]现在将详细参考各种实施例,在附图中说明所述实施例的实例。在以下详细描述中,陈述众多具体细节以便提供对本发明的透彻理解。然而,对于所属领域的一般技术人员将是显而易见的是可在没有这些具体细节的情况下实践本发明。在其它情况下,未详细描述众所周知的方法、程序、系统和组件,以便不会不必要地混淆各种实施例的各方面。
[0026]图1说明根据本发明的一个实施例的在确定移动装置110的情境是在车辆130中时经配置以调整用于激活话音辅助功能的检测阈值的移动装置110。在此所说明的实施例中,移动装置110的用户120在驾驶车辆130,同时移动装置110放置在车辆130的乘客座椅上。图1的移动装置110可为配备有用于在输入声音中辨识用户的语音的语音辨识功能的智能电话。
[0027]在激活移动装置110中的话音辅助功能时,移动装置110可使用语音辨识功能响应于各种口头请求、指令、命令及来自用户120单独的类似者。例如,用户120可在已经激活话音辅助功能时说出例如“呼叫SUSAN”的指令。作为响应,移动装置110辨识所述指令且使用与所辨识的姓名相关联的电话号码呼叫Susan。移动装置110中的话音辅助功能可响应于经由移动装置110的按钮或触摸屏的输入而被激活。
[0028]在一些实施方案中,在来自用户120的输入声音中检测到目标关键字时,移动装置110存储用于激活话音辅助功能的预定目标关键字。如本文所用,术语“目标关键字”是指可用于激活移动装置110中的功能或应用的一或多个字或声音的任何数字或模拟表示。举例来说,例如“HEY话音辅助”或“开始话音辅助”等预定关键字可存储在移动装置110中以作为用于激活话音辅助功能的目标关键字。在从用户120接收输入声音时,移动装置110可通过对所接收的输入声音执行语音辨识功能而检测输入声音中的目标关键字。
[0029]移动装置110可经配置以基于检测阈值而检测目标关键字以确保所要的置信水平。在一个实施例中,移动装置110计算输入声音与目标关键字之间的类似性程度(或关键字匹配得分)且将类似性程度与检测阈值进行比较。在计算类似性程度中,可使用目标关键字的预设声音模型。如果输入声音与目标关键字(或声音模型)之间的类似性程度超过检测阈值,那么移动装置110检测输入声音中的目标关键字且激活话音辅助功能。另一方面,如果类似性程度未超过检测阈值,那么移动装置110确定未在输入声音中检测到目标关键字。
[0030]所述检测阈值影响在检测输入声音中的目标关键字中的准确度。例如,如果检测阈值过高,那么移动装置110可从包含目标关键字的输入声音检测不到目标关键字。在此情况下,移动装置110可“未命中”输入声音中的目标关键字,且导致目标关键字的增加的未命中率。另一方面,如果检测阈值过低,那么移动装置110可在不包含目标关键字的输入声音中错误地检测到目标关键字。在此情况下,移动装置可错误地激活话音辅助功能(即,“假激活”),且导致话音辅助功能的增加的假激活率。
[0031]在一些实施方案中,起初将检测阈值设定为预定值(例如,默认值)且随后基于移动装置110的情境中的改变进行调整。参看图1,移动装置110经配置以基于来自例如声音传感器、全球定位系统(GPS)及加速度计等各种传感器的情境数据而确定情境。例如,移动装置110的声音传感器可俘获包含引擎声音及道路噪声等环境交通噪声以作为输入声音。另外,GPS及加速度计可监视移动装置110的位置、速度及/或加速度。基于来自传感器的情境数据,移动装置110可将移动装置110的情境识别为在车辆中。
[0032]在确定移动装置110的情境是在车辆中时,可假设图1中的移动装置110的用户120与用手物理地操作移动装置110相比更可能使用话音辅助功能。因此,移动装置110可将检测阈值调整到低于针对正常或未识别的情境预定的默认检测阈值的值。减小的检测阈值增加检测到目标关键字的可能性(例如,减小的未命中率),从而减小用户必须用手操作移动装置110的可能性。
[0033]还可假设在一些其它情境中使用话音辅助功能的可能性较高。图2说明根据本发明的一个实施例的在确定移动装置110的情境是在早晨的情况下在用户210可能将清醒时经配置以调整用于激活话音辅助功能的检测阈值的移动装置110。移动装置110放置在用户210附近,例如放在床220附近的桌子230上,如图2中所说明。
[0034]在此实例中,用户210在早晨醒来但仍坐在床220上。在这种情况下,移动装置110中的照度传感器可产生指示移动装置110的明亮环境的情境数据。此外,移动装置110中的时钟单元还可提供当前时间(例如,7:00AM)作为情境数据。在一些实施例中,可将当前时间与由用户210在移动装置110中设定的指示他或她通常何时醒来的时间进行比较。另外,移动装置110中的声音传感器还俘获具有小强度的安静环境声