声音唤醒侦测装置与方法
【技术领域】
[0001]本发明是有关于一种侦测装置及方法,且特别是有关于一种声音唤醒侦测装置与方法。
【背景技术】
[0002]现今智能型手机的功能越来越多样化,具声音唤醒功能的智能型手机越来越受到消费者的重视。一般来说,当智能型手机等电子产品进入睡眠状态时,只要用户发出关键词(keyword)的声音,智能型手机即可进行关键词的辨识,并且由睡眠状态进入正常运作状态。换言之,使用者无需利用智能型手机其他的功能按键,即可让智能型手机进入正常运作状态。
[0003]请参照图1,其所绘示为现有电子产品中的声音唤醒侦测装置示意图。电子产品中的声音唤醒侦测装置100包括:前端侦测电路(front end detecting circuit)110、声音辨识处理器(speech recognit1n processor) 120、以及主处理器(main processor) 130。其中,前端侦测电路110包括麦克风102与事件侦测器(event detector) 104。于睡眠状态时,前端侦测电路110会被供电,使得麦克风102与事件侦测器104持续运作。另外,电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detect1n phase)。说明如下:
[0004]基本上,事件侦测器104主要的功能在于进行听觉事件侦测(acoustic eventdetect1n)。麦克风102产生声音信号Sa至事件侦测器104,而事件侦测器104侦测声音信号Sa的振幅、信噪比(SNR)或者子频段信噪比(sub-band SNR)。
[0005]当电子产品处于睡眠状态且声音唤醒侦测装置100处于第一侦测程序(firstphase detect1n)时,麦克风102持续地接收外部的声音,并转换为声音信号Sa输入事件侦测器104。当声音信号Sa的振幅大于临限值(threshold)时,事件侦测器104即产生第一中断信号(interrupt) INTl至声音辨识处理器120。
[0006]除了侦测声音信号Sa的振幅之外,事件侦测器104也可以侦测声音信号的信噪比(SNR)或者子频段信噪比(sub-band SNR)。亦即,当声音信号Sa的信噪比(SNR)或者子频段信噪比(sub-band SNR)大于临限值时,事件侦测器104产生第一中断信号INTl至声音辨识处理器120。
[0007]再者,声音辨识处理器120为一种数字信号处理器(DSP),又称为微小处理器(tinyprocessor),其作用在于对声音信号Sa进行语音识别。当第一中断信号INTl尚未动作之前,声音辨识处理器120未被供电,所以无法运作,此时尚处于声音唤醒侦测装置100的第一侦测程序。反之,当第一中断信号INTl动作时,声音辨识处理器120被供电,声音唤醒侦测装置100即由第一侦测程序进入第二侦测程序(second phase detect1n)并且开始执行声音信号Sa的关键词辨识动作。
[0008]于第二侦测程序,声音辨识处理器120辨识声音信号Sa是否为关键词的声音。当声音辨识处理器120确认声音信号Sa是关键词的声音,声音辨识处理器120即产生第二中断信号INT2至主处理器130。当主处理器130接收到第二中断信号INT2时,声音唤醒侦测装置100即由第二侦测程序进入第三侦测程序(third phase detect1n)。
[0009]反之,当声音辨识处理器120确认声音信号Sa不是关键词的声音,并不会动作第二中断信号INT2至主处理器130,并且声音辨识处理器120会再次被停止供电。此时,声音唤醒侦测装置100即由第二侦测程序进入第一侦测程序,并且等待前端侦测电路110再次产生第一中断信号INTl。
[0010]再者,于第三侦测程序时,主处理器130被供电,并进一步使得智能型手机进入正常运作状态。
[0011]由以上的说明可知,现有智能型手机中,于第一侦测程序时,前端侦测器110仅对声音信号Sa进行声音事件的判断,并不会对声音信号Sa进行关键词的辨识。而于第二侦测程序时,声音辨识处理器120才会开始对声音信号Sa进行关键词的辨识。
[0012]—般来说,现有声音唤醒侦测装置100中,仅前端侦测电路110运作于第一侦测程序时,消耗的电能最小,大约需要ImA的电流。于前端侦测电路110与声音辨识处理器120同时在运作的第二侦测程序时,电能次之,大约需要6mA的电流。
[0013]现有的声音唤醒侦测装置100还是有缺点。举例来说,假设智能型手机于睡眠状态时处于吵杂的环境下,则麦克风102将持续收到不是关键词的声音。此时,前端侦测电路110有可能被激发(trigger)而常常产生第一中断信号INTl。因此,声音唤醒侦测装置100会常常在第一侦测程序与第二侦测程序之间运作。所以,一整天下来其电能损耗(day of usepower consumpt1n)也是非常可观。
【发明内容】
[0014]本发明之主要目的在于提出一种声音唤醒侦测装置与方法。当电子装置处于睡眠状态时,声音唤醒侦测装置能更准确地(accurately)于第一侦测程序侦测声音信号。如此,可以有效地降低声音唤醒侦测装置执行第二侦测程序的次数,并降低电子装置的日电能损耗(day of use power consumpt1n)。
[0015]本发明有关于一种声音唤醒侦测装置,运用于电子产品,该装置包括:前端侦测电路,辨识声音信号中是否出现子关键词,并且于确认出现该子关键词时,产生第一中断信号;声音辨识处理器,于接收到该第一中断信号后开始运作,并辨识该声音信号中是否出现关键词,并且于确认出现该关键词时,产生第二中断信号;以及主处理器,于接收到该第二中断信号后开始运作,并使得该电子产品由睡眠状态进入正常运作模式。
[0016]本发明有关于一种声音唤醒侦测方法,包括下列步骤:提供前端侦测电路接收声音信号,并辨识该声音信号;当该声音信号中出现子关键词的声音时,启动声音辨识处理器来辨识该声音信号;当该声音信号中出现关键词的声音时,启动主处理器,并唤醒该电子产品应以进入正常运作状态。
[0017]为了对本发明之上述及其他方面有更佳的了解,下文特举较佳实施例,并配合所附图式,作详细说明如下:
【附图说明】
[0018]图1所绘示为现有电子产品中的声音唤醒侦测装置示意图。
[0019]图2A与图2B所绘示为本发明声音唤醒侦测装置的功能方块示意图
[0020]图3所绘示为本发明电子产品中的声音唤醒侦测装置的第一实施例。
[0021]图4所绘示为本发明电子产品中的声音唤醒侦测装置的第二实施例。
[0022]图5A与图5B所绘示为本发明子关键词判断电路示意图。
[0023]图6所绘示为本发明电子产品中的声音唤醒侦测方法流程图。
【具体实施方式】
[0024]本发明是一种语者相关(speakerdependent)的声音唤醒侦测装置与相关方法。利用训练动作(training act 1n)来建立子关键词的模型参数(sub-keyword modelparameters)以及关键词的模型参数(keyword model parameters),分别运用于第一侦测程序以及第二侦测程序。
[0025]图2A与图2B,其所绘示为本发明声音唤醒侦测装置的功能方块示意图。首先,当电子产品于正常运作状态时,利用主处理器来产生关键词模型参数232及子关键词模型参数234。于睡眠状态时,子关键词模型参数即可用于第一侦测程序,而关键词模型参数即可运用于第二侦测程序。
[0026]如图2A所示,于正常运作状态时,主处理器可以执行训练动作(trainingact1n),用以接收关键词的声音信号Sa。以下系假设关键词为“H1-Patent”,且“Hi”为子关键词来进行说明。
[0027]于训练动作时,主处理器中的模型参数估算单元(model parameter estimat1nunit)230即接收用户所发出关键词“H1-Patent”的声音信号Sa后,会利用先进行特征撷取动作(feature extracting)以撷取声音信号Sa中的各种声音特征(voice feature),例如频率、音量、噪音等等特征。接着利用特定的语音识别模型来对声音信号Sa建立关键词模型参数232。基本上,特定的语音识别模型可为隐藏式马可夫模型(Hidden Markov Model,简称ΗΜΜ) ο当然,本发明并不限定于上述的HMM,也可以是高斯混合模型(Gaussian MixtureModel,简称GMM)、支持向量机制(Support Vector Machine,SVM)模型或者神经网络(Neural Net)模型等等的其他语音识别模型。
[0028]再者,为了要建立子关键词模型参数234,模型参数估算单元230更需要进行分段动作(segmentat1n)。分段动作系基于关键词“H1-Patent”的HMM运用维特比译码算法来分离关键词中的“Hi”与“Patent”。
[0029]于分段完成之后,模型参数估算单元230利用获得的“Hi”子关键词,以HMM来建立子关键词模型参数。当然,上述分段动并不限定于将关键词