一种离线可切换唤醒词的非特定音语音识别唤醒方法与流程

文档序号:11691848阅读:2999来源:国知局

本发明涉及语音识别领域,具体涉及一种离线可切换唤醒词的非特定音语音识别唤醒方法。



背景技术:

目前唤醒词技术已有广泛应用,比如叮咚音箱的唤醒词“叮咚,叮咚”,小智机器人的唤醒词“你好,小智“等,这些唤醒词的特点是单一且基于在线系统,而基于离线语音系统的唤醒词寥寥无几,且具有多条唤醒词切换功能的唤醒词系统就更少了。目前基于离线语音识别的唤醒词种类较为单一,且在一个系统中只有一个词汇作为唤醒词,而无法实现用户所希望的唤醒效果。其原理为:当系统采集用户语音信号后和离线系统内的模型进行匹配,如果比配率超过标准即为识别,而没有达到标准即为没有通过识别,这样的非特定音唤醒识别方式具有地域及个人口语误差的局限性,且唤醒词用户往往很被动,无法使用合适自己的唤醒词来开启语音识别系统。



技术实现要素:

为了解决上述不足的缺陷,本发明提供了一种离线可切换唤醒词的非特定音语音识别唤醒方法,本发明通过设置多条唤醒词模型供用户选择切换后,在针对用户所选择的唤醒词模型进行识别,这样就大大提高了唤醒词的识别率和用户体验。

本发明提供了一种离线可切换唤醒词的非特定音语音识别唤醒方法,包括:

建立多条唤醒词模型;

用户根据唤醒词模型选择相应的唤醒词;

监听用户所选择的唤醒词并确认是否是用户选择的唤醒词;

若监听到的唤醒词是用户选择的,则开启语音识别状态;若监听到的唤醒词不是用户选择的,则返回让用户重新选择。

上述的方法,其中,所述建立多条唤醒词模型的步骤中,所述唤醒词模型包括:“你好,思乐智”、“思乐智声控管家”、“思乐智,智能声控管家”中的至少一种。

上述的方法,其中,所述建立多条唤醒词模型的步骤中,其中多条唤醒词模型之间可以进行切换。

上述的方法,其中,当用户选择的唤醒词为“你好,思乐智”后,对思乐智智能声控管家设备便会监听用户是否说出“你好思乐智”,当监听到用户说出该条“你好,思乐智”后,语音识别系统将会被唤醒。

上述的方法,其中,当用户切换到“思乐智声控管家”作为唤醒词后,当识别监听到用户说出“思乐智声控管家”后,该识别语音识别系统将会被唤醒。

上述的方法,其中,当用户切换到“思乐智,智能声控管家”作为唤醒词后,当识别监听到用户说出“思乐智智能声控管家”后,该识别语音识别系统将会被唤醒。

本发明具有以下优点:1、通过切换不同唤醒词,可以让更多的用户通过离线语音识别系统的唤醒识别,更为有效的开启和进入语音识别系统,从而提高语音唤醒词的识别率;2、通过设置多条唤醒词模型供用户选择切换,在针对用户所选择的唤醒词模型进行识别,这样就大大提高了唤醒词的识别率和用户体验;3、每条唤醒词的识别人群和拒识别人群皆不相同,而多条更换的唤醒词,扩大了系统唤醒词针对识别的群体范围,也缩小了拒识别群体的范围,这样大大提高了语音识别系统唤醒词的识别效果,也给用户带来了更好的用户体验。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明及其特征、外形和优点将会变得更明显。在全部附图中相同的标记指示相同的部分。并未刻意按照比例绘制附图,重点在于示出本发明的主旨。

图1为本发明一种离线可切换唤醒词的非特定音语音识别唤醒方法的流程示意图。

具体实施方式

在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。

为了彻底理解本发明,将在下列的描述中提出详细的步骤以及详细的结构,以便阐释本发明的技术方案。本发明的较佳实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。

在本发明中要说明的是,在本发明中涉及到的第一、第二等数量限定是为了便于区分,没有特别限定的含义。

参照图1所示,本发明提供了一种离线可切换唤醒词的非特定音语音识别唤醒方法,包括:

建立多条唤醒词模型,其中唤醒词模型包括:“你好,思乐智”、“思乐智声控管家”、“思乐智,智能声控管家”中的至少一种,但是并不限于上述的唤醒词模型。

用户根据唤醒词模型选择相应的唤醒词,例如是“你好,思乐智”、“思乐智声控管家”、“思乐智,智能声控管家”中的任一一种唤醒词。

监听用户所选择的唤醒词并确认是否是用户选择的唤醒词;

若监听到的唤醒词是用户选择的,则开启语音识别状态;若监听到的唤醒词不是用户选择的,则返回让用户重新选择。本发明实现的原理为:首先用户根据系统所提供的唤醒词组中选择一条唤醒词设定为系统监听的唤醒词,当用户说出该条唤醒词后,系统识别到此唤醒词,即唤醒成功,当用户需要更换其他唤醒词时,则可以根据系统所提供唤醒词,选择所需要更换的唤醒词。在本发明中,在离线非特定音的语音识别条件下,设置了三条可切换的唤醒词,分别为:“你好,思乐智”“思乐智声控管家”及“思乐智,智能声控管家”由于每条唤醒词针对的识别群体不同,而可切换的唤醒词方法大大提高了整个语音识别系统唤醒词识别的人群范围,从而提高了该语音识别系统的效率。进一步,用户可以设置自己所希望使用的唤醒词,使得唤醒词更符合用户的发音习惯,从而更好的,更有效的使用基于本发明的语音识别系统。

本发明一优选而非限制性的实施例中,当用户选择的唤醒词为“你好,思乐智”后,对思乐智智能声控管家设备便会监听用户是否说出“你好思乐智”,当监听到用户说出该条“你好,思乐智”后,语音识别系统将会被唤醒。

本发明一优选而非限制性的实施例中,当用户切换到“思乐智声控管家”作为唤醒词后,当识别监听到用户说出“思乐智声控管家”后,该识别语音识别系统将会被唤醒。

本发明一优选而非限制性的实施例中,当用户切换到“思乐智,智能声控管家”作为唤醒词后,当识别监听到用户说出“思乐智智能声控管家”后,该识别语音识别系统将会被唤醒。

本发明一优选而非限制性的实施例中,本发明含有三条唤醒词“你好,思乐智”“思乐智声控管家”“思乐智,智能声控管家”,系统用户可以更具自身需求,选择不同的唤醒词,本发明所在的系统将会更具用户选择的不同唤醒词,对用户的语音进行监听,当监听到用户所选择的唤醒词后,将会开启语音识别状态。其中涉及的三条唤醒词,每一条都有适应的识别对象,和识别效果不好的群提,当三条唤醒词可以切换后,则大大增大了可以识别人群的群体范围,也大大提高了该方法所在系统的识别效率。

以上对本发明的较佳实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例,这并不影响本发明的实质内容。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1