一种自定义智能音箱技能的系统、方法及存储介质与流程

文档序号：22034686发布日期：2020-08-28 17:26阅读：366来源：国知局

本发明涉及智能音箱领域，尤其涉及一种自定义智能音箱技能的系统、方法及存储介质。

背景技术：

现有的智能音箱，语音引擎与语音技能通常是不同方案商提供的，在语音引擎进行语音识别后需要执行相应的语音技能；目前常用的做法是将语音引擎和语音技能整合在一起，比如语音引擎接入固定的音乐服务，或者固定的天气查询服务，从而导致了产品的同质化严重的问题，显得产品更加单一，这种方式导致语音技能业务应用不能独立更新、语音技能不能动态增减，无法实现语音技能的自定义化。

技术实现要素：

本发明实施例提供一种自定义智能音箱技能的系统、方法及存储介质，从而解决现有智能音箱中不能独立更新语音技能、不能动态增减语音技能以及语音技能单一且无法实现自定义化的问题。

第一方面，本发明实施例提供一种自定义智能音箱技能的系统，所述自定义智能音箱技能的系统包括语音识别模块、通讯接口、语音技能模块以及注册表；所述语音识别模块、所述通讯接口、所述语音技能模块以及所述注册表分别位于智能音箱终端上；所述语音技能模块包括若干个不同的语音技能业务应用；所述通讯接口，用于所述语音识别模块与所述语音技能模块之间进行信息交互；所述语音识别模块，用于对用户发送的语音指令进行识别及解析、并通过所述通讯接口与所述语音技能模块进行信息交互；所述注册表，用于动态存储及更新若干个不同的语音技能业务应用的关键语音信息。

在一种可能的实施方式中，所述语音识别模块包括本地语音引擎。

在一种可能的实施方式中，所述自定义智能音箱技能的系统还包括云平台语音引擎，所述云平台语音引擎通过网络与所述智能音箱终端进行通讯。

在一种可能的实施方式中，，所述关键语音信息包括若干个不同的语音技能业务应用的名称、与所述若干个不同的语音技能业务应用相对应的唤醒语以及配置参数。

在一种可能的实施方式中，所述自定义智能音箱技能的系统还包括基于循环神经网络的语音唤醒引擎；所述基于循环神经网络的语音唤醒引擎，用于对若干个不同的语音技能业务应用相对应的唤醒语进行学习、并将新的判断为属于所述若干个不同的语音技能业务应用的唤醒语动态添加进所述注册表中。

在一种可能的实施方式中，所述基于循环神经网络的语音唤醒引擎位于云平台或智能音箱终端上。

第二方面，本发明提供一种自定义智能音箱技能的方法，包括以下步骤：

s1)启动智能音箱，用户发出语音指令，判断所述语音指令的语法是否正确，若是，则进入步骤s2)；若否，则重复本步骤；

s2)通过语音引擎接收用户发出的语音指令，打开语音引擎与语音技能模块之间的通讯接口，并利用语音引擎对语音指令进行解析，获得语音指令解析结果；所述语音引擎包括本地语音引擎或云平台语音引擎；

s3)调用注册表，判断所述语音引擎通过通讯接口是否在注册表中匹配到与所述语音指令解析结果相对应的语音技能业务应用，若是，则将与所述语音指令解析结果相对应的语音技能业务应用与语音指令进行绑定，进入步骤s4)；若否，则返回步骤s1)；

s4)执行与所述语音指令解析结果相对应的语音技能业务应用中的业务逻辑，获得执行的业务逻辑结果，并通过通讯接口将所述业务逻辑结果反馈给语音引擎，语音引擎将所述业务逻辑结果转换成语音、并进行播报。

在一种可能的实施方式中，步骤s3)中调用注册表前，还包括实时地对新的语音技能业务应用进行定义，并将新定义的语音技能业务应用的关键语音信息动态更新到注册表中，生成最新的注册表供语音引擎调用。

在一种可能的实施方式中，所述关键语音信息包括新定义的语音技能业务应用的名称、与新定义的语音技能业务应用相对应的唤醒语以及新定义的语音技能业务应用的配置参数。

第三方面，本发明提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现第二方面及第二方面各种可能的实施方式的自定义智能音箱技能的方法。

本发明实施例提供的一种自定义智能音箱技能的系统、方法及存储介质，通过定义通讯接口能够让语音技能业务应用的开发者去动态增减相应的技能，同时让语音引擎的更新不影响语音技能的使用，相比现有的智能音箱产品能够让智能音箱的语音技能实现自定义化。本发明解耦了语音引擎与语音技能业务应用，实现语音引擎的独立更新、语音技能业务应用的独立更新和动态增减；解耦后的智能音箱终端丰富了语音技能的多样性；实现了自定义语音技能的功能，更进一步地增加的智能音箱终端的趣味多样性，减少了同质化严重的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的自定义智能音箱技能的系统结构示意图。

图2是本发明实施例一提供的自定义智能音箱技能的方法流程示意图。

图3是本发明实施例二提供的自定义智能音箱技能的系统结构示意图。

图4是本发明实施例二提供的自定义智能音箱技能的方法流程示意图。

图5是本发明实施例三提供的自定义智能音箱技能的方法流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他单元。

实施例一，一种自定义智能音箱技能的系统。如图1所示，自定义智能音箱技能的系统包括语音识别模块、通讯接口、语音技能模块以及注册表；语音识别模块、通讯接口、语音技能模块以及注册表分别位于智能音箱终端上；语音技能模块包括若干个不同的语音技能业务应用；通讯接口，用于语音识别模块与语音技能模块之间进行信息交互；语音识别模块，用于对用户发送的语音指令进行识别及解析、并通过所述通讯接口与语音技能模块进行信息交互；注册表，用于动态存储及更新若干个不同的语音技能业务应用的关键语音信息。本实施例一的注册表被放在了一个profile.yml文件中。

在本实施例一中，语音识别模块具有本地语音引擎。关键语音信息包括语音技能类型、若干个不同的语音技能业务应用的名称、与所述若干个不同的语音技能业务应用相对应的唤醒语以及配置参数。

本地语音引擎的功能包括获得需要处理的语音指令，当本地语音引擎接收到用户发出的语音指令后，就会打开本地语音引擎与语音技能模块之间的通讯接口，然后将语音指令进行解析，通过通讯接口将语音指令与对应的语音技能业务应用(包括指令处理以及技能实施)进行绑定，本地语音引擎获得的语音指令解析结果包含了识别出的语音技能类型(即业务类型)、技能名称和技能唤醒语，根据语音指令解析结果从注册表中匹配出能够处理该业务的语音技能业务应用，并对能够处理该业务的语音技能业务应用进行绑定，绑定成功后本地语音引擎就可以通过通讯接口发送语音指令给能够处理该业务的语音技能业务应用，能够处理该业务的语音技能业务应用也可以通过通讯接口反馈消息给本地语音引擎。

通讯接口的功能是当本地语音引擎接收到语音指令后，再接收本地语音引擎发送的语音指令，通讯接口根据语音技能业务应用的名称和唤醒语将语音指令与能够处理该业务的语音技能业务应用进行绑定。

用户发出语音指令后，本地语音引擎通过对语音指令的解析，就会理解用户的指令是要做什么事情，实现什么样的功能，比如用户需要查询天气；语音技能业务应用就是实现天气查询这样的一个功能，然后语音技能业务应用将查询的结果通过通讯接口再反馈给本地语音引擎，本地语音引擎再将从语音技能业务应用反馈过来的查询的结果转换成语音播报出来。

自定义智能音箱技能的系统还包括基于循环神经网络的语音唤醒引擎；基于循环神经网络的语音唤醒引擎，用于对若干个不同的语音技能业务应用相对应的唤醒语进行学习、并将新的判断为属于若干个不同的语音技能业务应用的唤醒语动态添加进注册表中。基于循环神经网络的语音唤醒引擎位于云平台上，也可以位于智能音箱终端上，在此不作限定。

本实施例一还提供了一种自定义智能音箱技能的方法。如图2所示，该方法包括以下步骤：

s1)启动智能音箱终端，用户发出语音指令，判断所述语音指令的语法是否正确，若是，则进入步骤s2)；若否，则重复本步骤；

s2)通过语音引擎接收用户发出的语音指令，打开语音引擎与语音技能模块之间的通讯接口，并利用语音引擎对语音指令进行解析，获得语音指令解析结果；所述语音引擎为本地语音引擎，直接位于智能音箱终端上；

在本实施例中，步骤s3)中调用注册表前，还包括实时地对新的语音技能业务应用进行定义，并将新定义的语音技能业务应用的关键语音信息动态更新到注册表中，生成最新的注册表供语音引擎调用，新定义的语音技能业务应用的关键语音信息包括新定义的语音技能业务应用的名称、与新定义的语音技能业务应用相对应的唤醒语以及新定义的语音技能业务应用的配置参数。

本实施例一还提供了一种计算机可读存储介质，本实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机设备可读取的存储介质中，用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备，例如：个人计算机、服务器、网络设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等；所述的存储介质，例如：ram、rom、磁碟、磁带、光盘、闪存、u盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。

实施例二，一种自定义智能音箱技能的系统。如图3所示，在本实施例二中，语音识别模块包括云平台语音引擎。云平台语音引擎通过网络与智能音箱终端进行通讯。

本实施例二提供了一种自定义智能音箱技能的方法。如图4所示，该方法包括以下步骤：

s1)启动智能音箱终端，用户发出语音指令，判断所述语音指令的语法是否正确，若是，则进入步骤s2)；若否，则重复本步骤；

s2)通过语音引擎接收用户发出的语音指令，打开语音引擎与语音技能模块之间的通讯接口，并利用语音引擎对语音指令进行解析，获得语音指令解析结果；语音引擎为云平台语音引擎，云平台语音引擎通过网络与智能音箱终端进行通讯；

本实施例二的其余部分与实施例一相同，在此不再重复陈述。

实施例三，一种自定义智能音箱技能的系统。在本实施例三中，语音识别模块包括本地语音引擎和云平台语音引擎。云平台语音引擎通过网络与智能音箱终端进行通讯。本地语音引擎位于智能音箱终端。

本实施例三还提供了一种自定义智能音箱技能的方法。如图5所示，该方法包括以下步骤：

s1)启动智能音箱终端，用户发出语音指令，判断语音指令的语法是否正确，若是，则进入步骤s2)；若否，则重复本步骤；

s2)判断网络是否连通，若是，则将云平台语音引擎作为后续步骤中执行的语音引擎，进入步骤s3)；若否，则将本地语音引擎作为后续步骤中执行的语音引擎，进入步骤s3)；

s3)通过语音引擎接收用户发出的语音指令，打开语音引擎与语音技能模块之间的通讯接口，并利用语音引擎对语音指令进行解析，获得语音指令解析结果；

s4)调用注册表，判断语音引擎通过通讯接口是否在注册表中匹配到与语音指令解析结果相对应的语音技能业务应用，若是，则将与语音指令解析结果相对应的语音技能业务应用与语音指令进行绑定，进入步骤s4)；若否，则返回步骤s1)；

s5)执行与语音指令解析结果相对应的语音技能业务应用中的业务逻辑，获得执行的业务逻辑结果，并通过通讯接口将业务逻辑结果反馈给语音引擎，语音引擎将业务逻辑结果转换成语音、并进行播报。

本实施例三的其余部分均与实施例一、实施例二相同，在此不再重复陈述。

本发明的有益效果是：本发明解耦了语音引擎与语音技能业务应用，实现语音引擎的独立更新、语音技能业务应用的独立更新和动态增减；解耦后的智能音箱终端丰富了语音技能的多样性；实现了自定义语音技能的功能，更进一步地增加的智能音箱终端的趣味多样性，减少了同质化严重的问题。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴涛
技术所有人：湖南华诺科技有限公司
我是此专利的发明人

上一篇：一种高效调压箱测试台及其测试方法与流程
上一篇：吸尘器的制作方法