语音识别方法、装置、系统、电子设备及存储介质与流程

文档序号：31333995发布日期：2022-08-31 08:04阅读：97来源：国知局

1.本技术涉及语音识别技术领域，尤其涉及一种语音识别方法、装置、系统、电子设备及存储介质。

背景技术：

2.随着语音识别技术的兴起，语音交互技术逐渐应用到各种产品领域。相关技术中，语音识别设备通过对采集到的语音数据进行处理，得到用户的意图，并根据用户的意图执行相应的操作。
3.然而，任何意图的增减或修改都需要升级语音识别设备中的软件，由于升级条件的限制(例如，是否支持远程升级、是否开机在线、是否影响当前使用、升级频率限制、是否全部升级完成等)，会存在较多升级方面的操作问题、应用迭代升级实时性的问题等。

技术实现要素：

4.为了解决上述技术问题，本技术提供了一种语音识别方法、装置、系统、电子设备及存储介质。
5.根据本技术的第一方面，提供了一种语音识别方法，包括：
6.接收语音来源设备发送的第一语音数据；
7.对所述第一语音数据进行语音识别和自然语言理解，得到所述第一语音数据对应的第一意图信息；
8.将所述第一意图信息转换为语音执行设备对应的第一操作指令；
9.向所述语音执行设备发送所述第一操作指令，以使所述语音执行设备按照所述第一操作指令执行对应的控制操作。
10.可选的，所述方法还包括：
11.获取预先建立的、与所述语音来源设备和所述语音执行设备对应的第一意图信息和第一操作指令的第一对应关系；
12.所述将所述第一意图信息转换为语音执行设备对应的第一操作指令，包括：
13.根据所述第一对应关系，将所述第一意图信息转换为语音执行设备对应的第一操作指令。
14.可选的，所述方法还包括：
15.响应于添加操作，添加与所述语音来源设备和所述语音执行设备对应的第二意图信息和第二操作指令的第二对应关系；
16.当接收到所述语音来源设备发送的第二语音数据，并对所述第二语音数据进行语音识别和自然语言理解，得到所述第二意图信息时，所述方法还包括：
17.根据所述第二对应关系，将所述第二意图信息转换为所述第二操作指令；
18.向所述语音执行设备发送所述第二操作指令，以使所述语音执行设备按照所述第二操作指令执行对应的控制操作。
19.可选的，所述方法还包括：
20.检测与所述语音来源设备是否为首次连接；
21.如果是首次连接，则根据所述语音来源设备的类别，建立与所述语音来源设备和所述语音执行设备对应的意图信息和操作指令的对应关系，其中，所述对应关系包括所述第一对应关系；
22.如果不是首次连接，则从所述对应关系中获取所述第一对应关系。
23.可选的，所述第一操作指令的数量为多个，且多个所述第一操作指令按预设顺序排列；
24.向所述语音执行设备发送所述第一操作指令，以使所述语音执行设备按照所述第一操作指令执行对应的控制操作，包括：
25.按所述预设顺序，向所述语音执行设备依次发送多个所述第一操作指令，以使所述语音执行设备按照多个所述第一操作指令执行对应的控制操作。
26.可选的，所述语音执行设备所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。
27.可选的，所述语音来源设备和所述语音执行设备为同一设备。
28.根据本技术的第二方面，提供了一种语音识别装置，包括：
29.语音数据接收模块，用于接收语音来源设备发送的第一语音数据；
30.意图识别模块，用于对所述第一语音数据进行语音识别和自然语言理解，得到所述第一语音数据对应的第一意图信息；
31.意图转换模块，用于将所述第一意图信息转换为语音执行设备对应的第一操作指令；
32.操作指令发送模块，用于向所述语音执行设备发送所述第一操作指令，以使所述语音执行设备按照所述第一操作指令执行对应的控制操作。
33.可选的，所述语音识别装置还包括：
34.对应关系获取模块，用于获取预先建立的、与所述语音来源设备和所述语音执行设备对应的第一意图信息和第一操作指令的第一对应关系；
35.所述意图转换模块，具体用于根据所述第一对应关系，将所述第一意图信息转换为语音执行设备对应的第一操作指令。
36.可选的，所述语音识别装置还包括：
37.对应关系添加模块，用于响应于添加操作，添加与所述语音来源设备和所述语音执行设备对应的第二意图信息和第二操作指令的第二对应关系；
38.所述意图转换模块，还用于当接收到所述语音来源设备发送的第二语音数据，并对所述第二语音数据进行语音识别和自然语言理解，得到所述第二意图信息时，根据所述第二对应关系，将所述第二意图信息转换为所述第二操作指令；
39.所述操作指令发送模块，还用于向所述语音执行设备发送所述第二操作指令，以使所述语音执行设备按照所述第二操作指令执行对应的控制操作。
40.可选的，所述语音识别装置还包括：
41.首次连接检测模块，用于检测与所述语音来源设备是否为首次连接；
42.对应关系建立模块，用于如果所述首次连接检测模块的检测结果是首次连接，则
根据所述语音来源设备的类别，建立与所述语音来源设备和所述语音执行设备对应的意图信息和操作指令的对应关系，其中，所述对应关系包括所述第一对应关系；
43.所述对应关系获取模块，具体用于如果所述首次连接检测模块的检测结果不是首次连接，则从所述对应关系中获取所述第一对应关系。
44.可选的，所述第一操作指令的数量为多个，且多个所述第一操作指令按预设顺序排列；
45.所述操作指令发送模块，具体用于按所述预设顺序，向所述语音执行设备依次发送多个所述第一操作指令，以使所述语音执行设备按照多个所述第一操作指令执行对应的控制操作。
46.可选的，所述语音执行设备所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。
47.可选的，所述语音来源设备和所述语音执行设备为同一设备。
48.根据本技术的第三方面，提供了一种语音识别系统，包括：
49.语音来源设备，用于采集第一语音数据，并向云端发送所述第一语音数据；
50.所述云端，用于对接收到的所述第一语音数据进行语音识别和自然语言理解，得到所述第一语音数据对应的第一意图信息，将所述第一意图信息转换为语音执行设备对应的第一操作指令，并向所述语音执行设备发送所述第一操作指令；
51.所述语音执行设备，用于按照所述第一操作指令执行对应的控制操作。
52.可选的，所述云端还用于获取预先建立的、与所述语音来源设备和所述语音执行设备对应的第一意图信息和第一操作指令的第一对应关系，以根据所述第一对应关系，将所述第一意图信息转换为语音执行设备对应的第一操作指令。
53.可选的，所述云端还用于响应于添加操作，添加与所述语音来源设备和所述语音执行设备对应的第二意图信息和第二操作指令的第二对应关系；当接收到所述语音来源设备发送的第二语音数据，并对所述第二语音数据进行语音识别和自然语言理解，得到所述第二意图信息时，根据所述第二对应关系，将所述第二意图信息转换为所述第二操作指令；向所述语音执行设备发送所述第二操作指令；
54.所述语音执行设备，用于按照所述第二操作指令执行对应的控制操作。
55.可选的，所述云端还用于检测与所述语音来源设备是否为首次连接，如果是首次连接，则根据所述语音来源设备的类别，建立与所述语音来源设备和所述语音执行设备对应的意图信息和操作指令的对应关系，其中，所述对应关系包括所述第一对应关系；如果不是首次连接，则从所述对应关系中获取所述第一对应关系。
56.可选的，所述第一操作指令的数量为多个，且多个所述第一操作指令按预设顺序排列；
57.所述云端具体用于按所述预设顺序，向所述语音执行设备依次发送多个所述第一操作指令；
58.所述语音执行设备，具体用于按照多个所述第一操作指令执行对应的控制操作。
59.可选的，所述语音执行设备所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。
60.可选的，所述语音来源设备和所述语音执行设备为同一设备。
61.根据本技术的第四方面，提供了一种电子设备，包括：处理器，所述处理器用于执行存储于存储器的计算机程序，所述计算机程序被处理器执行时实现第一方面所述的语音识别方法。
62.根据本技术的第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的语音识别方法。
63.根据本技术的第六方面，提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面所述的语音识别方法。
64.本技术实施例提供的技术方案与现有技术相比具有如下优点：
65.语音来源设备采集第一语音数据后，可以将第一语音数据发送至云端，通过云端对第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息，并将第一意图信息转换为语音执行设备对应的第一操作指令。云端向语音执行设备发送第一操作指令，这样，语音执行设备无需在本地识别用户的意图，以及查找对应的操作指令，而是直接按照第一操作指令执行对应的控制操作即可。在语音执行设备要支持新的语音指令的情况下，只需在云端增加新的语音指令对应的操作指令，不需要修改/升级语音执行设备中的任何软件，实现功能添加配置的灵活扩展性、迭代升级实时性、版本功能可控性，也极大便于代码模块化维护、多功能和多处理逻辑的管理。
附图说明
66.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
67.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
68.图1示出了可以应用于本技术实施例的语音识别方法的示例性应用环境的系统架构的示意图；
69.图2为本技术实施例中语音识别方法的一种示意图；
70.图3为本技术实施例中语音识别方法的一种流程图；
71.图4为本技术实施例中语音识别方法的又一种流程图；
72.图5为本技术实施例中语音识别装置的一种结构示意图；
73.图6为本技术实施例中语音识别系统的一种结构示意图；
74.图7为本技术实施例中电子设备的一种结构示意图。
具体实施方式
75.为了能够更清楚地理解本技术的上述目的、特征和优点，下面将对本技术的方案进行进一步描述。需要说明的是，在不冲突的情况下，本技术的实施例及实施例中的特征可以相互组合。
76.在下面的描述中阐述了很多具体细节以便于充分理解本技术，但本技术还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本技术的一部分实施例，而不是全部的实施例。
77.图1示出了可以应用于本技术实施例的语音识别方法的示例性应用环境的系统架构的示意图。
78.如图1所示，系统架构100可以包括语音来源设备101网络102、云端103和语音执行设备104。网络102用以在语音来源设备101和云端103之间以及云端103和语音执行设备104之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。语音来源设备101和语音执行设备104是可以进行语音识别的设备，包括但不限于智能电视、智能音箱、智能灯和智能手机等等。应该理解，图1中的语音来源设备、语音执行设备、网络和云端的数量仅仅是示意性的。根据实现需要，可以具有任意数量的语音来源设备、语音执行设备、网络和云端。比如云端103可以是多个服务器组成的服务器集群等。
79.本技术实施例所提供的语音识别方法一般由云端103执行，相应地，语音识别装置可以设置于云端103中。参见图2，图2为本技术实施例中语音识别方法的一种示意图。语音来源设备可以采集语音数据，并将采集到的语音数据发送至云端，云端对该语音数据进行语音识别和自然语言理解之后，得到对应的意图信息。将该意图信息转换为语音执行设备对应的操作指令，并返回该操作指令。语音执行设备104接收到该操作指令后，执行对应的控制操作。
80.可以看出，语音来源设备101采集语音数据后，将语音数据发送至云端103，语音识别的过程、自然语言理解的过程和意图信息转换的过程均在云端103执行，语音执行设备104直接接收操作指令，并按照操作指令执行对应的控制操作即可。因此，在要增加新的语音指令的情况下，可以无需对语音执行设备104中的软件进行升级操作，而是在云端103增加相应的配置即可，从而可以灵活地扩展语音执行设备104的语音识别功能。
81.以下首先对本技术实施例的语音识别方法进行详细介绍。
82.参见图3，图3为本技术实施例中语音识别方法的一种流程图，可以包括以下步骤：
83.步骤s310，接收语音来源设备发送的第一语音数据。
84.本技术实施例的语音识别方法可以由云端来执行，语音来源设备可以作为与用户直接交互的设备，在采集到第一语音数据后，将第一语音数据发送至云端，或者，接收其他语音采集设备(例如无线麦克风等)采集的的第一语音数据，将第一语音数据发送至云端，后续的语音处理过程通过云端完成。第一语音数据例如可以是下述语音执行设备当前所支持的语音指令，包括语音执行设备出厂时所支持的语音指令。语音执行设备例如可以是用户实际想要控制的设备。举例而言，语音执行设备为家用机器人，如果家用机器人支持语音指令“开灯”，则用户说“开灯”的语音指令时，家用机器人可以执行开灯的动作。
85.根据不同的场景，语音来源设备和语音执行设备可以为同一设备，也可以为不同的设备。例如，语音来源设备和语音执行设备均可以为智能音箱。或者，语音来源设备为智能音箱，语音执行设备为智能灯。
86.步骤s320，对第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息。
87.通过语音识别技术(将语音数据识别为文本信息的技术)，可以先对第一语音数据进行语音识别，得到对应的文本信息。自然语言理解的过程是根据文本信息识别用户意图的过程。通过对得到的文本信息进行自然语言理解，可以得到对应的第一意图信息。
88.步骤s330，将第一意图信息转换为语音执行设备对应的第一操作指令。
89.可以理解的是，针对语音来源设备接收到的每个语音指令，可以先识别该语音指令中用户的意图信息，然后根据用户的意图信息得到对应的操作指令，语音执行设备再根据该操作指令执行对应的控制操作。相关技术中，语音执行设备接收到新的语音指令，进行语音识别和自然语言理解之后，得到新的意图。如果语音执行设备不支持该新的意图，将无法得到对应的操作指令，并执行对应的控制操作。或者，如果通过云端进行语音识别和自然语言理解之后，得到新的意图，并将新的意图返回至语音执行设备，语音执行设备也无法得到对应的操作指令，并执行对应的控制操作。
90.本技术实施例中，云端根据第一语音数据得到第一意图信息后，进一步将第一意图信息转换为语音执行设备对应的第一操作指令，该第一操作指令是语音执行设备可以识别的操作指令。
91.步骤s340，向语音执行设备发送第一操作指令，以使语音执行设备按照第一操作指令执行对应的控制操作。
92.云端将第一操作指令发送至语音执行设备，语音执行设备可以直接根据第一操作指令执行对应的控制操作，避免了语音执行设备根据意图信息确定操作指令的过程。这样，在用户有新的意图的情况下，也可以按照上述语音识别方法，在云端得到对应的操作指令，避免对语音执行设备进行软件升级。
93.在一些实施例中，语音执行设备所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。举例而言，如果语音执行设备为智能音箱，用户说“播放歌曲a”的语音指令时，智能音箱可以播放歌曲a。如果语音执行设备为家用机器人，用户说“开灯”的语音指令时，家用机器人可以执行开灯的动作，例如可以通过自带的红外遥控发射设备控制开关灯。
94.在一些实施例中，第一操作指令的数量还可以为多个，且多个第一操作指令按预设顺序排列，此时可以按预设顺序，向语音执行设备依次发送多个第一操作指令，以使语音执行设备按照多个第一操作指令执行对应的控制操作。
95.例如，语音执行设备为智能电视，用户说“播放电视剧b”的语音指令，在此过程中可以包括两个操作：智能电视打开媒体软件1(例如可以是用户使用频率较高的媒体软件或者热度最高的媒体软件等)、智能电视打开该媒体软件1中该电视剧b的播放资源。云端可以依次发送打开媒体软件1的操作指令和播放电视剧b的操作指令，智能电视可以根据打开媒体软件1的操作指令打开媒体软件1，根据播放电视剧b的操作指令播放电视剧b。
96.或者，语音执行设备为家用机器人，用户说“打开厨房的灯”的语音指令，在此过程中可以包括两个操作：家用机器人进入厨房、打开灯。云端可以依次发送进入厨房的操作指令和打开灯的操作指令，家用机器人依次接收到该两个指令后，进入厨房，并打开灯。
97.本技术实施例的语音识别方法，语音来源设备采集第一语音数据后，可以将第一语音数据发送至云端，通过云端对第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息，并将第一意图信息转换为语音执行设备对应的第一操作指令。云端向语音执行设备发送第一操作指令，这样，语音执行设备无需在本地识别用户的意图，以及查找对应的操作指令，而是直接按照第一操作指令执行对应的控制操作即可。在语音执行设备要支持新的语音指令的情况下，只需在云端增加新的语音指令对应的操作指
令，不需要修改/升级语音执行设备中的任何软件，实现功能添加配置的灵活扩展性、迭代升级实时性、版本功能可控性，也极大便于代码模块化维护、多功能和多处理逻辑的管理。
98.参见图4，图4为本技术实施例中语音识别方法的又一种流程图，可以包括以下步骤：
99.步骤s410，接收语音来源设备发送的第一语音数据。
100.步骤s420，对第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息。
101.上述步骤s410～步骤s420与图3实施例中步骤s310～步骤s320相同，具体参见图3实施例中的描述即可，在此不再赘述。
102.步骤s430，获取预先建立的、与语音执行设备对应的第一意图信息和第一操作指令的第一对应关系，根据第一对应关系，将第一意图信息转换为语音执行设备对应的第一操作指令。
103.本技术实施例中，针对不同的语音来源设备和语音执行设备，云端可以建立与语音来源设备和语音执行设备对应的意图信息和操作指令的对应关系，该对应关系中包括第一意图信息和第一操作指令的第一对应关系。针对相同的意图信息，不同语音执行设备对应的操作指令可以相同，也可以不同。针对不同语音来源设备发送的语音数据，在识别到意图信息之后，可以直接根据该对应关系，得到对应的操作指令。
104.可选的，可以检测云端与语音来源设备是否为首次连接，如果是首次连接，则根据语音来源设备的类别(例如，可以根据语音来源设备的识别码等)，建立与语音来源设备和一个或多个语音执行设备对应的意图信息和操作指令的对应关系。其中，一个或多个语音执行设备可以预先配置。针对每一组语音来源设备和语音执行设备，均可以建立对应的意图信息和操作指令的对应关系。其中，该对应关系中可以包括多组意图信息和操作指令的对应关系，例如，对应关系包括前述的第一对应关系。如果不是首次连接，由于在首次连接时已经建立了意图信息和操作指令的对应关系，因此可以直接从该对应关系中获取第一对应关系。
105.在一些实施例中，云端也可以预先建立不同语音来源设备和语音执行设备对应的意图信息和操作指令的对应关系。在云端与语音来源设备首次连接或非首次连接时，均可以直接根据语音来源设备的类别，获取对应的意图信息和操作指令的对应关系。进而，根据该对应关系，将意图信息转换为对应的操作指令。
106.步骤s440，向语音执行设备发送第一操作指令，以使语音执行设备按照第一操作指令执行对应的控制操作。
107.本步骤与图3实施例中步骤s340相同，具体参见图3实施例中的描述即可，在此不再赘述。
108.针对用户新增加的语音指令，如果语音执行设备不支持该语音指令，还可以执行下述步骤s450～步骤s470。
109.步骤s450，响应于添加操作，添加与语音来源设备和语音执行设备对应的第二意图信息和第二操作指令的第二对应关系。
110.在用户使用语音执行设备的过程中，可以搜集用户新增加的意图信息，第二意图信息例如可以是用户新增加的意图信息，并设置对应的操作指令，从而建立新增加的意图
信息和新增加的操作指令的对应关系。第二对应关系是新增加的对应关系中的一个。
111.步骤s460，当接收到语音来源设备发送的第二语音数据，并对第二语音数据进行语音识别和自然语言理解，得到第二意图信息时，根据第二对应关系，将第二意图信息转换为第二操作指令。
112.在接收到第二语音数据(该第二语音数据对应第二意图信息)的情况下，云端可以直接根据第二对应关系进行意图转换，得到第二操作指令。
113.步骤s470，向语音执行设备发送第二操作指令，以使语音执行设备按照第二操作指令执行对应的控制操作。
114.该步骤与步骤s340类似，具体参见步骤s340中的描述即可，在此不再赘述。
115.可以看出，在用户有新的意图的情况下，直接在云端添加对应的意图信息和操作指令的对应关系即可，不需要修改/升级语音执行设备中的任何软件，从而可以灵活地对语音执行设备的功能进行扩展。在该过程中，不会因为软件升级对用户的使用造成影响，提升用户体验。并且，开人人员更容易对语音执行设备进行维护管理。
116.相应于上述方法实施例，本技术实施例还提供了一种语音识别装置，参见图5，语音识别装置500包括：
117.语音数据接收模块510，用于接收语音来源设备发送的第一语音数据；
118.意图识别模块520，用于对第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息；
119.意图转换模块530，用于将第一意图信息转换为语音执行设备对应的第一操作指令；
120.操作指令发送模块540，用于向语音执行设备发送第一操作指令，以使语音执行设备按照第一操作指令执行对应的控制操作。
121.可选的，语音识别装置500还包括：
122.对应关系获取模块，用于获取预先建立的、与语音来源设备和语音执行设备对应的第一意图信息和第一操作指令的第一对应关系；
123.意图转换模块530，具体用于根据第一对应关系，将第一意图信息转换为语音执行设备对应的第一操作指令。
124.可选的，语音识别装置500还包括：
125.对应关系添加模块，用于响应于添加操作，添加与语音来源设备和语音执行设备对应的第二意图信息和第二操作指令的第二对应关系；
126.意图转换模块530，还用于当接收到语音来源设备发送的第二语音数据，并对第二语音数据进行语音识别和自然语言理解，得到第二意图信息时，根据第二对应关系，将第二意图信息转换为第二操作指令；
127.操作指令发送模块540，还用于向语音执行设备发送第二操作指令，以使语音执行设备按照第二操作指令执行对应的控制操作。
128.可选的，语音识别装置500还包括：
129.首次连接检测模块，用于检测与语音来源设备是否为首次连接；
130.对应关系建立模块，用于如果首次连接检测模块的检测结果是首次连接，则根据语音来源设备的类别，建立与语音来源设备和语音执行设备对应的意图信息和操作指令的
对应关系，其中，对应关系包括第一对应关系；
131.对应关系获取模块，具体用于如果首次连接检测模块的检测结果不是首次连接，则从对应关系中获取第一对应关系。
132.可选的，第一操作指令的数量为多个，且多个第一操作指令按预设顺序排列；
133.操作指令发送模块540，具体用于按预设顺序，向语音执行设备依次发送多个第一操作指令，以使语音执行设备按照多个第一操作指令执行对应的控制操作。
134.可选的，语音执行设备所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。
135.可选的，语音来源设备和语音执行设备为同一设备。
136.上述装置中各模块或单元的具体细节已经在对应的方法中进行了详细的描述，因此此处不再赘述。
137.本技术实施例还提供了一种语音识别系统，参见图6，语音识别系统600包括：
138.语音来源设备610，用于采集第一语音数据，并向云端发送第一语音数据；
139.云端620，用于对接收到的第一语音数据进行语音识别和自然语言理解，得到第一语音数据对应的第一意图信息，将第一意图信息转换为语音执行设备对应的第一操作指令，并向语音执行设备发送第一操作指令；
140.语音执行设备630，用于按照第一操作指令执行对应的控制操作。
141.可选的，云端620还用于获取预先建立的、与语音来源设备610和语音执行设备630对应的第一意图信息和第一操作指令的第一对应关系，以根据第一对应关系，将第一意图信息转换为语音执行设备630对应的第一操作指令。
142.可选的，云端620还用于响应于添加操作，添加与语音来源设备610和语音执行设备630对应的第二意图信息和第二操作指令的第二对应关系；当接收到语音来源设备610发送的第二语音数据，并对第二语音数据进行语音识别和自然语言理解，得到第二意图信息时，根据第二对应关系，将第二意图信息转换为第二操作指令；向语音执行设备630发送第二操作指令；
143.语音执行设备630，用于按照第二操作指令执行对应的控制操作。
144.可选的，云端620还用于检测与语音来源设备是否为首次连接，如果是首次连接，则根据语音来源设备的类别，建立与语音来源设备和语音执行设备对应的意图信息和操作指令的对应关系，其中，对应关系包括第一对应关系；如果不是首次连接，则从对应关系中获取第一对应关系。
145.可选的，第一操作指令的数量为多个，且多个第一操作指令按预设顺序排列；
146.云端620具体用于按预设顺序，向语音执行设备依次发送多个第一操作指令；
147.语音执行设备630，具体用于按照多个第一操作指令执行对应的控制操作。
148.可选的，语音执行设备630所执行的控制操作包括：对自身的控制操作和/或对目标设备的控制操作。
149.可选的，语音来源设备610和语音执行设备630为同一设备。
150.上述系统中各设备的具体细节已经在对应的方法中进行了详细的描述，因此此处不再赘述。
151.应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单
元，但是这种划分并非强制性的。实际上，根据本技术的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
152.在本技术的示例性实施例中，还提供一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行本示例实施方式中上述语音识别方法。
153.图7为本技术实施例中电子设备的一种结构示意图。需要说明的是，图7示出的电子设备700仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
154.如图7所示，电子设备700包括中央处理单元(cpu)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中，还存储有系统操作所需的各种程序和数据。中央处理单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
155.以下部件连接至i/o接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如局域网(lan)卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。
156.特别地，根据本技术的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本技术的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元701执行时，执行本技术的装置中限定的各种功能。
157.本技术实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述语音识别方法。
158.需要说明的是，本技术所示的计算机可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器、只读存储器、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、射频等等，或者上述的任意合适的组合。
159.本技术实施例中，还提供了一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行上述语音识别方法。
160.需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之
间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
161.以上所述仅是本技术的具体实施方式，使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩启源张含波陈孝良
技术所有人：北京声智科技有限公司
我是此专利的发明人

上一篇：一种用于包覆式机盖的包边设备及包边方法与流程
上一篇：一种救灾机器人的制作方法