一种语助对话管理方法、装置、设备及存储介质与流程

文档序号：34536325发布日期：2023-06-27 12:33阅读：48来源：国知局

本发明涉及语音识别，具体地说，涉及一种语助对话管理方法、装置、设备及存储介质。

背景技术：

1、当前语音助手交互成为重要的人机交互方式，但是当前汽车语助领域，其逻辑功能十分复杂，语助功能的开发及定制化，尤其是后续的语助迭代和优化，开发周期十分漫长，通常需要40人以上的团队做半年至一年，在对话逻辑定制化方面，也需要专业的开发人员进行对话管理的定制化开发，企业投入成本大且效率非常低下。

技术实现思路

1、为了解决上述问题，本发明提出一种语助对话管理方法、装置、设备及存储介质，能够解决现有语助功能逻辑功能复杂的问题，提高开发效率，减少开发周期。

2、本发明提供一种语助对话管理方法，所述方法包括：

3、响应于监测到的唤醒词语，录制音频数据形成语音文件，并获取车辆状态信息；

4、根据所述车辆状态信息采用自然语言理解组件对所述语音文件进行语音识别，提取出系统认知信息；

5、根据所述系统认知信息在预建的逻辑数据库中匹配对应的逻辑元件集；

6、将所述逻辑元件集发送到有限状态机中，生成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎；

7、通过逻辑引擎调用预建的信源集对应的功能，输出执行结果。

8、优选地，所述车辆状态信息包括通过传感器和gps得到的行驶状态、软件状态、用户状态和车辆定位。

9、优选地，所述系统认知信息具体包括指令信息、意图信息和词槽信息。

10、作为一种优选方案，所述逻辑元件集由逻辑效果不同的元件组成，所述元件具体包括开始元件、逻辑判断元件、信源调用元件、回复元件和连线。

11、优选地，所述将所述逻辑元件集发送到有限状态机中，形成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎，具体包括：

12、根据逻辑元件集将所述有限状态机的状态集、事件集、动作集进行初始化；

13、将所述逻辑元件集中的指令信息、意图信息和词槽信息作为逻辑输入执行逻辑链路中；

14、执行逻辑链路中的上层服务根据所述逻辑元件集发布一个tellnext事件，由tellnext动作去执行对应的节点动作，节点动作执行完之后会发布下一个tellnext事件，由tellnext动作继续找下一个节点执行动作，周而复始直到达成无下一节点、程序异常或远程服务请求超时，完成逻辑链路执行。

15、作为一种优选方案，所述逻辑数据库存储不同的对话目标所需要的对话逻辑元件集。

16、优选地，所述信源集具体包括音乐查询功能、地图查询功能和天气查询功能。

17、本发明实施例还提供一种语助对话管理装置，所述装置包括：

18、唤醒模块，用于响应于监测到的唤醒词语，录制音频数据形成语音文件，并获取车辆状态信息；

19、语音识别模块，用于根据所述车辆状态信息采用自然语言理解组件对所述语音文件进行语音识别，提取出系统认知信息；

20、匹配模块，用于根据所述系统认知信息在预建的逻辑数据库中匹配对应的逻辑元件集；

21、执行模块，用于将所述逻辑元件集发送到有限状态机中，生成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎；

22、输出模块，用于通过逻辑引擎调用预建的信源集对应的功能，输出执行结果。

23、优选地，所述车辆状态信息包括通过传感器和gps得到的行驶状态、软件状态、用户状态和车辆定位。

24、优选地，所述系统认知信息具体包括指令信息、意图信息和词槽信息。

25、作为一种优选方案，所述逻辑元件集由逻辑效果不同的元件组成，所述元件具体包括开始元件、逻辑判断元件、信源调用元件、回复元件和连线。

26、优选地，所述执行模块具体用于：

27、根据逻辑元件集将所述有限状态机的状态集、事件集、动作集进行初始化；

28、将所述逻辑元件集中的指令信息、意图信息和词槽信息作为逻辑输入执行逻辑链路中；

29、执行逻辑链路中的上层服务根据所述逻辑元件集发布一个tellnext事件，由tellnext动作去执行对应的节点动作，节点动作执行完之后会发布下一个tellnext事件，由tellnext动作继续找下一个节点执行动作，周而复始直到达成无下一节点、程序异常或远程服务请求超时，完成逻辑链路执行。

30、作为一种优选方案，所述逻辑数据库存储不同的对话目标所需要的对话逻辑元件集。

31、优选地，所述信源集具体包括音乐查询功能、地图查询功能和天气查询功能。

32、本发明实施例还提供一种终端设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如上述任一项实施例所述的一种语助对话管理方法。

33、本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任一项实施例所述的一种语助对话管理方法。

34、本发明提供一种语助对话管理方法、装置、设备及存储介质，通过响应于监测到的唤醒词语，录制音频数据形成语音文件，并获取车辆状态信息；根据所述车辆状态信息采用自然语言理解组件对所述语音文件进行语音识别，提取出系统认知信息；根据所述系统认知信息在预建的逻辑数据库中匹配对应的逻辑元件集；将所述逻辑元件集发送到有限状态机中，生成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎；通过逻辑引擎调用预建的信源集对应的功能，输出执行结果。能够解决现有语助功能逻辑功能复杂的问题，提高开发效率，减少开发周期。

技术特征：

1.一种语助对话管理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语助对话管理方法，其特征在于，所述车辆状态信息包括通过传感器和gps得到的行驶状态、软件状态、用户状态和车辆定位。

3.根据权利要求1所述的语助对话管理方法，其特征在于，所述系统认知信息具体包括指令信息、意图信息和词槽信息。

4.根据权利要求1所述的语助对话管理方法，其特征在于，所述逻辑元件集由逻辑效果不同的元件组成，所述元件具体包括开始元件、逻辑判断元件、信源调用元件、回复元件和连线。

5.根据权利要求1所述的语助对话管理方法，其特征在于，所述将所述逻辑元件集发送到有限状态机中，形成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎，具体包括：

6.根据权利要求1所述的语助对话管理方法，其特征在于，所述逻辑数据库存储不同的对话目标所需要的对话逻辑元件集。

7.根据权利要求1所述的语助对话管理方法，其特征在于，所述信源集具体包括音乐查询功能、地图查询功能和天气查询功能。

8.一种语助对话管理装置，其特征在于，所述装置包括：

9.一种终端设备，其特征在于，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的语助对话管理方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的语助对话管理方法。

技术总结
本发明公开了一种语助对话管理方法、装置、设备及存储介质，通过响应于监测到的唤醒词语，录制音频数据形成语音文件，并获取车辆状态信息；根据所述车辆状态信息采用自然语言理解组件对所述语音文件进行语音识别，提取出系统认知信息；根据所述系统认知信息在预建的逻辑数据库中匹配对应的逻辑元件集；将所述逻辑元件集发送到有限状态机中，生成所述有限状态机状态集、事件集和动作集，并执行逻辑引擎；通过逻辑引擎调用预建的信源集对应的功能，输出执行结果。能够解决现有语助功能逻辑功能复杂的问题，提高开发效率，减少开发周期。

技术研发人员：谢威,郑兴明,沈仲孝,刘棨,张莹,冉光伟,刘俊峰
受保护的技术使用者：星河智联汽车科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢威郑兴明沈仲孝刘棨张莹冉光伟刘俊峰
技术所有人：星河智联汽车科技有限公司
我是此专利的发明人

上一篇：一种非正交多址用户组上行数据传输方法和设备与流程
上一篇：一种定位架及传递物品的机械臂系统