语音交互方法、服务器及计算机可读存储介质与流程

文档序号：40438737发布日期：2024-12-24 15:12阅读：18来源：国知局

本技术涉及语音交互，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术：

1、随着用户对于车载语音交互功能的逐渐习惯，用户在语音交互过程中可能会通过简短的语音指令来控制车辆，如通过“调成28度”代替“把空调温度设置为28摄氏度”。然而，由于这种简短的语音指令可指向多种车载功能，导致用户意图的识别难度较高，进而难以被准确地理解和执行。

技术实现思路

1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供的一种语音交互方法，包括：

3、接收车辆转发的当前对话轮次的第一语音请求；

4、根据所述第一语音请求、第二语音请求及所述第二语音请求的自然语言理解结果，对所述第一语音请求进行应用程序接口预测和接口参数填充，其中，所述第二语音请求为所述当前对话轮次的前一对话轮次的语音请求；

5、向所述车辆发送所述接口参数填充的执行结果以完成所述语音交互。

6、本技术实施方式提供的语音交互方法中，服务器可接收车辆转发的当前对话轮次的第一语音请求，并根据第一语音请求、第二语音请求及第二语音请求的自然语言理解结果，对第一语音请求进行应用程序接口预测和接口参数填充，及向车辆发送接口参数填充的执行结果，以使车辆可根据执行结果执行相应操作，从而完成与用户的语音交互。

7、如此，在本技术实施方式中，可使当前对话轮次的第一语音请求的处理基于上一对话轮次的第二语音请求及第二语音请求的自然语言理解结果执行，实现了基于上下文的语音交互，进而在一定程度上保障了第一语音请求的应用程序预测的结果和参数填充的执行结果的可信程度，由此保障了语音交互的可靠执行，用户对于语音交互功能的使用体验得以保障。以及，在当前对话轮次的语音请求较简短的情况下，可追踪上一对话轮次的语音请求及自然语言理解结果，以执行当前对话轮次的语音请求对应的用户意图确定和自然语言理解，一定程度上保障了当前对话轮次的语音请求的可靠处理，及提高了语音交互功能在复杂多轮对话场景上的适用效果。

8、在本技术某些实施方式中，所述根据所述第一语音请求、第二语音请求及所述第二语音请求的自然语言理解结果，对所述第一语音请求进行应用程序接口预测和接口参数填充，包括：

9、对根据所述第一语音请求、所述第二语音请求、所述自然语言理解结果进行拼接处理；

10、根据所述拼接处理的结果，对所述第一语音请求进行所述应用程序接口预测和所述接口参数填充。

11、如此，在本技术实施方式中，可将第一语音请求、第二语音请求及第二语音请求的自然语言理解结果进行拼接处理，并根据拼接处理的结果进行第一语音请求的应用程序接口预测和接口参数填充。

12、在本技术某些实施方式中，所述根据所述第一语音请求、第二语音请求及所述第二语音请求的自然语言理解结果，对所述第一语音请求进行应用程序接口预测和接口参数填充，包括：

13、配置所述拼接处理的结果内每个参数的对话轮次标签。

14、如此，在本技术实施方式中，可在完成第一语音请求、第二语音请求及第二语音请求的自然语言理解结果进行拼接处理以得到拼接处理的结果的情况下，配置拼接处理的结果中各个参数的对话轮次标签，使得拼接处理的结果中属于当前对话轮次的参数与属于上一对话轮次的参数之间可基于对话轮次标签区分。

15、在本技术某些实施方式中，所述方法还包括：

16、对所述第一语音请求进行槽位识别；

17、所述对根据所述第一语音请求、所述第二语音请求、所述自然语言理解结果进行拼接处理，包括：

18、对所述第一语音请求、所述槽位识别的结果、所述第二语音请求、所述自然语言理解结果进行拼接处理以得到所述拼接处理的结果。

19、如此，在本技术实施方式中，可对第一语音请求进行槽位识别，及将第一语音请求、第一语音请求的槽位识别的结果、第二语音请求的自然语言理解结果进行拼接处理，以得到拼接处理的结果。

20、在本技术某些实施方式中，所述根据所述第一语音请求、第二语音请求及所述第二语音请求的自然语言理解结果，对所述第一语音请求进行应用程序接口预测和接口参数填充，包括：

21、配置所述拼接处理的结果内每个参数的位置标签。

22、如此，在本技术实施方式中，可根据第一语音请求的槽位识别的结果，以及第二语音请求的应用程序接口的接口填充参数，对第一语音请求的应用程序接口预测的结果进行参数填充处理。

23、在本技术某些实施方式中，所述第二语音请求的所述自然语言理解结果包括第二语音请求对应的应用程序预测和填充所述应用程序预测的目标参数。

24、如此，在本技术实施方式中，可在完成第一语音请求、第二语音请求及第二语音请求的自然语言理解结果进行拼接处理以得到拼接处理的结果的情况下，配置拼接处理的结果中各个参数的位置标签，使得拼接处理的结果中的各个参数之间可基于位置标签区分和关联，进而可在一定程度上提高应用程序接口预测和参数填充的准确程度。

25、在本技术某些实施方式中，所述方法还包括：

26、根据所述第一语音请求、所述第二语音请求及所述自然语言理解结果，确定所述第一语音请求相对于所述第二语音请求的对话关联属性信息，其中，所述对话关联属性信息用于指示所述第一语音请求和所述第二语音请求是否相关联。

27、如此，在本技术实施方式中，可根据第一语音请求、第二语音请求及自然语言理解结果，确定第一语音请求相对于第二语音请求的对话关联属性信息，从而确定本轮对话与上一轮对话的关系。

28、在本技术某些实施方式中，所述向所述车辆发送所述接口参数填充的执行结果以完成所述语音交互，包括：

29、向所述车辆发送所述执行结果和所述对话关联属性信息，以完成所述语音交互。

30、如此，在本技术实施方式中，可向车辆下发应用程序接口参数的填充处理的执行结果，以及第一语音请求相对于第二语音请求的对话关联属性信息，使得车辆可根据执行结果和对话关联属性信息执行相应操作。

31、本技术实施方式提供一种服务器，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音交互方法。

32、本技术实施方式提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的语音交互方法。

33、本技术实施方式提供的服务器和计算机可读存储介质，可使当前对话轮次的第一语音请求的处理基于上一对话轮次的第二语音请求及第二语音请求的自然语言理解结果执行，实现了基于上下文的语音交互，进而在一定程度上保障了第一语音请求的应用程序预测的结果和参数填充的执行结果的可信程度，由此保障了语音交互的可靠执行，用户对于语音交互功能的使用体验得以保障。以及，在当前对话轮次的语音请求较简短的情况下，可追踪上一对话轮次的语音请求及自然语言理解结果，以执行当前对话轮次的语音请求对应的用户意图确定和自然语言理解，一定程度上保障了当前对话轮次的语音请求的可靠处理，及提高了语音交互功能在复杂多轮对话场景上的适用效果。

34、本技术的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实施方式的实践了解到。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱麒宇,赵群,樊骏锋
技术所有人：广州小鹏汽车科技有限公司
我是此专利的发明人

上一篇：一种卸纸机用卸纸平台的制作方法
上一篇：一种活性炭滤芯生产撒碳机的制作方法