语音指令确定方法、电子设备及存储介质与流程

文档序号：40596118发布日期：2025-01-07 20:36阅读：135来源：国知局

本技术涉及车机，具体涉及一种语音指令确定方法、电子设备及存储介质。

背景技术：

1、目前，车机语音的执行链路过程为：录音数据通过识别引擎转化成文字，文字内容传递给语义理解模块转化为各类指令，再交给具体业务模块执行该指令。

2、用户说话的过程中识别引擎会产生大量的中间结果和一个最终结果，现有技术通常分为两种：1、不对语音识别的中间结果处理，等待识别引擎的最终结果返回，语义理解模块仅处理最终结果；2、将中间结果作为语义理解模块的预处理数据，对每一个中间结果进行语义理解，在最终结果返回后匹配最终结果和预处理的中间结果。

3、然而，上述方案存在以下缺陷：1、由于需要等待最终结果的返回才进行语义理解，导致指令最终返回时间被拉长，进而导致指令执行速度慢；2、预处理的大量中间结果会导致语义理解模块执行大量的语义理解任务，进而导致算力飙升。

技术实现思路

1、鉴于现有技术中的上述缺陷或不足，本技术旨在提供一种语音指令确定方法、电子设备及存储介质，以解决现有技术中等待最终结果语义理解完成导致的指令执行速度慢的问题，以及，解决大量中间结果进行语义理解导致的算力飙升的问题。

2、本技术实施例提供一种语音指令确定方法，该方法包括：

3、获取用户发出的待处理语音对应的当前识别结果，并确定所述当前识别结果是否为中间结果；

4、响应于所述当前识别结果为中间结果，对所述中间结果进行文本补充，得到所述中间结果对应的预测文本；

5、判断是否存在所述预测文本对应的语义理解任务，若否，则生成所述预测文本对应的语义理解任务，得到所述预测文本对应的语义指令；

6、返回获取用户发出的待处理语音对应的当前识别结果，并确定所述当前识别结果是否为中间结果的步骤；

7、响应于所述当前识别结果为最终结果，判断是否存在与所述最终结果相同的预测文本对应的语义理解任务，若是，则将所述预测文本对应的语义指令作为最终指令。

8、可选的，对所述中间结果进行文本补充，得到所述中间结果对应的预测文本，包括：

9、将所述中间结果与所述用户的常用句集合中各常用句文本进行匹配；

10、基于各常用句文本的匹配结果确定所述中间结果对应的预测文本。

11、可选的，将所述中间结果与所述用户的常用句集合中各常用句文本进行匹配，包括：

12、确定所述中间结果与各常用句文本之间的第一相似度；

13、基于各常用句文本的匹配结果确定所述中间结果对应的预测文本，包括：

14、将对应的第一相似度大于预设第一相似阈值的常用句文本确定为候选文本；

15、若所述候选文本的数量为多个，则基于各所述候选文本的使用次数、最近使用时间以及对应的第一相似度，在各所述候选文本中确定所述预测文本。

16、可选的，所述方法还包括：

17、若从所述常用句集合中匹配预测文本失败，则将所述中间结果与通用操作指令集合中各通用指令文本进行匹配；

18、基于各通用指令文本的匹配结果确定所述中间结果对应的预测文本。

19、可选的，所述方法还包括：

20、若从所述通用操作指令集合中匹配预测文本失败，则生成所述中间结果对应的语义理解任务，得到所述中间结果对应的语义指令。

21、可选的，在生成所述中间结果对应的语义理解任务，得到所述语义理解任务对应的语义指令之前，还包括：

22、确定所述中间结果的文本字数；

23、基于所述中间结果的文本字数判断所述中间结果是否满足预设的语义理解进入条件；

24、若是，则执行生成所述中间结果对应的语义理解任务，得到所述中间结果对应的语义指令的步骤。

25、可选的，所述方法还包括：

26、响应于所述当前识别结果为最终结果，判断是否存在与所述最终结果字数相同的中间结果对应的语义理解任务；

27、若是，则将所述中间结果对应的语义指令作为最终指令。

28、可选的，在判断是否存在与所述最终结果相同的预测文本对应的语义理解任务之后，还包括：

29、若不存在与所述最终结果相同的预测文本对应的语义理解任务，则生成所述最终结果对应的语义理解任务，得到所述最终结果对应的语义指令；

30、将所述最终结果对应的语义指令作为最终指令。

31、可选的，所述方法还包括：

32、执行所述最终指令，并在所述最终指令执行完成后，将所述最终指令作为待添加常用句；

33、基于所述待添加常用句更新所述常用句集合。

34、可选的，基于所述待添加常用句更新所述常用句集合，包括：

35、判断所述常用句集合中是否存在所述待添加常用句；

36、若是，则更新所述常用句集合中所述待添加常用句的使用次数与最近使用时间。

37、本技术实施例还提供一种车机语音的指令确定装置，该装置包括：

38、识别模块，用于获取用户发出的待处理语音对应的当前识别结果，并确定所述当前识别结果是否为中间结果；

39、补充模块，用于响应于所述当前识别结果为中间结果，对所述中间结果进行文本补充，得到所述中间结果对应的预测文本；

40、判断模块，用于判断是否存在所述预测文本对应的语义理解任务，若否，则生成所述预测文本对应的语义理解任务，得到所述预测文本对应的语义指令；

41、返回模块，用于返回获取用户发出的待处理语音对应的当前识别结果，并确定所述当前识别结果是否为中间结果的步骤；

42、最终模块，用于响应于所述当前识别结果为最终结果，判断是否存在与所述最终结果相同的预测文本对应的语义理解任务，若是，则将所述预测文本对应的语义指令作为最终指令。

43、本技术实施例还提供一种电子设备，所述电子设备包括：

44、处理器和存储器；

45、所述处理器通过调用所述存储器存储的程序或指令，用于执行本技术任一实施例提供的语音指令确定方法的步骤。

46、本技术实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储程序或指令，所述程序或指令使计算机执行本技术任一实施例提提供的语音指令确定方法的步骤。

47、综上所述，本技术提出一种语音指令确定方法，该方法获取用户发出的待处理语音对应的当前识别结果，确定其是否为中间结果，响应于当前识别结果为中间结果，对中间结果进行文本补充，得到对应的预测文本，并判断是否存在预测文本对应的语义理解任务，若否，则生成预测文本对应的语义理解任务，得到预测文本对应的语义指令，进而返回执行获取当前识别结果并确定其是否为中间结果的步骤，响应于当前识别结果为最终结果，判断是否存在与最终结果相同的预测文本对应的语义理解任务，若是，则将预测文本对应的语义指令作为最终指令，该方法通过对每一个中间结果进行文本补充，能够预测出用户后续可能发起的语音的文本，并通过判断是否存在补充后的预测文本对应的语义理解任务，在不存在的情况下再对预测文本进行语义理解，能够避免对所有中间结果进行语义理解，极大减少了语义理解模块的启动次数，解决了大量中间结果进行语义理解导致的算力飙升的问题，以及，解决了语音指令识别过程中算力占用持续过高的问题，进而避免了语音解析过程中造成的车机卡顿，并且，该方法在获取到最终结果之后，判断是否存在与其一致的预测文本对应的语义理解任务，若存在则直接使用预测文本对应的语义指令作为最终指令，无需再对最终结果进行语义理解，解决了由于等待最终结果返回并进行语义理解导致的指令最终返回长的问题，从而解决了车机指令响应缓慢的问题。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈剑
技术所有人：亿咖通（湖北）技术有限公司
我是此专利的发明人