车辆控制方法、装置、存储介质、控制器及车辆与流程

文档序号：41041147发布日期：2025-02-21 20:18阅读：17来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及车辆控制，尤其涉及一种车辆控制方法、装置、存储介质、控制器及车辆。

背景技术：

1、目前，车载语音系统通常具有长语音识别功能，系统可以在一定时间内持续识别用户的语音并执行对应语音指令的操作对车辆进行控制。

2、然而，当用户与其他人对话时，系统容易将对话内容误判为有效的语音指令，从而误执行语音指令的操作。此外，用户也难以通过语音完全准确地描述出对车辆的控制命令，因此现有对车辆进行语音控制的准确性较低。

技术实现思路

1、本申请实施例提供一种车辆控制方法，能够提升车辆语音控制的精度，以至少部分的解决上述技术问题。

2、为了实现上述目的，根据本申请的第一方面，提供一种车辆控制方法，包括：

3、获取车辆中的语音信息，并对所述语音信息进行语义识别处理确定初始语义指令；

4、对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果；

5、在所述第一检测结果判定所述初始语义指令有效的情况下，对所述目标用户进行视线检测得到第二检测结果，并基于所述第二检测结果对所述初始语义指令进行修正，得到目标语义指令；

6、执行所述目标语义指令对所述车辆进行控制。

7、可选地，所述对所述语音信息进行语义识别处理确定初始语义指令，包括：

8、对所述语音信息进行降噪处理，得到降噪后的第一语音数据；

9、对所述第一语音数据进行端点检测处理，确定包含起始时间点和终止时间点的第二语音数据；

10、将所述第二语音数据输入至第一处理模型对所述第二语音数据进行文字识别，得到文字信息；

11、将所述文字信息输入至第二处理模型进行语义识别，得到所述初始语义指令。

12、可选地，对所述目标用户进行视线检测得到第二检测结果，包括：

13、获取在所述起始时间点前后预设时间范围内所述目标用户的视线信息；

14、基于所述视线信息确定所述目标用户的注视目标，得到所述第二检测结果。

15、可选地，所述基于所述视线信息确定所述目标用户的注视目标，得到所述第二检测结果，包括：

16、当所述目标用户在所述预设时间范围内持续注视同一车机交互对象超过预设时长时，则确定所述目标为有效注视目标；

17、当仅存在一个所述有效注视目标时，将所述有效注视目标确定为所述目标用户的唯一注视目标；

18、当所述目标用户在所述预设时间范围内持续注视的所有车机交互对象均未超过所述预设时长，或者存在多个所述有效注视目标时，则将所述目标用户持续注视时长最大的车机交互对象或有效注视目标确定为所述目标用户的唯一注视目标。

19、可选地，所述方法还包括：

20、当所述目标用户在所述预设时间范围内持续注视不存在所述车机交互对象的同一区域超过所述预设时长时，则判断所述区域是否存在其他用户；

21、若所述区域存在其他用户，则所述第二检测结果为判定所述初始语义指令无效；

22、若所述区域不存在其他用户，则将所述目标用户持续注视时长最大的车机交互对象确定为所述目标用户的唯一注视目标，得到所述第二检测结果。

23、可选地，所述基于所述第二检测结果对所述初始语义指令进行修正，得到目标语义指令，包括：

24、获取基于所述第二检测结果确定的所述唯一注视目标；

25、将所述初始语义指令的控制对象设为所述唯一注视目标，得到用于控制所述唯一注视目标的所述目标语义指令。

26、可选地，所述对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果，包括：

27、通过车载图像采集装置采集包含所述目标用户的图像信息；

28、对所述图像信息进行目标识别，获得所述图像信息中所述目标用户的嘴唇部位图像；

29、根据所述目标用户的嘴唇部位图像检测所述目标用户的图像信息中是否存在唇动信息，得到用于判定所述初始语义指令有效性的第一检测结果。

30、可选地，所述根据所述目标用户的嘴唇部位图像检测所述目标用户的图像信息中是否存在所述唇动信息，得到用于判定所述初始语义指令有效性的第一检测结果，还包括：

31、获取至少两张所述图像信息中的嘴唇部位图像，并根据至少两张所述图像信息中的嘴唇部位图像生成所述第一检测结果。

32、可选地，所述对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果，还包括：

33、若所述目标用户的图像信息中存在所述唇动信息，则所述第一检测结果判定所述初始语义指令有效；

34、若所述目标用户的图像信息中不存在所述唇动信息，则所述第一检测结果判定所述初始语义指令无效。

35、根据本申请的第二方面，提供一种车辆控制装置，包括：

36、语义获取模块，用于获取车辆中的语音信息，并对所述语音信息进行语义识别处理确定初始语义指令；

37、唇动检测模块，用于对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果；

38、语义修正模块，用于在所述第一检测结果判定所述初始语义指令有效的情况下，对所述目标用户进行视线检测得到第二检测结果，并基于所述第二检测结果对所述初始语义指令进行修正，得到目标语义指令；

39、车辆控制模块，用于执行所述目标语义指令对所述车辆进行控制。

40、根据本申请的第三方面，还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上所述方法的步骤。

41、根据本申请的第四方面，还提供一种控制器，其上存储有计算机程序，计算机程序被处理器执行时实现如上所述方法的步骤。

42、根据本申请的第五方面，还提供一种车辆，包括如上所述的控制器。

43、根据本申请的第六方面，还提供一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现如上所述方法的步骤。

44、综上所述，本申请实施例，通过上述技术方案，先采用唇动检测判断语义指令是否为目标用户发出，避免接收和执行其他用户发出的无效语义指令。在确认接收到有效的语义指令后，可以对目标用户进行视线检测，准确地修正语音指令的实际执行目标，不仅能够提升语义指令描述的准确性和完整性，还能够基于准确的语义指令提升对车辆进行语音控制的精度和安全性。

45、本申请的其他特征和优点将在随后的具体实施方式部分予以详细说明。

技术特征：

1.一种车辆控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述语音信息进行语义识别处理确定初始语义指令，包括：

3.根据权利要求2所述的方法，其特征在于，对所述目标用户进行视线检测得到第二检测结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述视线信息确定所述目标用户的注视目标，得到所述第二检测结果，包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述基于所述第二检测结果对所述初始语义指令进行修正，得到目标语义指令，包括：

7.根据权利要求1所述的方法，其特征在于，所述对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据所述目标用户的嘴唇部位图像检测所述目标用户的图像信息中是否存在所述唇动信息，得到用于判定所述初始语义指令有效性的第一检测结果，还包括：

9.根据权利要求7所述的方法，其特征在于，所述对所述车辆中的目标用户进行唇动检测，得到用于判定所述初始语义指令有效性的第一检测结果，还包括：

10.一种车辆控制装置，其特征在于，包括：

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至9中任一项所述方法的步骤。

12.一种控制器，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至9中任一项所述方法的步骤。

13.一种车辆，其特征在于，包括权利要求12所述的控制器。

14.一种计算机程序产品，其特征在于，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现权利要求1至9中任一项所述方法的步骤。

技术总结
本申请涉及一种车辆控制方法、装置、存储介质、控制器及车辆，本申请先获取车辆中的语音信息，并对语音信息进行语义识别处理确定初始语义指令，然后对车辆中的目标用户进行唇动检测，得到用于判定初始语义指令有效性的第一检测结果，在第一检测结果判定初始语义指令有效的情况下，再对目标用户进行视线检测得到第二检测结果，并基于第二检测结果对初始语义指令进行修正，得到目标语义指令，最后执行目标语义指令对车辆进行控制。如此，本申请能够提升对车辆进行语音控制的准确性。

技术研发人员：陈漪,徐铭宇
受保护的技术使用者：比亚迪股份有限公司
技术研发日：
技术公布日：2025/2/20

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈漪,徐铭宇
技术所有人：比亚迪股份有限公司
我是此专利的发明人

上一篇：一种半导体晶圆修边装置及方法与流程
上一篇：一种自驱式旋转喷头的制作方法