用于车辆的语音交互方法及系统与流程

文档序号：25345641发布日期：2021-06-08 11:46阅读：来源：国知局

技术特征：
1.一种用于车辆的语音交互方法，包括：采集来自车辆内每个座位的声音信息和视频信息；对所述声音信息进行语音识别，并基于所述语音识别结果对所述声音信息进行第一打分；基于所述语音识别结果对应的基准口型的视频图像，对所述视频信息中的乘客的口型进行第二打分；对所述第一打分结果和所述第二打分结果进行综合判断，确定是否进行语音交互。2.根据权利要求1所述的方法，其中，所述对所述第一打分结果和所述第二打分结果进行综合判断包括：当所述第一打分结果超过第一预设阈值，且第二打分结果超过第二预设阈值时，执行所述语音识别结果对应的语音动作；当所述第一打分结果没有超过第一预设阈值，且第二打分结果没有超过第二预设阈值时，拒绝所述语音识别结果对应的语音动作。3.根据权利要求2所述的方法，其中，所述方法还包括：当所述第一打分结果超过第一预设阈值，第二打分结果没有超过第二预设阈值，或第一打分结果没有超过第一预设阈值，第二打分结果超过第二预设阈值时，进行二次验证；在二次验证中，当所述第一打分结果超过第一预设阈值，第二打分结果没有超过第二预设阈值时，若所述第二打分结果与所述第二预设阈值的误差没有超过预设口型误差时，执行所述语音识别结果对应的语音动作，反之，拒绝所述语音动作；当所述第一打分结果没有超过第一预设阈值，所述第二打分结果超过第二预设阈值时，若所述第一打分结果与所述第一预设阈值的误差没有超过预设语音误差时，执行所述语音识别结果对应的语音动作，反之，拒绝所述语音动作。4.根据权利要求1所述的方法，其中，所述采集来自车辆内每个座位的声音信息和视频信息包括：通过车辆内分布式麦克风阵列采集每个座位的声音信息；通过摄像头采集每个座位的视频信息。5.根据权利要求4所述的方法，其中，所述方法包括：通过分布式麦克风阵列对所述声音信息进行语音前端信号处理，消除所述声音信息中的背景系统音，得到纯净音频；对所述纯净音频进行波束形成，得到每个座位的增强音频，用于增强所述纯净音频中的人声。6.根据权利要求1所述的方法，其中，所述语音交互包括：唤醒词交互、车内操作指令交互。7.一种用于车辆的语音交互系统，包括：信息采集程序模块，用于采集来自车辆内每个座位的声音信息和视频信息；声音打分程序模块，用于对所述声音信息进行语音识别，并基于所述语音识别结果对所述声音信息进行第一打分；视频图像打分程序模块，用于基于所述语音识别结果对应的基准口型的视频图像，对所述视频信息中的乘客的口型进行第二打分；
判断程序模块，用于对所述第一打分结果和所述第二打分结果进行综合判断，确定是否进行语音交互。8.根据权利要求7所述的系统，其中，所述判断程序模块包括：当所述第一打分结果超过第一预设阈值，且第二打分结果超过第二预设阈值时，执行所述语音识别结果对应的语音动作；当所述第一打分结果没有超过第一预设阈值，且第二打分结果没有超过第二预设阈值时，拒绝所述语音识别结果对应的语音动作。9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1
‑
6中任一项所述方法的步骤。10.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1
‑
6中任一项所述方法的步骤。

完整全部详细技术资料下载

当前第2页1 2 3