车载人机交互方法、系统及计算机可读存储介质与流程

文档序号：18793019发布日期：2019-09-29 19:08阅读：261来源：国知局

本发明涉及智能控制技术领域，尤其涉及一种车载人机交互方法、系统及计算机可读存储介质。

背景技术：

传统的车机功能主要包括广播(包括fm/dab等)、蓝牙(bluetooth,简称bt)音乐、导航、本地音乐等应用和功能，当前车机越来越普及，逐渐的从功能机跨越到智能机时代(可以安装各种app，包括导航、购物等在线应用，音乐、故事、新闻等多媒体等在线内容)，车机更类似一部车载的智能手机。

随着智能语音技术的发展与应用，很多车机开始采用智能语音交互。在传统的驾驶场景下用户专注于驾驶，语音交互就成为刚需。即使在无人驾驶时代，语音也是一种最重要的交互方式。因此行业中出现了车载语音助理的产品(外置车载配件或者内置语音模组)，这种语音助理通过蓝牙连接手机，借助手机联网能力获取语音相关的服务(如音乐、新闻、在线导航，智能家居远程控制等)。

当传统车机上使用车载语音助理产品时，需要手动切换蓝牙通道。这是因为传统车机的广播通道与蓝牙媒体通道(a2dp)、车机内部其他的音频通道等是并列存在的，比如用户正在听广播，用户为了使用车载语音助理查询天气，就需要手动切换广播通道到蓝牙通道，使用后再手动切换回广播。这样的用户操作繁琐，不易上手，会带来各种售后问题。如果语音的优先级更高，就需要将a2dp蓝牙媒体通道优先级提高，超过广播，比如有的app使用了免提电话通道(hfp)进行语音交互，就会出现广播频频被外部(包括并不限于手机、pad、pod、播放器等终端)的各种app或者短信等提示音打断，用户还需要未各个app设置免打扰或者静音，这种体验更加繁琐。

因此如果希望在双向通道(包括并不限于蓝牙、wi-fi、其他无线网络-如2g/3g/4g/5g等移动通信或者usb等有线信道)中增加语音交互，就涉及到业务逻辑的优化问题。如何改进车载语音交互的自动化体验，为车载语音交互增加一种临时的高优先级业务支持能力，进而扩展到车载人机交互的各种新的交互方式(比如刷脸、手势等)，就成了本发明的重要任务。

技术实现要素：

本发明提出了一种车载人机交互方法、系统及计算机可读存储介质，旨在解决人机交互的便捷性，改善用户的人机交互体验。

为实现上述目的，本发明提供一种车载人机交互方法，所述车载人机交互方法应用于车载人机交互系统，所述车载人机交互系统包括：前端处理模块、人机交互逻辑优化模块，所述车载人机交互方法包括以下步骤：

前端处理模块进行人机交互唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述人机交互逻辑优化模块输出第一预设信号给车机主板，由所述车机主板产生通道切换行为；

所述人机交互逻辑优化模块记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；

所述人机交互逻辑优化模块根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持交互通道。

其中，所述人机交互为非接触式人机交互，至少包括：语音交互、图像交互、视频交互、手势交互。

其中，所述人机交互为语音交互，所述前端处理模块包括：麦克风或麦克风阵列、前端降噪模块；

所述车载人机交互系统还包括：音源管理模块；

所述前端处理模块进行人机交互唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块的步骤包括：

所述前端降噪模块通过所述麦克风或麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块。

其中，所述音源管理模块还连接蓝牙、wifi、4g/5g移动网络音频、fm/dab广播、usb和本地音频接口。

其中，所述前端降噪模块通过所述麦克风或麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块的步骤之后还包括：

对所述语音唤醒指令的优先级进行识别，若所述语音唤醒指令的优先级高于预设级别，则执行步骤：所述人机交互逻辑优化模块输出第一预设信号给车机主板，由所述车机主板产生通道切换行为。

其中，所述前端拾音降噪模块通过所述麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块的步骤之前还包括：

通过默认的音频通道播放广播或本地音频。

本发明还提出一种车载人机交互系统，所述车载人机交互系统包括：前端处理模块、人机交互逻辑优化模块，其中：

所述前端处理模块，用于进行人机交互唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述人机交互逻辑优化模块，用于输出第一预设信号给车机主板，由所述车机主板产生切换行为；以及记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持交互通道。

其中，所述人机交互为语音交互，所述前端处理模块包括：麦克风或者麦克风阵列、前端降噪模块；所述车载人机交互系统还包括：音源管理模块；

所述前端降噪模块，还用于通过所述麦克风或麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述音源管理模块，用于对音源通道进行管理。

本发明还提出一种车载人机交互系统，所述车载人机交互系统包括：麦克风或麦克风阵列、前端降噪模块、音源管理模块、人机交互逻辑优化模块、存储器、处理器，以及存储在所述存储器上的计算机程序，所述计算机程序被所述处理器调用时执行如上所述的车载人机交互方法的步骤。

本发明还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器调用时执行如上所述的车载人机交互方法的步骤。

本发明的有益效果是：本发明引入临时的高优先级的业务优化，模拟用户的主动通道切换行为，给用户的感觉就像临时发起了一个自动的语音交互，说完自动断开，完全不用额外的学习和操作。该方案解决了人-机交互(包括语音、视频、手势等各种非接触交互)的便捷性，改善了用户的人机交互体验。

相比现有技术，本发明既能保持车机原有的广播/媒体的使用体验，又能增加一种便捷的人机交互，在人机交互结束后立即恢复到原来的业务比如广播或者本地音频等，改善了原来传统车机增加语音助理需要手动切换通道的问题。

附图说明

图1是本发明车载人机交互方法实施例的流程示意图；

图2是本发明实施例涉及的车载人机交互系统架构示意图；

图3是本发明车载人机交互方法实施例的细化流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

目前传统车机上，通常会有广播、媒体、导航等功能，如果用户在听广播，就无法进行语音交互；如果要使用语音交互，就需要用户在使用前切换(比如手动切换到蓝牙、或者使用按键等)，使用后再手动切换回广播。这样不仅繁琐，用户教育成本也高，会带来各种售后投诉问题。

本发明实施例提出的方案重点要解决的是人-机交互(包括语音、视频、手势等各种非接触交互)的即时性和自动化体验，引入临时的高优先级的业务申请，模拟用户的主动切换行为，从而实现用户意图的识别、通道的申请和自动切换，业务完成后通道的自动释放。给用户的感觉就像临时发起了一个自动的语音交互，然后说完自动断开，不需要额外学习和操作。

本发明实施例方案涉及车载人机交互，该人机交互包括任何的非接触式人机交互，除了语音，也包括视频交互、手势交互等方式，都可以借鉴这种临时性的高优先级任务申请和释放。

本发明实施例车载人机交互系统的产品形态可以是usb外设、车机主板上的pcb、车载支架、方向盘遥控器等。

所述车载人机交互系统包括：前端处理模块、人机交互逻辑优化模块，所述车载人机交互方法主要包括以下步骤：

前端处理模块进行人机交互唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述人机交互逻辑优化模块输出第一预设信号给车机主板，由所述车机主板产生通道切换行为；

所述人机交互逻辑优化模块记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；

其中，第一预设信号和第二预设信号包括并不限于usb、i2c、串口、i/o等有线或者无线信号，也可以是某种接口信号，该接口信号可以是i/o口的高低电平、usb、串口信号、spi、i2c等各种形式的接口信号。具体举例而言，第一预设信号可以是某种高电平信号，第二预设信号可以是某种低电平信号。

以下各实施例以语音交互进行举例。

具体地，请参照图1，本发明提出一种车载人机交互方法，所述车载人机交互方法应用于车载人机交互系统，所述车载人机交互系统包括：麦克风或麦克风阵列、前端降噪模块、人机交互逻辑优化模块，所述车载人机交互方法包括以下步骤：

步骤s1，前端降噪模块通过所述麦克风或麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块；

本实施例方案涉及对车辆上智能终端、车机等的智能控制，主要涉及人机交互的控制，该人机交互包括但不限于语音、视频、手势等各种非接触交互。

本实施例方案应用于车载人机交互系统，该车载人机交互系统可以集成在车机或其他车载智能终端上，本实施例以车机进行举例。

如图2所示，该车载人机交互系统架构包括：麦克风或麦克风阵列、前端降噪模块、音源管理模块、人机交互逻辑优化模块(图中以语音交互逻辑优化模块示意)，音源管理模块连接有车载蓝牙、wifi、4g/5g等移动网络音频、fm/dab等广播、usb和本地音频接口。车载人机交互系统与车机的车机主板通讯连接，车机主板连接有按键与指示模块，以及专用网络连接模块。本发明实施例的核心在于人机交互逻辑优化模块。

更为具体地，作为一种实施方式，在用户需要通过车机进行语音交互时，前端降噪模块通过所述麦克风或麦克风阵列进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块。

作为另一种实施方式，车机可以在用户进行人机交互之前，通过默认的音频通道播放广播或本地音频。同时，前端降噪模块通过所述麦克风或麦克风阵列进行语音唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块。

步骤s2，所述人机交互逻辑优化模块输出第一预设信号给车机主板，由所述车机主板产生通道切换行为；

人机交互逻辑优化模块在接收到前端降噪模块的通知后，输出第一预设信号给车机主板，由所述车机主板产生模拟按键通道切换行为或直接功能切换行为。

其中，第一预设信号包括并不限于usb、i2c、串口、i/o等有线或者无线信号，也可以是某种接口信号，该接口信号可以是i/o口的高低电平、usb、串口信号、spi、i2c等各种形式的接口信号。具体举例而言，第一预设信号可以是某种高电平信号。

步骤s3，人机交互逻辑优化模块记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；

同时，人机交互逻辑优化模块记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态。

步骤s4，人机交互逻辑优化模块根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持交互通道。

人机交互逻辑优化模块根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持某种信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)。

本实施例的细化流程可以参照图3所示。

进一步地，所述前端降噪模块通过所述麦克风或麦克风阵列进行录音，然后将录音信号进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块的步骤之后还包括：

对所述语音唤醒指令的优先级进行识别，若所述语音唤醒指令的优先级高于预设级别，则执行步骤：所述人机交互逻辑优化模块输出第一预设信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)给车机主板，由所述车机主板产生切换行为。

本发明的有益效果是：本发明引入临时的高优先级的业务申请，模拟用户的主动切换行为，从而实现用户意图的识别、通道的申请和自动切换，业务完成后通道的自动释放，给用户的感觉就像临时发起了一个自动的语音交互，然后说完自动断开一样，完全不用额外的学习和操作。该方案解决了人-机交互(包括语音、视频、手势等各种非接触交互)的即时性，改善了用户的人机交互体验。

相比现有技术，本发明既能保持车机原有的广播/媒体/语音的使用体验，又能在用户唤醒语音交互时提供即时的优先语音交互，在语音交互结束后立即恢复到原来的业务比如广播或者本地audio音频等，不会出现切换通道后无法恢复，需要手动切换的问题。

此外，本发明实施例还提出一种车载人机交互系统，所述车载人机交互系统包括：前端处理模块、人机交互逻辑优化模块，其中：

所述前端处理模块，用于进行人机交互唤醒检测，在检测到人机交互唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述人机交互逻辑优化模块，用于输出第一预设信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)给车机主板，由所述车机主板产生通道切换行为；以及记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持交互通道。

以语音交互为例，参照图2所示，所述车载人机交互系统包括：麦克风或者麦克风阵列、前端降噪模块、人机交互逻辑优化模块，其中：

所述前端降噪模块，用于通过所述麦克风或者麦克风阵列进行语音唤醒检测，在检测到语音唤醒指令或行为时，通知所述人机交互逻辑优化模块；

所述人机交互逻辑优化模块，用于输出第一预设信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)给车机主板，由所述车机主板产生切换行为；以及记录当前音频通道，切换到交互通道，从本地或网络获取当前的人机交互状态；根据当前的人机交互状态判断人机交互是否结束；若人机交互结束，则输出第二预设信号给车机主板，并释放所述交互通道，恢复原来的音频通道；否则，维持第一预设信号(包括并不限于usb、i2c、串口、i/o等有线或者无线信号)。

进一步地，人机交互系统还包括：音源管理模块；

所述音源管理模块，用于对音源通道进行管理。

本实施例的原理请参照上述方法实施例，在此不再赘述。

此外，本发明实施例还提出一种车载人机交互系统，所述车载人机交互系统包括：麦克风或麦克风阵列、前端降噪模块、音源管理模块、人机交互逻辑优化模块、存储器、处理器，以及存储在所述存储器上的计算机程序，所述计算机程序被所述处理器调用时执行如上所述的车载人机交互方法的步骤。

此外，本发明实施例一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器调用时执行如上所述的车载人机交互方法的步骤。

本实施例的原理请参照上述方法实施例，在此不再赘述。

本发明方案中，通过语音唤醒激活，模拟人工按键切换，发出通道申请，保存现场并在语音交互后释放恢复现场；将语音唤醒激活和语音服务连接状态用于信道切换；提供一种人机交互体验：任何非接触式的人机交互，如果交互的业务与原有的业务的优先级有冲突，都可以使用这种临时性高优先级的任务申请和资源释放，达到自动化无缝切换。

相比现有技术，本发明方案可以由用户主动发起语音请求，从唤醒到交互到完成，这些流程都可以自动完成，并能够自动申请和释放音频通道，不需要用户手动干预和操作，极大的提升用户体验。

如前所述，本发明方案可以扩展泛化到任何的非接触式人机交互，也包括视频交互、手势交互灯方式，都可以借鉴这种临时性的高优先级任务申请和释放，改善用户的人机交互体验。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴飞;宋少鹏;叶俊民;赖小强;李海进;凌瑞端
技术所有人：深圳米唐科技有限公司
我是此专利的发明人

上一篇：一种常压换合金刀具密封装置维修更换工装及使用方法与流程
上一篇：一种橡胶护舷性能测试装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。