一种语音处理装置和电器设备的制作方法

文档序号:18077934发布日期:2019-07-03 04:42阅读:216来源:国知局
一种语音处理装置和电器设备的制作方法

本实用新型实施例涉及音频处理技术领域,尤其涉及一种语音处理装置和电器设备。



背景技术:

物联网和人工智能是新一代信息技术的核心组成部分,随着技术的发展、普及和人民生活水平的提高,越来越多的新型交互和控制方式应用于日常生活中。语音处理技术,在当下的智能家居、智慧医疗、可穿戴和工业现场控制等领域拥有举足轻重的作用,发展前景十分广阔。

现有的语音识别、语音控制产品,大多是在近场环境下,基于单个麦克风做语音信号的拾取,拾音质量不佳。并且只能通过降低电路噪声或麦克风的灵敏度等来改善拾取的语音信号质量,且对外在的噪音无法有效控制。

现有的产品或模组一般都会使用高主频的应用处理器,以提高运算能力,但也间接带来了功耗影响续航的问题,便携式产品则会带来形态端的体积大问题,很难在物联网、智能家居等对功耗要求比较严苛的场景下规模化应用。



技术实现要素:

本实用新型实施例提供一种语音处理装置和电器设备,在减小语音处理装置模块体积的基础上,提升了对用户输入的语音信号的采集精度,并根据该语音信号实现了对电器设备的控制,降低了语音处理装置的功耗。

第一方面,本实用新型实施例提供了一种语音处理装置,该装置包括:

麦克风阵列模块,用于在设定范围内形成录音波束,以采集用户的语音信息;

控制模块,与所述麦克风阵列模块相连,用于对所述语音信息进行预处理,并将完成预处理的语音信息通过网络连接模块上传到服务器;

所述网络连接模块,与所述控制模块相连,用于接收服务器对所述预处理的语音信息识别后的控制指令,并将所述控制指令发送给所述控制模块;

所述控制模块在接收到所述控制指令后,按照所述控制指令向与所述控制模块具有通信连接的电器设备发送协议命令,所述协议命令用于指示所述电器设备执行相应的操作。

进一步的,所述装置还包括:

增益放大器,与所述麦克风阵列模块和所述控制模块相连,用于对所述麦克风阵列模块中的各麦克风所采集的音频信号的幅值进行放大处理,并将放大处理后的各音频信号发送给所述控制模块;

相应的,所述控制模块用于根据各音频信号的幅值控制各麦克风的增益指向性系数保持一致。

进一步的,所述麦克风阵列模块包括设置于同一电路板上的至少两个以线性阵列形式布设的麦克风,各麦克风通过所述电路板与所述控制模块相连。

进一步的,各麦克风之间的距离相等,形成的录音范围为0°到180°,在所述录音范围内包括3个60°的录音波束。

进一步的,所述麦克风阵列模块包括相互独立的四个麦克风,各麦克风均与所述控制模块相连;

所述四个麦克风中的任意一个麦克风,与相邻的两个麦克风满足设定距离范围;

任意相邻两个麦克风形成麦克风阵列单元,每个麦克风阵列单元的录音范围为0°到180°,在所述录音范围内包括3个60°的录音波束。

进一步的,所述设定距离范围为20毫米~120毫米。

进一步的,所述网络连接模块包括:

存储单元,用于存储所述服务器发送的音频文件,以供播放;

控制总线接口,用于与所述控制模块相连。

进一步的,所述语音处理模块还包括:

编解码芯片,与所述控制模块相连,用于接收所述控制模块发送的协议命令,并将所述协议命令以模拟信号的形式输出;

喇叭,与所述编解码芯片相连,用于对所述音频文件进行播放。

进一步的,所述预处理包括滤波、放大和增强处理。

第二方面,本实用新型实施例还提供了一种电器设备,该电器设备包括本实用新型任意实施例所提供的语音处理装置;

所述电器设备用于接收所述控制模块发送的协议命令,并根据所述协议命令执行相应的操作。

本实用新型实施例提供了一种语音处理装置和电器设备,该装置包括:麦克风阵列模块,用于在设定范围内形成录音波束,以采集用户的语音信息;控制模块,与麦克风阵列相连,用于对语音信息进行预处理,并将完成预处理的语音信息通过网络连接模块上传到服务器;网络连接模块,与控制模块相连,用于接收服务器对预处理的语音信息识别后的控制指令,并将控制指令发送给控制模块;控制模块在接收到控制指令后,按照控制指令向与控制模块具有通信连接的电器设备发送协议命令,协议命令用于指示电器设备执行相应的操作。通过采用上述技术方案,解决了单个麦克风拾音质量不佳的问题。通过采用网络连接模块,可将语音信息上传到服务器进行识别,解决了现有应用处理器在识别语音信息时所带来的功耗较大的问题。此外,由于本实用新型实施例的语音处理装置的体积较小,可应用于便携式产品,在物联网、智能家居等对功耗要求较为严苛的场景下能够实现广泛应用。

附图说明

图1为本实用新型实施例一提供的一种语音处理装置的结构框图;

图2a为本实用新型实施例二提供的一种语音处理装置的结构框图;

图2b为本实用新型实施例二提供的一种麦克风线性阵列模块示意图;

图2c为本实用新型实施例二提供的又一种麦克风线性阵列模块示意图。

具体实施方式

下面结合附图和实施例对本实用新型作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本实用新型,而非对本实用新型的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本实用新型相关的部分而非全部结构。

实施例一

图1为本实用新型实施例一提供的一种语音处理装置的结构框图。该装置基于实时操作系统(Real Time Operating System,RTOS)来实现,典型的是可集成到如音箱、电视机或空调等电器设备中,如图1所示,该装置包括:麦克风阵列模块110、控制模块120和网络连接模块130。

其中,麦克风阵列模块110,用于在设定范围内形成录音波束,以采集用户的语音信息;

控制模块120,与麦克风阵列模块110相连,用于对语音信息进行预处理,并将完成预处理的语音信息通过网络连接模块130上传到服务器(图中为示出);

网络连接模块130,与控制模块120相连,用于接收服务器对预处理的语音信息识别后的控制指令,并将控制指令发送给控制模块120;

控制模块120在接收到控制指令后,按照控制指令向与控制模块120具有通信连接的电器设备(图中未示出)发送协议命令,该协议命令用于指示电器设备执行相应的操作。

本实施例中,麦克风阵列模块优选包括至少两个麦克风(图1中示出了四个麦克风),以提高音频采集的精度。各麦克风可以为单向麦克风,也可以为全向麦克风,麦克风的摆放结构可以为横排依次摆放为线性形式,也可以摆放为环形。采用麦克风阵列,可在最大程度上减小阵列口径,以适用于结合要求较为严格的场合。同时也可起到缩小语音处理模块的作用,降低语音处理模块的整体功耗。

示例性的,各麦克风可安装有同一电路板上,按照电路板所规定的摆放形式进行设置,并通过该电路板与控制模块相连。

优选的,各麦克风之间也可独立设置,并分别与控制模块相连。这样设置增加了麦克风摆放的灵活性,使得麦克风的摆放方式并不局限于电路板所设定的摆放方式,例如通过将不同方位的麦克风设置不同的朝向,可增加麦克风的拾音范围。

本实施例中,控制模块可采用DSP(Digital Signal Processing,数字信号处理)芯片。该芯片可采用cortex-M4内核,ARMv7架构,例如,该芯片的型号优选为IA8508。

示例性的,控制模块中包括数字滤波器,通过该滤波器可对麦克风阵列脉宽采集到的语音信息进行预处理,例如去噪、放大和增强等滤波处理,并将完成预处理的语音信息通过网络连接模块上传到服务器。

其中,网络连接模块是本实施例的语音处理装置与服务器进行通信的模块,该网络连接模块可以为无线保真(WIreless-Fidelity,WIFI)模块。网络连接模块与控制模块可使用控制总线接口相连,控制模块可通过预先设定的通信协议,读取网络连接模块中存储的数据。本实施例通过该网络连接模块,可将控制模块处理后的语音信息上传到服务器。

服务器对语音信息进行识别后,可将识别结果,即控制指令发送到网络连接模块,再由网络连接模块将控制指令发送给控制模块。本实施例中,语音识别的操作由服务器来完成,从而能够避免控制模块在识别语音信息时所带来的功耗。

示例性的,服务器所发送的控制指令可以为控制电器设备进行音乐播放、观看电影或控制电器设备进行模式切换等指令。控制模块可按照该控制指令向电器设备发送协议命令。电器设备,用于接收控制模块发送的协议命令,并根据协议命令执行相应的操作。例如,如果控制指令为播放音乐,则控制模块可控制电器设备的音乐播放器启动,以对音频文件进行播放。如果控制指令为播放视频文件,此时,如果当前显示屏处于黑屏状态,则控制模块需先点亮显示屏,具体可将控制显示屏启动的硬件模块的开关引脚的电平设置为高电平,以点亮显示屏。在显示屏点亮后,可对视频文件进行播放。

优选的,服务器所发送的控制指令中还可包含音频或视频文件的链接。如果本实施例提供的语音处理装置已集成到电器设备中,当控制模块检测到在电器设备本地并未存储用户语音信息中的音频或视频文件,此时,控制模块可按照该链接对音频或视频文件进行下载,并可同步控制电器设备进行音频或视频文件的播放。

示例性的,如果语音处理装置还未集成到任何电器设备中,控制模块也可按照该链接下载音频文件,如果本实施例的语音处理装置设置有扬声器模块,则本实施例提供的语音处理装置可作为音箱。具体的,在下载音频文件时,控制芯片可向编解码芯片发送协议命令,以使编解码芯片将音频文件转换为模拟信号输出到扬声器模块,并通过扬声器模块对音频文件同步进行播放。

本实用新型实施例提供了一种语音处理装置,该装置包括:麦克风阵列模块,用于在设定范围内形成录音波束,以采集用户的语音信息;控制模块,与麦克风阵列相连,用于对语音信息进行预处理,并将完成预处理的语音信息通过网络连接模块上传到服务器;网络连接模块,与控制模块相连,用于接收服务器对预处理的语音信息识别后的控制指令,并将控制指令发送给控制模块;控制模块在接收到控制指令后,按照控制指令向与控制模块具有通信连接的电器设备发送协议命令,协议命令用于指示电器设备执行相应的操作。通过采用上述技术方案,解决了单个麦克风拾音质量不佳的问题。并通过采用网络连接模块,将语音信息上传到服务器进行识别,解决了现有应用处理器在识别语音信息时所带来的功耗大的问题。此外,由于本实用新型实施例的语音处理装置的体积较小,可应用于便携式产品,在物联网、智能家居等对功耗要求较为严苛的场景下能够实现广泛应用。

实施例二

图2a为本实用新型实施例二提供的一种语音处理装置的结构框图。本实施例在上述实施例的基础上进行了优化,增加了用于对麦克风增益指向性系数进行调节的增益放大器,并介绍了麦克风阵列的不同摆放方式。其中与上述实施例相同或相应的术语的解释在此不再赘述。参见图2a,本实施例提供的语音处理装置包括:麦克风阵列模块210、控制模块220、网络连接模块230和增益放大器240。

其中,增益放大器240,与麦克风阵列模块210和控制模块220相连,用于对麦克风阵列模块210中的各麦克风所采集的音频信号的幅值进行放大处理,并将放大处理后的各音频信号发送给控制模块220;相应的,控制模块220可根据音频信号的幅值确定该音频信号的增益指向性系数,并控制各麦克风的增益指向性系数保持一致。其中,麦克风的增益指向性系数为麦克风阵列主响应轴检测到的声源信号和需要屏蔽的各种噪声与回声信号比值。本实施例通过控制模块来调整各麦克风的增益指向性系数保持一致,可保持麦克风阵列增益处于平衡状态,有助于后续对语音信息的预处理和识别。

示例性的,控制模块220包括数字滤波器221,用于对增益放大器所发送的各音频信号进行滤波处理。控制模块可对滤波处理后的各麦克风所对应的音频信号的当前增益指向性系数与预设增益指向性系数进行比较,如果当前增益指向性系数与预设增益指向性系数相同,则无需调节该音频信号的增益指向性系数;如果当前增益指向性系数与预设增益指向性系数不同,则将预设增益指向性系数对应的预设幅值经过数模转换后发送给增益放大器,该增益放大器按照预设幅值来调整该麦克风的当前增益指向性系数。

示例性的,如果当前增益指向性系数与预设增益指向性系数不同,控制模块还可产生PWM(Pulse Width Modulation,脉冲宽度调制)信号,通过调整该信号的频率和占空比来调整麦克风的当前增益指向性系数。

本实施例中,麦克风阵列模块所述麦克风阵列模块包括设置于同一电路板上的至少两个以线性阵列形式布设的麦克风,各麦克风可通过电路板与控制模块相连。相邻麦克风之间的距离相等,形成的录音范围为0°到180°,在录音范围内包括3个60°的录音波束。

具体的,图2b为本实用新型实施例二提供的一种麦克风线性阵列模块示意图。图2b中示出了四个麦克风,这四个麦克风可并列设置在同一电路板上,通过该电路板与控制模块相连。相邻麦克风之间的距离优选为35厘米,在在0°~180°范围内,四麦线性阵列面向用户,能够形成3个录音波束,每个波束拥有60°的录音范围。当用户到麦克风的距离达到3~5米时,仍能保持不错的拾音效果。

需要说明的是,上述四个麦克风并不局限于设置在同一块电路板上,也可独立设置,并分别与控制模块相连。

还需要说明的是,麦克风的摆放形式也不局限于如图2b所示的并列直线摆放的线性形式,图2c为本实用新型实施例二提供的又一种麦克风线性阵列模块示意图。如图2c所示,麦克风阵列模块包括相互独立的四个麦克风。对于四个麦克风中的任意一个麦克风,相邻设置有两个麦克风,且相邻麦克风之间的距离满足设定距离范围。其中,设定距离范围为20毫米~120毫米。

如图2c所示,任意相邻两个麦克风形成麦克风阵列单元,每个麦克风阵列单元的录音范围为0°到180°,在录音范围内包括3个60°的录音波束。这样设置可使得麦克风朝向不同方位,实现全方位360°精确拾音。

进一步的,如图2a所示,本实施例中,网络连接模块可包括存储单元231,可用于存储服务器发送的音、视频文件,或者也可存储服务器训练好的声学模型。

进一步的,本实施例中,语音处理装置还可包括编解码芯片250,与控制模块220相连,用于接收控制模块发送的协议命令,并将音频文件以模拟信号的形式输出。

进一步的,语音处理装置还包括喇叭260,与编解码芯片250相连,用于根据协议命令对音频文件进行播放。通过将本实施例中的语音处理模块集成到本本身不具备喇叭的电器设备中,例如空调,台灯等,可使得该电器设备具有语音识别和音频播放的功能,完成与用户的语音交互,提升用户体验。

本实施例在上述实施例的基础上,对麦克风阵列的摆放形式进行了优化,使得麦克风阵列中的麦克风具有不同的朝向,实现全方位360°精确拾音。此外,通过在语音处理装置中增加喇叭,可使得该语音处理装置具有音频播放功能,将该语音处理装置应用于本身不具备播放功能的电器设备中,可实现电器设备与用户的语音交互,提升用户体验。

注意,上述仅为本实用新型的较佳实施例及所运用技术原理。本领域技术人员会理解,本实用新型不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本实用新型的保护范围。因此,虽然通过以上实施例对本实用新型进行了较为详细的说明,但是本实用新型不仅仅限于以上实施例,在不脱离本实用新型构思的情况下,还可以包括更多其他等效实施例,而本实用新型的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1