声音信号处理方法及设备的制作方法
【专利摘要】本发明实施例提供一种声音信号处理方法及设备,方法包括:接收用户输入的用于指示目标方向的方向指示信息;根据方向指示信息,将声音信号处理阵列的波束指向调整至与目标方向相对应的状态。本发明实施例提供的声音信号处理方法及设备,根据用户提供的用于指示目标方向的方向指示信息,对声音信号处理阵列的波束指向进行调整,从而在嘈杂环境下仍可以对声音信号进行准确的处理,进而对所处理的声音信号起到增强的效果。
【专利说明】声音信号处理方法及设备
【技术领域】
[0001] 本发明实施例涉及通信技术,尤其涉及一种声音信号处理方法及设备。
【背景技术】
[0002] 随着手机或电脑等各种终端设备在会议通讯或者声音收录等场景下的普遍应用, 在终端设备上配置麦克风阵列进行声音信号的拾取,或在终端设备上配置扬声器阵列进行 声音信号的放送,已经成为研究与应用的热点。
[0003] 以终端设备中配置的麦克风阵列为例,终端设备可以根据麦克风阵列中的各个麦 克风采集到的声音信号的强弱和各麦克风设置位置等因素,进行声源空间信息的计算,再 通过声源的空间信息估计出主声源所在位置,并针对主声源位置进行自适应调整,调整采 集指向以采集主声源的声音波束。最终只保留或增强主声源的声音信号,从而使主声源的 声音能够更加清晰地被采集或传送。
[0004] 现有技术中,如果在嘈杂环境下使用终端设备采集声音,终端设备无法准确估计 主声源所在位置;如果使用终端设备放送声音,终端设备无法获知需要将声音信号主要放 送至哪个方向。所以终端设备无法对声音信号进行准确的处理,无法实现对所处理的声音 信号在主声源方向或主要放送方向上的增强。
【发明内容】
[0005] 本发明实施例提供一种声音信号处理方法及设备。
[0006] 第一方面,本发明实施例提供的一种声音信号处理方法,包括:
[0007] 接收用户输入的用于指示目标方向的方向指示信息;根据所述方向指示信息,将 声音信号处理阵列的波束指向调整至与所述目标方向相对应的状态。
[0008] 在第一方面的第一种可能的实现方式中,所述根据所述方向指示信息,将声音信 号处理阵列的波束指向调整至与所述目标方向相对应的状态,包括:根据所述方向指示信 息,确定声音信号处理阵列中各个声音信号处理单兀所对应的信号延时;根据各个所述信 号延时,对与所述信号延时相对应的声音信号处理单兀需要处理的声音信号进行延时处理 以获取经过延时处理的声音信号,并将所述经延时处理的所述声音信号传输至波束形成器 以将所述声音信号处理阵列的波束指向调整至与所述目标方向相对应的状态。
[0009] 根据第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式 中,根据所述方向指不信息,确定声音信号处理阵列中各个声音信号处理单兀所对应的信 号延时具体包括:根据所述方向指示信息通过以下公式获取声音信号处理阵列中各个声音 处理单元η对应的信号延时τ η(β):
[0010] ^(/g)=dnC〇S^xfs C
[0011] 其中,4代表呈线形排列的所述声音信号处理阵列中包含的声音信号处理单元之 一的声音信号处理单兀η与声音信号处理阵列中心之间的距离,β代表由所述声音信号处 理阵列中心指向所述方向指示信息所指示的所述目标方向与一参考坐标之间的近似夹角, C代表声速,fs代表声音信号处理阵列的声音信号采样频率;对应地,所述根据各个所述信 号延时,对与所述信号延时相对应的声音信号处理单兀需要处理的声音信号进行延时处理 以获取经过延时处理的声音信号具体包括:根据所述声音信号处理单元η对应的信号延时 τ η(β )对所述声音信号处理单元η所采集的声音信号做延时处理,经延时处理后的声音信 号可以表达为:
[0012]
【权利要求】
1. 一种声音信号处理方法,其特征在于,包括: 接收用户输入的用于指示目标方向的方向指示信息; 根据所述方向指示信息,将声音信号处理阵列的波束指向调整至与所述目标方向相对 应的状态。
2. 根据权利要求1所述的方法,其特征在于,所述根据所述方向指示信息,将声音信号 处理阵列的波束指向调整至与所述目标方向相对应的状态,包括: 根据所述方向指不信息,确定声音信号处理阵列中各个声音信号处理单兀所对应的信 号延时; 根据各个所述信号延时,对与所述信号延时相对应的声音信号处理单兀需要处理的声 音信号进行延时处理以获取经过延时处理的声音信号,并将所述经延时处理的所述声音信 号传输至波束形成器以将所述声音信号处理阵列的波束指向调整至与所述目标方向相对 应的状态。
3. 根据权利要求2所述的方法,其特征在于,根据所述方向指示信息,确定声音信号处 理阵列中各个声音信号处理单元所对应的信号延时具体包括: 根据所述方向指示信息通过以下公式获取声音信号处理阵列中各个声音处理单元η 对应的信号延时τη(β):
其中,dn代表呈线形排列的所述声音信号处理阵列中包含的声音信号处理单元之一的 声音信号处理单元η与声音信号处理阵列中心之间的距离,β代表由所述声音信号处理阵 列中心指向所述方向指示信息所指示的所述目标方向与一参考坐标之间的近似夹角,c代 表声速,f s代表声音信号处理阵列的声音信号米样频率; 对应地,所述根据各个所述信号延时,对与所述信号延时相对应的声音信号处理单元 需要处理的声音信号进行延时处理以获取经过延时处理的声音信号具体包括: 根据所述声音信号处理单元η对应的信号延时τη(β)对所述声音信号处理单元n所 米集的声音信号做延时处理,经延时处理后的声音信号可以表达为:
?η 为将由声音信号处理单元η采集到的声音信号进行时频变化后得到的频域 信号,ω代表频率索引。
4. 根据权利要求2所述的方法,其特征在于,根据所述方向指示信息,确定声音信号处 理阵列中各个声音信号处理单元所对应的信号延时具体包括: 根据所述方向指示信息通过以下公式获取声音信号处理阵列中各个声音处理单元对 应的信号延时的集合Τ或V :
其中,TM代表所述声音处理阵列中第Μ个声音处理单兀对应的信号延时,rm代表在所述 方向指示信息所指示的目标方向上的某一目标A至所述第m个声音处理单元的距离,fa代 表所述声音处理阵列的声音信号米样频率为,c代表声速; 所述rm通过以下公式获取:
其中,ra代表所述在所述方向指示信息所指示的目标方向上的某一目标A与一参考坐 标的坐标原点之间的距离,所述参考坐标的坐标原点为呈环形排列的所述声音处理阵列的 圆心,b代表所述呈环形均匀排列的所述声音处理阵列的半径,a m代表所述某一目标A在所 述声音处理阵列所在平面上的投影A'与所述坐标原点之间的连线与所述第m个声音处理 单元至所述坐标原点之间的连线之间的夹角; 所述am通过以下公式获取:
其中,叫代表所述某一目标A在所述声音处理阵列所在平面上的投影A'与所述坐标原 点之间的连线与所述第1个声音处理单元至所述坐标原点之间的连线之间的夹角; 对应地,所述根据各个所述信号延时,对与所述信号延时相对应的声音信号处理单元 需要处理的声音信号进行延时处理以获取经过延时处理的声音信号具体包括: 根据所述信号延时集合T或Ψ中的信号延时TM或ΨΜ将对应于所述声音信号处理单 兀Μ所米集的声音信号做延时处理,经延时处理后的声音信号可以表达为:
为将由声音信号处理单元η采集到的声音信号进行时频变化后得到的频域 信号,ω代表频率索引。
5.根据权利要求2至4任意一项所述的方法,其特征在于,所述声音信号处理阵列包括 声音信号采集阵列,所述声音信号采集阵列包括多个声音信号采集单元;对应地, 所述根据所述方向指示信息,确定声音信号处理阵列中各个声音信号处理单元所对应 的信号延时,包括:根据所述方向指示信息,确定声音信号采集阵列中各个声音信号采集单 元所对应的信号延时;对应地, 所述根据各个信号延时,对与所述信号延时对应的声音信号处理单兀需要处理的声音 信号进行延时处理,包括:根据各信号延时,对与所述信号延时对应的声音信号采集单元采 集的声音信号进行延时处理; 或者, 所述声音信号处理阵列包括声音信号发送阵列,所述声音信号发送阵列包括多个声音 信号发送单元;对应地, 所述根据所述方向指示信息,确定声音信号处理阵列中各个声音信号处理单元的所对 应的信号延时,包括:根据所述方向指示信息,确定声音信号发送阵列中各个声音信号发送 单元所对应的信号延时;对应地, 所述根据各个信号延时,对与所述信号延时对应的声音信号处理单兀需要处理的声音 信号进行延时处理,包括:根据各信号延时,对与所述信号延时对应的声音信号发送单兀发 送的声音信号进行延时处理。
6. 根据权利要求1至4任意一项所述的方法,其特征在于,所述接收用户输入的用于指 示目标方向的方向指示信息之前,还包括: 接收用户输入的控制模式显示指令; 根据所述控制模式显示指令,获取并显示可供选择的多种控制模式,所述多种控制模 式中的每一种控制模式对应至少一种方向指不信息输入方式; 接收用户发送的针对所述多种控制模式的控制模式选择指令,并开启用户所选择的控 制丰吴式; 所述接收用户输入的用于指示目标方向的方向指示信息,包括: 接收用户通过与所选择的控制模式对应的方向指示信息输入方式所输入的用于指示 目标方向的所述方向指示信息。
7. 根据权利要求6所述的方法,其特征在于,所述多种控制模式包括用户自主控制模 式,所述用户自主控制模式为允许用户自主输入所述方向指示信息的模式;若所述用户所 选择的控制模式为用户自主控制模式, 所述接收用户通过所选择的控制模式对应的方向指示信息输入方式所输入的用于指 示目标方向的所述方向指示信息,包括: 接收所述用户通过语音输入方式所输入的语音信号,解析所述语音信号以获取所述语 音信号中包含的方向指示信息; 或者, 接收所述用户以触摸输入方式在触摸屏上滑动输入的轨迹信息,解析所述轨迹信息所 指示的目标方向,并生成用以指示所述目标方向的方向指示信息; 或者, 接收所述用户通过投影屏幕投射输入的手势图像信息,解析所述手势图像信息所指示 的目标方向,并生成用以指示所述目标方向的方向指示信息; 或者, 接收所述用户通过与所选择的控制模式对应的指令输入终端装置输入的用于指示目 标方向的控制指令,所述用于指示目标方向的控制指令包括所述用于指示目标方向的方向 指示信息; 或者, 接收所述用户通过与所选择的控制模式对应的键盘滚轮输入的滚动信息,所述用滚动 信息包括所述用于指示目标方向的方向指示信息。
8. 根据权利要求7所述的方法,其特征在于,若所述用户选择的控制模式所对应的方 式指不信息输入方式为触摸输入方式,其中: 接收所述用户以触摸输入方式在触摸屏上滑动输入的轨迹信息,包括: 接收所述用户在触摸屏上滑动输入的一条轨迹信息; 对应,所述解析所述轨迹信息所指示的目标方向,并生成用以指示所述目标方向的方 向指示信息包括: 根据所述一条轨迹信息所包含的所述滑动输入在所述触摸屏上的起点位置信息和终 点位置信息,确定所述滑动输入所指示的所述目标方向,并生成用以指示所述目标方向的 方向指示信息; 或者, 接收所述用户以触摸输入方式在触摸屏上滑动输入的轨迹信息,包括: 接收所述用户在触摸屏上滑动输入的两条轨迹信息; 对应,所述解析所述轨迹信息所指示的目标方向,并生成用以指示所述目标方向的方 向指示信息,包括: 根据所述两条轨迹信息所包含的所述滑动输入在所述触摸屏上的起点位置信息和终 点位置信息,分别确定两条轨迹的延伸方向;根据所述两条轨迹的延伸方向所限定的角度 范围,确定所述滑动输入所指示的目标方向,并生成用以指示所述目标方向的方向指示信 息。
9. 根据权利要求8所述的方法,其特征在于,所述根据所述两条轨迹的延伸方向所限 定的角度范围,确定所述滑动输入所指示的目标方向,包括 : 根据所述两条轨迹的延伸方向确定所述两条轨迹所构成夹角的角平分线延伸的方 向; 根据所述角平分线延伸的方向,确定所述滑动输入所指示的目标方向处于第一角度范 围中,所述第一角度范围以所述角平分线延伸方向为中心,以所述两条轨迹所构成夹角的 角度的一半为王辦览度。
10. 根据权利要求1至9任意一项所述的方法,其特征在于,在所述接收用户输入的用 于指示目标方向的方向指示信息之前,还包括: 感测所述声音信号处理阵列的朝向发生改变,并确定朝向变化量; 根据所述朝向变化量以及所述声音信号处理阵列的朝向改变之前的目标方向,确定所 述声音信号处理阵列的朝向改变之后的目标方向; 提示用户输入用于指示所述朝向改变之后的目标方向的所述方向指示信息。
11. 根据权利要求6所述的方法,其特征在于,所述用户所选择的控制模式为扫描模 式,所述扫描模式为通过扫描提示用户输入所述方向指示信息的模式; 所述接收用户通过所选择的控制模式对应的方向指示信息输入方式所输入的所述方 向指示信息之前,还包括: 通过扫描采集至少两个方向上的声音信号; 分析所述声音信号的能量,确定能量最大的声音信号的声源方向; 提示用户根据所述声源方向输入所述方向指示信息。
12. -种声音信号处理方法,其特征在于,包括: 根据主声源方向确定声音信号处理阵列的接收方向,根据所述接收方向及所述声音信 号处理阵列的波束指向确定所述处理阵列的目标方向,所述目标方向指所述处理阵列的接 收方向与主声源方向一致时所述处理阵列的朝向; 确定所述声音信号处理阵列的朝向与所述目标方向之间的夹角; 提示用户根据所述夹角调整所述声音信号处理阵列的朝向,以使所述声音信号处理阵 列的接收方向与所述主声源方向一致。
13. -种声音信号处理设备,其特征在于,包括: 接收模块,用于接收用户输入的用于指示目标方向的方向指示信息; 调整模块,用于根据所述方向指示信息,将声音信号处理阵列的波束指向调整至与所 述目标方向相对应的状态。
14. 根据权利要求13所述的设备,其特征在于,所述调整模块具体用于: 根据所述方向指不信息,确定声音信号处理阵列中各个声音信号处理单兀所对应的信 号延时; 根据各个所述信号延时,对与所述信号延时相对应的声音信号处理单兀需要处理的声 音信号进行延时处理以获取经过延时处理的声音信号,并将所述经延时处理的所述声音信 号传输至波束形成器以将所述声音信号处理阵列的波束指向调整至与所述目标方向相对 应的状态。
15. 根据权利要求14所述的设备,其特征在于,所述调整模块具体用于: 根据所述方向指示信息通过以下公式获取声音信号处理阵列中各个声音处理单元η 对应的信号延时τη(β):
其中,dn代表呈线形排列的所述声音信号处理阵列中包含的声音信号处理单元之一的 声音信号处理单元η与声音信号处理阵列中心之间的距离,β代表由所述声音信号处理阵 列中心指向所述方向指示信息所指示的所述目标方向与一参考坐标之间的近似夹角,c代 表声速,f s代表声音信号处理阵列的声音信号米样频率; 根据所述声音信号处理单元η对应的信号延时τη(β)对所述声音信号处理单元n所 米集的声音信号做延时处理,经延时处理后的声音信号可以表达为:
为将由声音信号处理单元η采集到的声音信号进行时频变化后得到的频域 信号,ω代表频率索引。
16. 根据权利要求14所述的设备,其特征在于,所述调整模块具体用于: 根据所述方向指示信息通过以下公式获取声音信号处理阵列中各个声音处理单元对 应的信号延时的集合Τ或V :
其中,ΤΜ代表所述声音处理阵列中第Μ个声音处理单兀对应的信号延时,rm代表在所述 方向指示信息所指示的目标方向上的某一目标A至所述第m个声音处理单元的距离,fa代 表所述声音处理阵列的声音信号米样频率为,c代表声速; 所述rm通过以下公式获取:
其中,ra代表所述在所述方向指示信息所指示的目标方向上的某一目标A与一参考坐 标的坐标原点之间的距离,所述参考坐标的坐标原点为呈环形排列的所述声音处理阵列的 圆心,b代表所述呈环形均匀排列的所述声音处理阵列的半径,a m代表所述某一目标A在所 述声音处理阵列所在平面上的投影A'与所述坐标原点之间的连线与所述第m个声音处理 单元至所述坐标原点之间的连线之间的夹角; 所述am通过以下公式获取:
其中,叫代表所述某一目标A在所述声音处理阵列所在平面上的投影A'与所述坐标原 点之间的连线与所述第1个声音处理单元至所述坐标原点之间的连线之间的夹角; 根据所述信号延时集合T或Ψ中的信号延时TM或ΨΜ将对应于所述声音信号处理单 兀Μ所米集的声音信号做延时处理,经延时处理后的声音信号可以表达为:
为将由声音信号处理单元η采集到的声音信号进行时频变化后得到的频域 信号,ω代表频率索引。
17. 根据权利要求14至16任意一项所述的设备,其特征在于,所述声音信号处理阵列 包括声音信号采集阵列,所述声音信号采集阵列包括多个声音信号采集单元;对应地, 所述调整模块具体用于:根据所述方向指示信息,确定声音信号采集阵列中各个声音 信号米集单兀所对应的信号延时;根据各信号延时,对与所述信号延时对应的声音信号米 集单元采集的声音信号进行延时处理; 或者, 所述声音信号处理阵列包括声音信号发送阵列,所述声音信号发送阵列包括多个声音 信号发送单元;对应地, 所述调整模块具体用于:根据所述方向指示信息,确定声音信号发送阵列中各个声音 信号发送单兀所对应的信号延时;根据各信号延时,对与所述信号延时对应的声音信号发 送单元发送的声音信号进行延时处理。
18. 根据权利要求13至16任意一项所述的设备,其特征在于, 所述接收模块还用于:接收用户输入的控制模式显示指令; 所述设备还包括:显示模块,用于根据所述控制模式显示指令,获取并向用户显示可供 选择的多种控制模式,所述多种控制模式中的每一种控制模式对应至少一种方向指示信息 输入方式; 所述接收模块还用于:接收用户发送的针对所述多种控制模式的控制模式选择指令, 并开启用户所选择的控制模式,接收用户通过与所选择的控制模式对应的方向指示信息输 入方式所输入的用于指示目标方向的所述方向指示信息。
19. 根据权利要求18所述的设备,其特征在于,所述多种控制模式包括用户自主控制 模式,所述用户自主控制模式为允许用户自主输入所述方向指示信息的模式;若所述用户 所选择的控制模式为用户自主控制模式; 所述接收模块具体用于:接收所述用户通过语音输入方式所输入的语音信号,解析所 述语音信号以获取所述语音信号中包含的方向指示信息; 或者, 所述接收模块具体用于:接收所述用户以触摸输入方式在触摸屏上滑动输入的轨迹 信息,解析所述轨迹信息所指示的目标方向,并生成用以指示所述目标方向的方向指示信 息; 或者, 所述接收模块具体用于:接收所述用户通过投影屏幕投射输入的手势图像信息,解析 所述手势图像信息所指示的目标方向,并生成用以指示所述目标方向的方向指示信息; 或者, 所述接收模块具体用于:接收所述用户通过与所选择的控制模式对应的指令输入终端 装置输入的用于指示目标方向的控制指令,所述用于指示目标方向的控制指令包括所述用 于指示目标方向的方向指示信息; 或者, 所述接收模块具体用于:接收所述用户通过与所选择的控制模式对应的键盘滚轮输入 的滚动信息,所述用滚动信息包括所述用于指示目标方向的方向指示信息。
20. 根据权利要求19所述的设备,其特征在于,若所述用户选择的控制模式所对应的 方式指不信息输入方式为触摸输入方式,其中: 所述接收模块具体用于:接收所述用户在触摸屏上滑动输入的一条轨迹信息;根据所 述一条轨迹信息所包含的所述滑动输入在所述触摸屏上的起点位置信息和终点位置信息, 确定所述滑动输入所指示的目标方向,并生成用以指示所述目标方向的方向指示信息; 或者, 所述接收模块具体用于:接收所述用户在触摸屏上滑动输入的两条轨迹信息;根据所 述两条轨迹信息所包含的所述滑动输入在所述触摸屏上的起点位置信息和终点位置信息, 分别确定两条轨迹的延伸方向;根据所述两条轨迹的延伸方向所限定的角度范围,确定所 述滑动输入所指示的目标方向,并生成用以指示所述目标方向的方向指示信息。
21. 根据权利要求20所述的设备,其特征在于,所述接收模块具体用于: 根据所述两条轨迹的延伸方向确定所述两条轨迹所构成夹角的角平分线延伸的方向; 根据所述角平分线延伸的方向,确定所述滑动输入所指示的目标方向处于第一角度范围 中,所述第一角度范围以所述角平分线延伸方向为中心,以所述两条轨迹所构成夹角的角 度的一半为主瓣宽度。
22. 根据权利要求13至21任意一项所述的设备,其特征在于,还包括: 感测模块:用于感测所述声音信号处理阵列的朝向发生改变,并确定朝向变化量; 确定模块:用于根据所述朝向变化量以及所述声音信号处理阵列的朝向改变之前的目 标方向,确定所述声音信号处理阵列的朝向改变之后的目标方向; 提示模块:用于提示用户输入用于指示所述朝向改变之后的目标方向的所述方向指示 信息。
23. 根据权利要求18所述的设备,其特征在于,所述用户所选择的控制模式为扫描模 式,所述扫描模式为通过扫描提示用户输入所述方向指示信息的模式;对应地,还包括: 扫描模块,用于通过扫描采集至少两个方向上的声音信号; 分析模块,用于分析所述声音信号的能量,确定能量最大的声音信号的声源方向; 所述提示模块还用于提示用户根据所述声源方向输入所述方向指示信息。
24. -种声音信号处理设备,其特征在于,包括: 确定模块,用于根据主声源方向确定声音信号处理阵列的接收方向,根据所述接收方 向及所述声音信号处理阵列的波束指向确定所述处理阵列的目标方向,所述目标方向指 所述处理阵列的接收方向与主声源方向一致时所述处理阵列的朝向;确定所述声音信号处 理阵列的朝向与所述目标方向的夹角; 提示模块,用于提示用户根据所述夹角调整所述声音信号处理阵列的朝向,以使所述 声音信号处理阵列的接收方向与所述主声源方向一致。
【文档编号】H04M1/725GK104065798SQ201310092267
【公开日】2014年9月24日 申请日期:2013年3月21日 优先权日:2013年3月21日
【发明者】张德明, 刘媛媛, 龙志明 申请人:华为技术有限公司