收音方向调整方法、装置、设备及存储介质与流程

文档序号:37437869发布日期:2024-03-25 19:37阅读:39来源:国知局
收音方向调整方法、装置、设备及存储介质与流程

本发明涉及自动控制,具体而言,涉及一种收音方向调整方法、装置、设备及存储介质。


背景技术:

1、随着科技发展,声音采集设备也越来越多,例如,收音机、麦克风等等。声音采集设备的收音方向为声源发出的方向时,可以提高收音效果,所以,对声音采集设备的收音方向进行调整也成了为研究的热点。

2、相关技术中,声音采集设备的波束成形方向为声音采集设备的收音方向,声音采集设备的波束成形方向不方便调节,只能声音采集设备设置固定方向的波束成形。人工根据声源的方向,调整声音采集设备的朝向,从而改变声音采集设备的波束成形方向,从而调整声音采集设备的收音方向。

3、但是,相关技术中,通过人工无法改变准确、高效的调整声音采集设备的收音方向,还浪费了不必要的人力资源。


技术实现思路

1、本发明的目的在于,针对上述现有技术中的不足,提供一种收音方向调整方法、装置、设备及存储介质,以便解决相关技术中所在的上述技术问题。

2、为实现上述目的,本发明实施例采用的技术方案如下:

3、第一方面,本发明实施例提供了一种收音方向调整方法,包括:

4、获取预设音频采集场景中至少两个音频采集设备所采集的至少两个音频信号;

5、根据所述至少两个音频信号,确定所述至少两个音频采集设备的当前收音方向的目标特征值;

6、采用预设的音源方向识别模型,对所述目标特征值进行识别,得到目标音源的方向识别结果;

7、根据所述目标音源的方向识别结果,调整所述至少两个音频采集设备的收音方向,使得调整后的收音方向朝向所述目标音源。

8、可选的,所述根据所述至少两个音频信号,确定所述至少两个音频采集设备的当前收音方向的目标特征值,包括:

9、对所述至少两个音频信号进行预处理,得到预处理后的至少两个音频信号;

10、对所述预处理后的至少两个音频信号进行离散傅里叶变换,得到所述至少两个音频采集设备对应的至少两个频域信号;

11、根据所述至少两个频域信号,确定所述目标特征值。

12、可选的,所述对所述至少两个音频信号进行预处理,得到预处理后的至少两个音频信号,包括:

13、对所述至少两个音频信号进行缓存,得到缓存信号,其中,所述缓存信号包括当前帧的音频信号,以及上一帧的音频信号;

14、采用预设长度的窗,对所述缓存信号进行分析,得到所述预处理后的至少两个音频信号。

15、可选的,所述根据所述至少两个频域信号,确定所述目标特征值,包括:

16、根据所述至少两个频域信号,确定每个音频采集设备对应的频域信号中的目标子带信号;

17、对每两个音频采集设备对应的目标子带信号共轭相乘,得到所述目标特征值。

18、可选的,所述音源方向识别模型采用以下方式训练得到:

19、获取多个样本音频信号以及各样本音频信号对应的预设方位标签;

20、根据所述多个样本音频信号,确定所述多个样本音频信号对应的样本特征值;

21、根据所述样本特征值以及所述各样本音频信号对应的预设方位标签,对初始音源方向识别模型进行训练,更新所述初始音源方向识别模型中权重系数,直至损失函数收敛,得到所述音源方向识别模型。

22、可选的,所述初始音源方向识别模型包括:依次连接的输入层、多个隐藏层以及输出层;所述根据所述样本特征值以及所述各样本音频信号对应的预设方位标签,对初始音源方向识别模型进行训练,更新所述初始音源方向识别模型中权重系数直至收敛,得到所述音源方向识别模型,包括:

23、向所述输入层输入所述样本特征值;

24、采用所述多个隐藏层的第一个隐藏层中的激活函数对所述样本特征值处理,得到第一处理结果;

25、采用所述多个隐藏层的第二个隐藏层中的激活函数对所述样本特征值处理,直至完成所述多个隐藏层中每个隐藏层的处理,得到目标处理结果;

26、采用所述输出层根据所述目标处理结果,输出预测方位;

27、根据所述预测方位以及所述各样本音频信号对应的预设方位标签,对所述初始音源方向识别模型进行训练,更新所述初始音源方向识别模型中权重系数,直至所述损失函数收敛,得到所述音源方向识别模型。

28、可选的,所述方向识别结果包括:所述目标音源相对于多个预设方位的概率值;

29、所述根据所述目标音源的方向识别结果,调整所述至少两个音频采集设备的收音方向,包括:

30、根据目标音源相对于多个预设方位的概率值,确定所述目标音源的方位;

31、根据所述目标音源的方位,计算目标角度;

32、根据所述目标角度控制电机旋转,以调整与所述电机连接的所述至少两个音频采集设备的收音方向。

33、第二方面,本发明实施例还提供了一种收音方向调整装置,包括:

34、获取模块,用于获取预设音频采集场景中至少两个音频采集设备所采集的至少两个音频信号;

35、确定模块,用于根据所述至少两个音频信号,确定所述至少两个音频采集设备的当前收音方向的目标特征值;

36、识别模块,用于采用预设的音源方向识别模型,对所述目标特征值进行识别,得到目标音源的方向识别结果;

37、调整模块,用于根据所述目标音源的方向识别结果,调整所述至少两个音频采集设备的收音方向,使得调整后的收音方向朝向所述目标音源。

38、可选的,所述确定模块,具体用于对所述至少两个音频信号进行预处理,得到预处理后的至少两个音频信号;对所述预处理后的至少两个音频信号进行离散傅里叶变换,得到所述至少两个音频采集设备对应的至少两个频域信号;根据所述至少两个频域信号,确定所述目标特征值。

39、可选的,所述确定模块,具体用于对所述至少两个音频信号进行缓存,得到缓存信号,其中,所述缓存信号包括当前帧的音频信号,以及上一帧的音频信号;采用预设长度的窗,对所述缓存信号进行分析,得到所述预处理后的至少两个音频信号。

40、可选的,所述确定模块,具体用于根据所述至少两个频域信号,确定每个音频采集设备对应的频域信号中的目标子带信号;对每两个音频采集设备对应的目标子带信号共轭相乘,得到所述目标特征值。

41、可选的,所述音源方向识别模型采用以下方式训练得到:

42、第一获取模块,用于获取多个样本音频信号以及各样本音频信号对应的预设方位标签;

43、第一确定模块,用于根据所述多个样本音频信号,确定所述多个样本音频信号对应的样本特征值;

44、训练模块,用于根据所述样本特征值以及所述各样本音频信号对应的预设方位标签,对初始音源方向识别模型进行训练,更新所述初始音源方向识别模型中权重系数,直至损失函数收敛,得到所述音源方向识别模型。

45、可选的,所述初始音源方向识别模型包括:依次连接的输入层、多个隐藏层以及输出层;所述训练模块,具体用于向所述输入层输入所述样本特征值;采用所述多个隐藏层的第一个隐藏层中的激活函数对所述样本特征值处理,得到第一处理结果;采用所述多个隐藏层的第二个隐藏层中的激活函数对所述样本特征值处理,直至完成所述多个隐藏层中每个隐藏层的处理,得到目标处理结果;采用所述输出层根据所述目标处理结果,输出预测方位;根据所述预测方位以及所述各样本音频信号对应的预设方位标签,对所述初始音源方向识别模型进行训练,更新所述初始音源方向识别模型中权重系数,直至所述损失函数收敛,得到所述音源方向识别模型。

46、可选的,所述方向识别结果包括:所述目标音源相对于多个预设方位的概率值;所述调整模块,具体用于根据目标音源相对于多个预设方位的概率值,确定所述目标音源的方位;根据所述目标音源的方位,计算目标角度;根据所述目标角度控制电机旋转,以调整与所述电机连接的所述至少两个音频采集设备的收音方向。

47、第三方面,本发明实施例还提供了一种收音方向调整设备,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的收音方向调整方法。

48、第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述第一方面任一项所述的收音方向调整方法。

49、本发明的有益效果是:本发明实施例提供一种收音方向调整方法,包括:获取预设音频采集场景中至少两个音频采集设备所采集的至少两个音频信号;根据至少两个音频信号,确定至少两个音频采集设备的当前收音方向的目标特征值;采用预设的音源方向识别模型,对目标特征值进行识别,得到目标音源的方向识别结果;根据目标音源的方向识别结果,调整至少两个音频采集设备的收音方向,使得调整后的收音方向朝向目标音源。通过预设的音源方向识别模型识别得到目标音源的方向识别结果,基于目标音源的方向识别结果可以实现准确、高效的调整至少两个音频采集设备的收音方向,使得调整后的收音方向朝向目标音源,整个过程自动实现,无需人工参与,减少了不必要的人力资源浪费。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1