无人机声源定位方法、装置、无人机及存储介质与流程

文档序号:33747014发布日期:2023-04-06 12:12阅读:90来源:国知局
无人机声源定位方法、装置、无人机及存储介质与流程

本发明涉及无人机,尤其是涉及一种基于麦克风阵列的无人机声源定位方法、装置、电子设备及计算机可读存储介质。


背景技术:

1、随着无人机技术的发展,无人机配合负载在军事、警用、交通执法、农业和测绘等各个领域发挥着越来越大的作用。在野外救援中,可利用警用无人机在低空悬停,无人机搭载麦克风进行远距离人声收集并对人声声源进行定位,以实现寻人等搜救任务。

2、但是,在无人机飞行的过程中存在明显的自噪声,包括稳态的无人机机械噪声,以及非稳态的螺旋桨旋转时产生的桨噪和螺旋桨引起空气流动产生的风噪。无人机的自噪声普遍大于90分贝,远远大于所接收到的人声等有效声音,而且有效声音从地面声源到无人机麦克风的传播距离较长,有效声音在空气中的传播存在衰减,造成无人机麦克风所采集到的声音信号低信噪比极低。因此,难以对人声声源进行定位。


技术实现思路

1、本发明的目的在于克服现有技术的缺点与不足,提供一种基于麦克风阵列的无人机声源定位方法,能够提高对人声声源的定位精确性。

2、本发明是通过以下技术方案实现的:一种基于麦克风阵列的无人机声源定位方法,包括如下步骤:

3、获取待处理的声源声音信号;

4、对所述声源声音信号进行人声检测,提取人声声音信号,所述人声声音信号包括与麦克风阵列的每一路麦克风一一对应的多个子人声声音信号;

5、根据麦克风阵列的拓扑结构,计算每一路麦克风对应的所述子人声声音信号的延迟相位及短时傅里叶变换,并针对每一方位角,根据所述延迟相位和所述短时傅里叶变换计算所述人声声音信号的声音方向来源值;

6、将每一方位角对应的所述声音方向来源值输入训练好的反向传播神经网络,得到声源方位。

7、相对于现有技术,本发明通过反向传播神经网络可以修正无人机桨噪造成的影响,能够做出更准确的声源方位判断。

8、进一步地,所述反向传播神经网络包括输入层、隐层和输出层,其中所述输入层包括n个输入节点,每一所述输入节点对应一方位角,每一所述输入节点输入对应方位角的所述声音方向来源值;所述隐层包括若干隐层节点,每一隐层节点对每一输入节点的所述声音方向来源值进行计算,输出隐层输出值;所述输出层包括1个输出节点,所述输出节点根据所述隐层输出值输出声源方位。

9、进一步地,所述反向传播神经网络的训练包括如下步骤:

10、将人声训练集和非人声训练集输入反向传播神经网络进行正向传播计算得到学习声源方位,所述人声训练集为人声声音信号的每一方位角的声音方向来源值的集合,所述非人声训练集为非人声声音信号的每一方位角的声音方向来源值的集合;

11、根据所述学习声源方位与期望声源方位通过误差函数计算得到学习误差,所述人声训练集对应的所述期望声源方位为真实声源方位,所述非人声训练集的所述期望声源方位为无方位;

12、根据所述学习误差调整所述反向传播神经网络的权值;

13、重复上述步骤,直至所述学习误差趋近于一极小值。

14、进一步地,所述麦克风阵列为线性阵列,所述声音方向来源值的表达式为:

15、

16、其中,m为麦克风阵列中的麦克风数量;n为麦克风阵列中第n路声源声音信号线路;x(k,l)为第n路子人声声音信号的第l帧的短时傅里叶变换,c是声音在空气中传播的速度;h(k,l)为第n路子人声声音信号的第l帧的延迟相位fk是子人声声音信号频率,d为麦克风阵列的麦克风间距,θ为方位角。

17、基于同一发明构思,本申请还提供一种基于麦克风阵列的无人机声源定位装置,包括:

18、信号获取模块,用于获取待处理的声源声音信号;

19、人声检测模块,用于对所述声源声音信号进行人声检测,提取人声声音信号,所述人生人声声音信号包括与麦克风阵列一一对应的多个子人生声音信号;

20、方向检测模块,用于根据麦克风阵列的拓扑结构,计算每一路麦克风对应的所述子人声声音信号的延迟相位及短时傅里叶变换,并针对每一方位角,根据所述延迟相位和所述短时傅里叶变换计算所述人声声音信号的声音方向来源值;

21、声源预测模块,用于将每一方位角对应的所述声音方向来源值输入训练好的反向传播神经网络,得到声源方位。

22、进一步地,所述反向传播神经网络包括输入层、隐层和输出层,其中所述输入层包括n个输入节点,每一所述输入节点对应一方位角,每一所述输入节点输入对应方位角的所述声音方向来源值;所述隐层包括若干隐层节点,每一隐层节点对每一输入节点的所述声音方向来源值进行计算,输出隐层输出值;所述输出层包括1个输出节点,所述输出节点根据所述隐层输出值输出声源方位。

23、进一步地,还包括神经网络训练模块,该神经网络训练模块包括:

24、正向传播子模块,用于将人声训练集和非人声训练集输入反向传播神经网络进行正向传播计算得到学习声源方位,所述人声训练集为人声声音信号的每一方位角的声音方向来源值的集合,所述非人声训练集为非人声声音信号的每一方位角的声音方向来源值的集合;

25、误差计算子模块,用于根据所述学习声源方位与期望声源方位通过误差函数计算得到学习误差,所述人声训练集对应的所述期望声源方位为真实声源方位,所述非人声训练集的所述期望声源方位为无方位;

26、权值调整子模块,用于根据所述学习误差调整所述反向传播神经网络的权值;

27、极小误差子模块,用于当所述学习误差趋近于一极小值,结束训练。

28、进一步地,所述麦克风阵列为线性阵列,所述声音方向来源值的表达式为:

29、

30、其中,m为麦克风阵列中的麦克风数量;n为麦克风阵列中第n路声音信号线路;x(k,l)为第n路子人声声音信号的第l帧的短时傅里叶变换,c是声音在空气中传播的速度;h(k,l)为第n路子人声声音信号的第l帧的延迟相位fk是子r人声声音信号频率,d为麦克风阵列的麦克风间距,θ为方位角。

31、基于同一发明构思,本申请还提供一种无人机,包括机身,还包括:麦克风阵列和控制器;

32、所述麦克风阵列设置在所述机身上,用于采集声源声音信号并传输至所述控制器;

33、所述控制器包括:

34、处理器;

35、存储器,用于存储由所述处理器执行的计算机程序;

36、其中,所述处理器执行所述计算机程序时实现上述方法的步骤。

37、基于同一发明构思,本申请还提供一种计算机可读存储介质,其上存储由计算机程序,所述计算机程序被执行时实现上述方法的步骤。

38、为了更好地理解和实施,下面结合附图详细说明本发明。



技术特征:

1.一种基于麦克风阵列的无人机声源定位方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于:所述反向传播神经网络包括输入层、隐层和输出层,其中所述输入层包括n个输入节点,每一所述输入节点对应一方位角,每一所述输入节点输入对应方位角的所述声音方向来源值;所述隐层包括若干隐层节点,每一隐层节点对每一输入节点的所述声音方向来源值进行计算,输出隐层输出值;所述输出层包括1个输出节点,所述输出节点根据所述隐层输出值输出声源方位。

3.根据权利要求1所述的方法,其特征在于:所述反向传播神经网络的训练包括如下步骤:

4.根据权利要求1所述的方法,其特征在于,所述麦克风阵列为线性阵列,所述声音方向来源值的表达式为:

5.一种基于麦克风阵列的无人机声源定位装置,其特征在于,包括:

6.根据权利要求5所述的装置,其特征在于:所述反向传播神经网络包括输入层、隐层和输出层,其中所述输入层包括n个输入节点,每一所述输入节点对应一方位角,每一所述输入节点输入对应方位角的所述声音方向来源值;所述隐层包括若干隐层节点,每一隐层节点对每一输入节点的所述声音方向来源值进行计算,输出隐层输出值;所述输出层包括1个输出节点,所述输出节点根据所述隐层输出值输出声源方位。

7.根据权利要求5所述的装置,其特征在于,还包括神经网络训练模块,该神经网络训练模块包括:

8.根据权利要求5所述的装置,其特征在于,所述麦克风阵列为线性阵列,所述声音方向来源值的表达式为:

9.一种无人机,包括机身,其特征在于,还包括:麦克风阵列和控制器;

10.一种计算机可读存储介质,其上存储由计算机程序,其特征在于,所述计算机程序被执行时实现权利要求1-4中任一项所述方法的步骤。


技术总结
本发明涉及一种基于麦克风阵列的无人机声源定位方法,包括步骤:获取待处理的声源声音信号;对所述声源声音信号进行人声检测,提取人声声音信号,所述人声声音信号包括与麦克风阵列的每一路麦克风一一对应的多个子人声声音信号;根据麦克风阵列的拓扑结构,计算每一路麦克风对应的所述子人声声音信号的延迟相位及短时傅里叶变换,并针对每一方位角,根据所述延迟相位和所述短时傅里叶变换计算所述人声声音信号的声音方向来源值;将每一方位角对应的所述声音方向来源值输入训练好的反向传播神经网络,得到声源方位。相对于现有技术,本发明通过反向传播神经网络可以修正无人机桨噪造成的影响,能够做出更准确的声源方位判断。

技术研发人员:陈翔,廖科文,吕继先,宁挺,雷文彬
受保护的技术使用者:广州成至智能机器科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1