一种声源定位方法、装置、设备、存储介质及程序产品与流程

文档序号:40610330发布日期:2025-01-07 20:52阅读:5来源:国知局
一种声源定位方法、装置、设备、存储介质及程序产品与流程

本申请涉及信号处理,尤其涉及一种声源定位方法、装置、设备、存储介质及程序产品。


背景技术:

1、声源定位技术是利用传感器阵列接收到的声波信号来确定声源位置的技术,广泛应用于安防、工业等各个领域中,其具有不受通视条件限制、隐蔽性强、不受能见度限制等特点。然而,相关技术中的声源定位方法仍旧容易受到噪声干扰,并存在鲁棒性较差、计算复杂度较高等问题,导致定位结果并不准确。


技术实现思路

1、为解决上述技术问题,本发明实施例提供了一种声源定位方法、装置、设备、存储介质及程序产品。

2、本申请实施例提供的声源定位方法,包括:

3、获取m个通道数据,所述m个通道数据对应于麦克风阵列采集的m个通道的音频信号,m为正整数;

4、对所述m个通道数据进行分帧加窗处理,得到n帧时域信号,n为正整数;

5、基于所述n帧时域信号,确定时域协方差向量;

6、通过声源定位模型基于所述时域协方差向量确定声源的方位。

7、本申请实施例提供的声源定位装置,包括:

8、采集单元,用于获取m个通道数据,所述m个通道数据对应于麦克风阵列采集的m个通道的音频信号,m为正整数;

9、处理单元,用于对所述m个通道数据进行分帧加窗处理,得到n帧时域信号,n为正整数;基于所述n帧时域信号,确定时域协方差向量;

10、确定单元,用于通过声源定位模型基于所述时域协方差向量确定声源的方位。

11、本申请实施例提供的处理设备,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行上述任意一种声源定位方法。

12、本申请实施例提供的计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行上述任意一种声源定位方法。

13、本申请实施例提供的计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述任意一种声源定位方法。

14、本申请实施例的技术方案中,通过获取m个通道数据,对m个通道数据进行分帧加窗处理,得到n帧时域信号,并基于n帧时域信号,确定时域协方差向量,从而通过声源定位模型基于时域协方差向量确定声源的方位,其中,m个通道数据对应于麦克风阵列采集的m个通道的音频信号。如此,通过将麦克风阵列采集的多通道数据分割并选择合适的窗函数进行加窗处理,能够减少频谱泄漏,提高频谱分析的准确性,在一定程度上提高信号的信噪比,以及,将得到的多帧时域信号转换为时域协方差向量,能够有效利用信号中的时间相关性,通过捕捉和分析信号之间的相位和幅度变化,有效提高信号处理的效率和准确性,从而能够通过声源定位模型在提高鲁棒性的情况下基于时域协方差向量精确确定声源的方向。



技术特征:

1.一种声源定位方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取m个通道数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述m个通道数据进行分帧加窗处理,得到n帧时域信号,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述n帧时域信号,确定时域协方差向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述n帧时域信号中的每一帧时域信号有m个通道和l个样本点,l为正整数;所述基于所述n帧时域信号,确定n个时域协方差矩阵,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述每一帧时域信号的信号矩阵,确定所述每一帧时域信号的时域协方差矩阵,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述n个时域协方差矩阵,确定所述时域协方差向量,包括:

8.根据权利要求1所述的方法,其特征在于,所述声源的方向包括定位方向角;所述通过声源定位模型基于所述时域协方差向量确定声源的方位,包括:

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:

10.一种声源定位装置,其特征在于,所述装置包括:

11.一种处理设备,其特征在于,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至9中任一项所述的方法。

12.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至9中任一项所述的方法。

13.一种计算机程序产品,其特征在于,包括计算机程序指令,该计算机程序指令使得计算机执行如权利要求1至9中任一项所述的方法。


技术总结
本申请公开了一种声源定位方法、装置、设备、存储介质及程序产品,其中,所述方法包括:获取M个通道数据,所述M个通道数据对应于麦克风阵列采集的M个通道的音频信号,M为正整数;对所述M个通道数据进行分帧加窗处理,得到N帧时域信号,N为正整数;基于所述N帧时域信号,确定时域协方差向量;通过声源定位模型基于所述时域协方差向量确定声源的方位。

技术研发人员:王江,崔斌,王鑫,林友钦
受保护的技术使用者:漳州立达信光电子科技有限公司
技术研发日:
技术公布日:2025/1/6
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1