一种声源定位方法、装置、设备、存储介质及程序产品与流程

文档序号：40610330发布日期：2025-01-07 20:52阅读：19来源：国知局

本申请涉及信号处理，尤其涉及一种声源定位方法、装置、设备、存储介质及程序产品。

背景技术：

1、声源定位技术是利用传感器阵列接收到的声波信号来确定声源位置的技术，广泛应用于安防、工业等各个领域中，其具有不受通视条件限制、隐蔽性强、不受能见度限制等特点。然而，相关技术中的声源定位方法仍旧容易受到噪声干扰，并存在鲁棒性较差、计算复杂度较高等问题，导致定位结果并不准确。

技术实现思路

1、为解决上述技术问题，本发明实施例提供了一种声源定位方法、装置、设备、存储介质及程序产品。

2、本申请实施例提供的声源定位方法，包括：

3、获取m个通道数据，所述m个通道数据对应于麦克风阵列采集的m个通道的音频信号，m为正整数；

4、对所述m个通道数据进行分帧加窗处理，得到n帧时域信号，n为正整数；

5、基于所述n帧时域信号，确定时域协方差向量；

6、通过声源定位模型基于所述时域协方差向量确定声源的方位。

7、本申请实施例提供的声源定位装置，包括：

8、采集单元，用于获取m个通道数据，所述m个通道数据对应于麦克风阵列采集的m个通道的音频信号，m为正整数；

9、处理单元，用于对所述m个通道数据进行分帧加窗处理，得到n帧时域信号，n为正整数；基于所述n帧时域信号，确定时域协方差向量；

10、确定单元，用于通过声源定位模型基于所述时域协方差向量确定声源的方位。

11、本申请实施例提供的处理设备，包括：处理器和存储器，该存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，执行上述任意一种声源定位方法。

12、本申请实施例提供的计算机可读存储介质，用于存储计算机程序，所述计算机程序使得计算机执行上述任意一种声源定位方法。

13、本申请实施例提供的计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述任意一种声源定位方法。

14、本申请实施例的技术方案中，通过获取m个通道数据，对m个通道数据进行分帧加窗处理，得到n帧时域信号，并基于n帧时域信号，确定时域协方差向量，从而通过声源定位模型基于时域协方差向量确定声源的方位，其中，m个通道数据对应于麦克风阵列采集的m个通道的音频信号。如此，通过将麦克风阵列采集的多通道数据分割并选择合适的窗函数进行加窗处理，能够减少频谱泄漏，提高频谱分析的准确性，在一定程度上提高信号的信噪比，以及，将得到的多帧时域信号转换为时域协方差向量，能够有效利用信号中的时间相关性，通过捕捉和分析信号之间的相位和幅度变化，有效提高信号处理的效率和准确性，从而能够通过声源定位模型在提高鲁棒性的情况下基于时域协方差向量精确确定声源的方向。

技术特征：

1.一种声源定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取m个通道数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述m个通道数据进行分帧加窗处理，得到n帧时域信号，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述n帧时域信号，确定时域协方差向量，包括：

5.根据权利要求4所述的方法，其特征在于，所述n帧时域信号中的每一帧时域信号有m个通道和l个样本点，l为正整数；所述基于所述n帧时域信号，确定n个时域协方差矩阵，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述每一帧时域信号的信号矩阵，确定所述每一帧时域信号的时域协方差矩阵，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述n个时域协方差矩阵，确定所述时域协方差向量，包括：

8.根据权利要求1所述的方法，其特征在于，所述声源的方向包括定位方向角；所述通过声源定位模型基于所述时域协方差向量确定声源的方位，包括：

9.根据权利要求1至8中任一项所述的方法，其特征在于，所述方法还包括：

10.一种声源定位装置，其特征在于，所述装置包括：

11.一种处理设备，其特征在于，包括：处理器和存储器，该存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，执行如权利要求1至9中任一项所述的方法。

12.一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至9中任一项所述的方法。

13.一种计算机程序产品，其特征在于，包括计算机程序指令，该计算机程序指令使得计算机执行如权利要求1至9中任一项所述的方法。

技术总结
本申请公开了一种声源定位方法、装置、设备、存储介质及程序产品，其中，所述方法包括：获取M个通道数据，所述M个通道数据对应于麦克风阵列采集的M个通道的音频信号，M为正整数；对所述M个通道数据进行分帧加窗处理，得到N帧时域信号，N为正整数；基于所述N帧时域信号，确定时域协方差向量；通过声源定位模型基于所述时域协方差向量确定声源的方位。

技术研发人员：王江,崔斌,王鑫,林友钦
受保护的技术使用者：漳州立达信光电子科技有限公司
技术研发日：
技术公布日：2025/1/6

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王江,崔斌,王鑫,林友钦
技术所有人：漳州立达信光电子科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。