本申请属于多音区定位,尤其涉及一种多音区定位实现方法、系统、车辆及存储介质。
背景技术:
1、汽车在人们生活中扮演越来越多角色,目前车机中大多都是基于需要多个mic的麦克风阵列完成音区定位。其中,需要使用多个mic组成麦克风阵列,增加了硬件的复杂性和成本。每个mic都需要独立的电路和线束,增加了系统设计和布线的复杂性,同时也增加了成本。并且,多个mic的麦克风阵列需要在车内进行合理的布置,以确保阵列的有效性,但这很可能会受到车辆内部空间的限制,导致布置受限或不够灵活。多个mic的麦克风阵列需要进行精确的位置校准和相位调整,才能实现准确的声音定位。这需要复杂的系统集成和调试过程,增加了开发和调试的难度。另外,多个mic的麦克风阵列需要进行复杂的信号处理和算法计算,包括声源定位、波束形成等。这增加了系统的复杂性和计算资源的需求。
技术实现思路
1、针对上述现有技术的缺陷,本申请提供了一种多音区定位实现方法、系统、车辆及存储介质,所述方法通过利用声源直达以及反射等多条路径到达mic的时间差,以建立多维指纹库的单mic多音区定位,通过只使用一个mic采音装置就实现了多音区定位功能,降低了硬件成本和提升了座舱体验效果。
2、为实现上述目的,本申请提供了一种多音区定位实现方法,包括:
3、s1:通过单采音装置采集预设周期内固定频率的多路样品音频,以及根据目标语音检测获取目标音频。
4、s2:记录在所述预设周期内提取预设次数多路样品音频波形时的第一时间点和目标音频波形时的第二时间点;其中,所述第一时间点包括第一基准时间点和第一测试时间点;所述第二时间点包括第二基准时间点和第二测试时间点。
5、s3:根据所述第一基准时间点和第一测试时间点算得多路样品音频时间差;根据所述第二基准时间点和第二测试时间点算得目标音频时间差。
6、s4:对所述多路样品音频时间差进行数据标定,以获得音区指纹库。
7、s5:将所述目标音频时间差与音区指纹库进行一一匹配,提取在预设阈值范围内相似度最高的音区,以完成多音区定位。
8、在本申请中,所述步骤s1还包括:
9、单采音装置的采集区域至少包括主驾位、副驾位、第一后座位和第二后座位;将采集到的主驾位音频、副驾位音频、第一后座位音频和第二后座位音频按预设顺序导出储存。
10、在本申请中,根据提取多路样品音频中的第一次波形的时间作为第一基准时间点,在第一次波形后提取的多路样品音频波形时的时间作为第一测试时间点;根据提取目标音频中的第一次波形的时间作为第二基准时间点,在第一次波形后提取的目标音频波形时的时间作为第二测试时间点。
11、在本申请中,所述步骤s3具体为:
12、按照提取预设次数多路样品音频波形的时间顺序,计算每个所述第一测试时间点与第一基准时间点的差值作为多路样品音频时间差;按照提取预设次数目标音频波形的时间顺序,计算每个所述第二测试时间点与第二基准时间点的差值作为目标音频时间差。
13、在本申请中,所述步骤s4具体为:
14、根据所述多路样品音频时间差获得标定数据集;其中,所述标定数据集包括训练集和验证集。
15、通过所述训练集训练标定算法,获得训练标定模型;通过所述验证集对所述训练标定模型进行性能调整,获得目标标定模型;通过所述目标标定模型,以获得音区指纹库。
16、为实现上述目的,本申请还提供了一种多音区定位实现系统,所述系统包括:
17、采集模块、第一处理模块、第二处理模块、数据标定模块和匹配提取模块。
18、其中,所述采集模块用于通过单采音装置采集预设周期内固定频率的多路样品音频,以及根据目标语音检测获取目标音频。
19、所述第一处理模块用于记录在所述预设周期内提取预设次数多路样品音频波形时的第一时间点和目标音频波形时的第二时间点;其中,所述第一时间点包括第一基准时间点和第一测试时间点;所述第二时间点包括第二基准时间点和第二测试时间点。
20、所述第二处理模块用于根据所述第一基准时间点和第一测试时间点算得多路样品音频时间差;根据所述第二基准时间点和第二测试时间点算得目标音频时间差。
21、所述数据标定模块用于对所述多路样品音频时间差进行数据标定,以获得音区指纹库。
22、以及,所述匹配提取模块用于将所述目标音频时间差与音区指纹库进行一一匹配,提取在预设阈值范围内相似度最高的音区,以完成多音区定位。
23、在本申请中,单采音装置的采集区域至少包括主驾位、副驾位、第一后座位和第二后座位。
24、将采集到的主驾位音频、副驾位音频、第一后座位音频和第二后座位音频按预设顺序导出储存;其中,所述单采音装置设置在车头区域靠近主驾位的一侧。
25、在本申请中,所述数据标定模块包括标定数据集单元;其中,所述标定数据集单元包括训练集单元和验证集单元。
26、进一步地,通过所述训练集单元训练标定算法,获得训练标定模型;通过所述验证集单元对所述训练标定模型进行性能调整,获得目标标定模型;通过所述目标标定模型,以获得音区指纹库。
27、为实现上述目的,本申请还提供了一种车辆,所述车辆至少包括如上任一所述的多音区定位实现系统。
28、为实现上述目的,本申请还提供了一种存储介质,为计算机可读存储介质中的一种,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上任一所述的多音区定位实现方法。
29、与现有技术相比,本申请有益效果在于:
30、本申请提出的一种多音区定位实现方法、系统、车辆及存储介质,所述方法通过只使用一个mic采音装置就实现了多音区定位功能,降低了硬件成本和提升了座舱体验效果。单mic方案提升了座舱体验效果,通过简化的算法实现了在单mic情况下的音区定位功能,使得用户在座舱内的声音体验更为智能和定位精准。本申请还减少了多mic音区定位的模型训练需求,降低了项目开发周期。单mic方案在部署和优化上可能更加简化,有助于加快产品上市时间。
1.一种多音区定位实现方法,其特征在于,包括:
2.根据权利要求1所述的一种多音区定位实现方法,其特征在于,所述步骤s1还包括:
3.根据权利要求2所述的一种多音区定位实现方法,其特征在于,
4.根据权利要求3所述的一种多音区定位实现方法,其特征在于,所述步骤s3,具体为:按照提取预设次数多路样品音频波形的时间顺序,计算每个所述第一测试时间点与第一基准时间点的差值作为多路样品音频时间差;
5.根据权利要求4所述的一种多音区定位实现方法,其特征在于,所述步骤s4,具体为:根据所述多路样品音频时间差获得标定数据集;其中,所述标定数据集包括训练集和验证集;
6.一种多音区定位实现系统,其特征在于,包括:
7.根据权利要求6所述的一种多音区定位实现系统,其特征在于,
8.根据权利要求7所述的一种多音区定位实现系统,其特征在于,
9.一种车辆,其特征在于,所述车辆至少包括如权利要求6~8任一所述的多音区定位实现系统。
10.一种存储介质,为计算机可读存储介质中的一种,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1~5任一所述的多音区定位实现方法。