本发明涉及水声探测,具体涉及一种基于比值掩码的水声线谱增强方法。
背景技术:
1、水下目标的被动声纳检测与识别是当前水声领域重点研究课题,然而在水声目标识别实际场景中,目标发声机理复杂、海洋信道时空变异、背景和平台噪声等因素影响导水声目标辐射噪声信噪比往往很低,同时由于被测目标与声纳之间存在相对运动,线谱会出现中断、多普勒频移等现象。传统增强方法主要采用自适应增强器(adaptive lineenhance,(ale))、维纳滤波器(wiener filter,(wf))等来实现信号增强,其原理主要利用线谱的相干特性,匹配未知线谱信号,抑制加性宽带噪声以增强线谱信噪比。如文献(sparsity-based adaptive line enhancer for passive sonars,2019年发表在《ietradar sonar and navigation》第13期,起始页码为1796页)、文献(稀疏驱动自适应线谱增强的水下目标谱熵检测,2021年发表在《声学学报》第6期,起始页码为1059页)、文献(deep-learning-based line enhancer for passive sonar systems,2022年发表在《iet radarsonar and navigation》第16期,起始页码为589页)均是基于传统方法来实现线谱增强。但是当信噪比低于一定阈值时增强效果会迅速恶化,文献(deep-learning-based lineenhancer for passive sonar systems,2022年发表在(基于无监督深度学习的线谱增强算法,2020在《舰船科学技术》第42期,起始页码为4页)通过仿真表明当信噪比低于一定条件时传统方法很难获得增益且无法实现对非线性噪声进行降噪。
2、因此由于水声线谱存在的低信噪比、中断、多普勒频移等情况,在使用传统增强方法时,受信噪比影响较大,因此传统增强方法只能处理非线性噪声的情况,不适用于水声线谱的增强。
技术实现思路
1、有鉴于此,本发明提供了一种基于比值掩码的水声线谱增强方法,能够自动学习含噪线谱和干净线谱之间的复杂关系,将有噪声的线谱特征映射到干净的线谱特征,能够有效应对水声线谱中的低信噪比、中断、多普勒频移等情况,实现对水声线谱的增强。
2、为达到上述目的,本发明的技术方案包括训练阶段和增强阶段。
3、训练阶段包括如下步骤:
4、构建训练样本,包括带噪声水声频谱和无噪声水声频谱,对训练样本进行频谱分析和特征提取,获得训练样本的频谱特征。
5、针对训练样本的频谱特征进行掩码计算,获得训练样本的频谱掩码。
6、构建dnn结构的深度学习模型,利用训练样本的频谱掩码进行训练,获得增强模型。
7、增强阶段包括如下步骤:
8、针对待增强水声信号频谱,首先进行频谱分析和特征提取,获得待增强频谱特征。
9、针对频谱特征进行掩码计算,获得待增强频谱掩码,构建增强模型的输入,输入至增强模型。
10、增强模型输出预测掩码之后,使用预测的掩码乘以待增强水声信号的幅度谱获得预测的幅度谱,之后进行波形重构,从而获得增强水声频谱。
11、进一步地,构建训练样本,包括带噪声水声频谱和无噪声水声频谱,对训练样本进行频谱分析和特征提取,获得训练样本的频谱特征,具体步骤为:
12、对于接收到的水声信号时域数据x(t)对其变换为时频谱以获取线谱特征,时频谱主要通过短时傅里叶变换stft得到,公式为:
13、x(f,t)=s(f,t)+n(f,t)
14、其中f为频率,x(f,t)、s(f,t)、n(f,t)分别为接收到的x(t)的时频谱,线谱分量的时频谱、噪声分量的时频谱。
15、针对时频分析结果进行特征提取,获得训练样本的频谱特征,包括幅度谱与相位,分别如下式所示:
16、xlps(f,t)=10log10(x(f,t)2)
17、∠x(f,t)=arctan(x(f,t))
18、式中|·|为取模运算,xlps为信号的幅度谱,∠x(f,t)为信号的相位。
19、进一步地,针对训练样本的频谱特征进行掩码计算,获得训练样本的频谱掩码,具体包括如下步骤:
20、利用masking模型,其输入的频谱特征为连续帧的掩码值与频谱特征相乘的结果,使用的掩码如下式所示:
21、
22、其中px(f,t)为线谱能量值,pn(f,t)为噪声分量能量值,β为线谱功率相对于总功率的权重。
23、进一步地,训练阶段中,构建dnn结构的深度学习模型,利用训练样本的频谱掩码进行训练,获得增强模型,具体包括如下步骤:
24、针对带噪声水声频谱对应的频谱掩码,沿时域维度以i为中心帧向两侧各拓展τ帧,作为输入掩码序列,作为深度学习模型的输入,深度学习模型的输出为预测的掩码;其中预测的掩码乘以带噪声水声信号的幅度谱,得到预测的幅度谱;以无噪声水声频谱对应的频谱掩码作为标签。
25、深度学习模型采用的dnn结构是一个具有多层非线性的前馈神经网络,具有多层非线性结构,其目标是构成一个高度非线性的回归函数,将有噪声的线谱特征映射到干净的线谱特征。
26、进一步地,增强阶段中,针对待增强水声信号频谱,首先进行频谱分析和特征提取,获得待增强频谱特征,其中待增强频谱特征包括待增强水声信号频谱对应的幅度谱与相位,其中相位用于波形重构部分。
27、进一步地,增强阶段中,针对频谱特征进行掩码计算,获得待增强频谱掩码,构建增强模型的输入,具体地,针对待增强频谱掩码,沿时域维度以i为中心帧向两侧各拓展τ帧,作为输入掩码序列,作为深度学习模型的输入。
28、有益效果:
29、本发明针对水声线谱存在的低信噪比、中断、多普勒频移等情况与传统增强方法受信噪比影响较大且只能处理非线性噪声的局限性,本发明提出了有监督的深度学习方法,利用masking成功实现了对水声线谱的增强,因此该方法能够自动学习含噪线谱和干净线谱之间的复杂关系,将有噪声的线谱特征映射到干净的线谱特征,能够有效应对水声线谱中的低信噪比、中断、多普勒频移等情况,实现对水声线谱的增强。
1.一种基于比值掩码的水声线谱增强方法,其特征在于,包括训练阶段和增强阶段;
2.如权利要求1所述的一种基于比值掩码的水声线谱增强方法,其特征在于,所述构建训练样本,包括带噪声水声频谱和无噪声水声频谱,对训练样本进行频谱分析和特征提取,获得训练样本的频谱特征,具体步骤为:
3.如权利要求1所述的一种基于比值掩码的水声线谱增强方法,其特征在于,针对所述训练样本的频谱特征进行掩码计算,获得训练样本的频谱掩码,具体包括如下步骤:
4.如权利要求3所述的一种基于比值掩码的水声线谱增强方法,其特征在于,所述训练阶段中,构建dnn结构的深度学习模型,利用训练样本的频谱掩码进行训练,获得增强模型,具体包括如下步骤:
5.如权利要求1所述的一种基于比值掩码的水声线谱增强方法,其特征在于,所述增强阶段中,针对待增强水声信号频谱,首先进行频谱分析和特征提取,获得待增强频谱特征,其中待增强频谱特征包括待增强水声信号频谱对应的幅度谱与相位,其中相位用于波形重构部分。
6.如权利要求1所述的一种基于比值掩码的水声线谱增强方法,其特征在于,所述增强阶段中,针对所述频谱特征进行掩码计算,获得待增强频谱掩码,构建增强模型的输入,具体地,针对待增强频谱掩码,沿时域维度以i为中心帧向两侧各拓展τ帧,作为输入掩码序列,作为深度学习模型的输入。