一种水声目标信号声纹特征提取装置和方法
【技术领域】
[0001] 本发明涉及一种声纹特征提取装置和方法,特别是一种水声目标信号声纹特征提 取装置和方法,属于水下声纹特征提取领域。
【背景技术】
[0002] 舰船辐射噪声主要由发电机、推进系统和船上辅助设备等声源产生,可以被探测 设备所侦测获取。侦测到的水声目标信号中存在着与其多声源相应的区别与其他型号舰船 的特征线谱,即声纹特征。声纹特征包含简单特征和复杂特征。声纹特征中的线谱就是简单 特征,这些特征线谱可以用频率、幅值和宽度描述,而特征线谱间存在的关联关系则为复杂 特征,可以更精细地用重构信号的谱图表示。
[0003] 近些年来,深度学习 (Deep Learning)作为机器学习 (Machine Leaning)研究中的 一个新的领域,以其在各个机器学习任务中所展现出来的优良的性能,得到了广泛的关注。 深度学习的引入也在一定程度上使得机器学习更加接近其原始的目标:人工智能 (Artificial Intelligent)。在经典机器学习方法中,人工智能系统基于系统输入特征学 习得到模型,从而实现分类和识别。在表示学习 (Representation Learning)方法中,人工 智能系统不仅学习如何从给定特征映射到系统输出,而且学习如何选择输入特征。然而在 实际应用中,影响输入观察的因素非常多,如何从中抽取出更具代表性的高层特征,是表示 学习所面临的困难。而基于深度学习的人工智能系统则实现了从底层的简单概念中构建得 到高层复杂概念的能力。深度学习之所以被称为"深度",是相对支撑向量机(Support Vector Machine)、提升方法(Boosting)、最大熵方法等"浅层学习"方法而言的。深度学习 的概念源于人工神经网络(Artificial Neural Network)的研究,最早由多伦多大学的 Hinton等提出,其中在输入层和输出层之间包含超过一个隐层的神经网络,即深层神经网 络(Deep Neural Network),就是一种深度学习结构。在机器视觉领域,深层神经网络在 ImageNet竞赛中带来的显著性能提升。在自然语言处理领域,循环神经网络语言模型被广 泛应用到各个领域,取得了显著优于N元文法的性能。基于神经网络的方法也被应用到了许 多自然语言处理任务中,例如机器翻译,命名体识别,词性标注,语义分析等。基于深层神经 网络的语音识别声学模型成为了主流的建模方法,并在信息产业上取得了成功。
[0004] 针对水声侦测信号的声纹特征提取问题,浅层结构算法的局限性在于有限样本和 计算单元情况下对复杂函数的表示能力有限,其泛化能力受到一定制约。深度学习具有多 层非线性映射的深层结构,实现复杂的函数逼近,表征输入数据分布式表示,并展现了强大 的从少数样本集中学习数据集本质特征的能力。声纹特征的提取需要从具有一定信噪比的 噪声中重构出声纹信号。
【发明内容】
[0005] 本发明的技术解决问题是:克服现有技术的不足,提供了一种水声目标信号声纹 特征提取装置和方法,从原始信号谱中提取出目标的基频和谐波;并利用原始信号谱、目标 的基频和谐波对原始信号谱进行重构,得到声纹特征,本发明可以有效提取水声目标信号 声纹特征,并具有一定的抗噪声干扰和频率漂移能力。
[0006] 本发明的技术解决方案是:一种水声目标信号声纹特征提取装置,主要包括:
[0007] 信号获取模块,用于获取水声目标信号的原始信号谱;
[0008] 特征提取模块,用于从原始信号谱中提取出目标的基频和谐波;
[0009] 重构模块,利用原始信号谱、目标的基频和谐波对原始信号谱进行重构,得到声纹 特征。
[0010] 所述特征提取模块采用神经网络结构从原始信号谱中提取出目标的基频和谐波。
[0011] 所述特征提取模块采用深层神经网络结构从原始信号谱中提取出目标的基频和 谐波。
[0012] 所述重构模块采用神经网络结构对原始信号谱进行重构,所述重构信号即为水声 目标信号声纹特征。
[0013] 所述重构模块采用深层神经网络结构对原始信号谱进行重构。
[0014] 所述深层神经网络结构包括输入层、隐层和输出层,所述输入层中的节点数为原 始信号谱的频点数、基频取值范围内的所有频率的频点数以及谐波阶次之和,隐层的层数 大于等于1,输出层的节点数为原始信号谱的频点数。
[0015] 所述隐层节点数小于输入节点数。
[0016] -种水声目标信号声纹特征提取方法,主要包括:
[0017] 信号获取步骤,用于获取水声目标信号的原始信号谱;
[0018] 特征提取步骤,从原始信号谱中提取出目标的基频和谐波;
[0019] 重构步骤,利用原始信号谱、目标的基频和谐波对原始信号谱进行重构,得到声纹 特征。
[0020] 本发明与现有技术相比的有益效果是:
[0021] 本发明针对声源信号在原始信号谱中具有谐波结构的特性,提取水声目标信号声 纹特征谐波和基频特征,并基于提取出的谐波和基频对原始信号谱进行重构,得到去噪以 后的声纹特征,与现有方法相比,具有一定的抗噪声干扰和频率漂移能力。
【附图说明】
[0022] 图1为本发明的装置示意图;
[0023]图2为本发明的方法流程图;
[0024]图3为信噪比为_20dB时深层神经网络的重构结果示意图;
[0025]图4为信噪比为_28dB时深层神经网络的重构结果示意图;
[0026]图5为原始信号谱基频提取误差统计图。
【具体实施方式】
[0027]下面结合附图对本发明的【具体实施方式】进行进一步的详细描述。
[0028]如图1所示为本发明中的装置示意图,从图1可知,本发明提出的一种水声目标信 号声纹特征提取装置,主要包括:
[0029]信号获取模块101,用于获取水声目标信号的原始信号谱;所述获取方式为采用目 前常用的任何信号采集装置或者传感器获得的真实原始信号谱数据,或者为试验状态下通 过缩比模型等获取的仿真原始信号谱,或者为计算机通过无噪声的水声目标信号与各种噪 声叠加获得的模拟原始信号谱,水声目标的原始信号谱因为发电机、推进系统和船上辅助 设备等设备运行过程中产生的噪音的影响,一般含有噪声,无法清晰的看出水声目标信号 的声纹特征。
[0030] 特征提取模块102,用于从原始信号谱中提取出目标的基频和谐波;声源信号在原 始信号谱中具有谐波结构特性,是重要的声纹特征,因此对水声目标信号的基频和谐波进 行提取,并基于提取的基频和谐波进行原始信号谱的重构,可以提取出更加清晰干净的原 始信号谱。
[0031] 从原始信号谱中提取出目标的基频和谐波,常用的方法主要是基于规则的方法, 即首先提取稳定线谱,再通过谐波是基频的倍数的规则,确定线谱间存在的谐波关系,从而 确定基频和谐波特征等。
[0032] 本发明中的特征提取模块102采用神经网络结构从原始信号谱中提取出目标的基 频和谐