基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法

文档序号:36321614发布日期:2023-12-08 22:40阅读:66来源:国知局
基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法

本发明涉及仿生隐蔽水声通信,具体为基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法。


背景技术:

1、随着水声通信技术的发展,除了可靠性、通信速率和网络化外,水声通信的安全性与隐蔽性也逐渐受到重视。传统方法大多采用低检测概率(low probability ofdetection,lpd)技术实现隐蔽水声通信,与传统的lpd隐蔽通信技术不同,仿生隐蔽水声通信技术利用海洋中固有的海洋生物叫声或者人工合成的模拟叫声作为通信信号,令敌方在检测到这些信号后,误将其识别为海洋生物叫声而排除,从而达到隐蔽通信的目的。该技术不仅可以保证我方信息传输的安全,还可以隐藏水下通信平台位置,在军事领域极具应用前景,该研究将为我国国防安全、海洋强国建设做出重要贡献。

2、仿生隐蔽水声通信技术是将秘密信号伪装成海洋生物叫声,从而迷惑非合作方使其将接收到的声音信号判断为海洋生物噪声忽略掉,以伪装的思想达到隐蔽通信的目的,作为一种安全通信方式,避免被检测的能力是很重要的。因此仿生信号的隐蔽性及仿生效果对于仿生隐蔽水声通信技术来说是至关重要的。无论是国内还是国外的研究方法都是从客观角度仅利用一种或两种信号的特征进行隐蔽性评价,造成隐蔽性评价结果误差大。对于仿生隐蔽水声通信技术的研究,也都仅限于抗干扰性、通信速率和误码率等性能标准的评价,而对于其仿生效果和隐蔽性的评价并没有形成统一的标准。

3、然而,由于目前所研究的隐蔽性评价方法需要满足以下两个原则:(1)在听觉上难以分辨原始信号与嵌入信息后的仿生信号;(2)在信号形式上难以分辨原始信号与嵌入信息后的仿生信号,即两者在时域和频域上的相似度均很高。造成现有的仿生隐蔽水声通信技术的隐蔽性评价方法比较难真实实现,且各种信号分析复杂,没有形成统一的评价标准,无法准确地评价仿生信号与真实信号之间的差异,也无法直接得到直观地描述仿生信号隐蔽性的好坏的评分数值。


技术实现思路

1、本发明的目的在于提供一种基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法,可以从信号更多的角度更加细致地刻画仿生信号的内在信息,从而更准确地评价仿生信号与真实信号之间的差异,并且得到的评分数值可以更加直观地描述仿生信号隐蔽性的好坏。

2、为实现上述目的,本发明提供如下技术方案:本发明提供的基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法,包括以下步骤:

3、s1音频预处理:所述评分方法是从人类听觉角度和信号波形角度,对输入的海洋哺乳动物原始叫声信号的音频数据集和仿海洋哺乳动物叫声信号的音频数据集,进行音频预处理,得到预处理后的音频数据集;

4、s2特征筛选出通用型音频特征:对预处理后的海洋哺乳动物原始叫声信号和仿海洋哺乳动物叫声信号的音频数据集进行特征筛选,选出其中的通用型特征,包括从人类听觉的角度进行评价分析的第一种特征和从信号处理的角度进行评价第二种特征;所述第一种音频特征包括客观差异等级(odg)、信号水印能量比(swr)和梅尔倒谱距离(dmel),所述第二种音频特征包括信号波形相似度(ρ)、基波频率最小误差(ef)和信号幅度最小误差(ea);

5、s3经计算提取出经过筛选的六种海洋哺乳动物叫声的音频信号特征,具体包括:

6、s3.1设计并实现特征1客观差异等级(odg)的提取算法;

7、s3.2设计并实现特征2信号水印能量比(swr)的提取算法;

8、s3.3设计并实现特征3信号波形相似度(ρ)的提取算法;

9、s3.4设计并实现特征4梅尔倒谱距离(dmel)的提取算法;

10、s3.5设计并实现特征5基波频率最小误差(ef)和特征6信号幅度最小误差(ea)的提取算法;

11、s4特征数据标准化处理:对提取出的六种通用型特征的音频信号特征进行标准化处理,得到标准化后的音频特征;

12、s5计算音频信号特征的重要性和相关性:通过随机森林来计算所得到的六种音频信号特征的特征重要性,并使用皮尔逊相关系数来计算所得到的六种音频信号特征的特征相关性;

13、s6获得六种音频特征的权重系数公式:最后用线性回归和岭回归建立预测模型,得到六种特征音频特征的特征权重系数公式;

14、s7通过s6获得的特征权重系数公式,计算得到仿生海洋哺乳动物叫声信号的隐蔽性评分。

15、优选的,步骤s1音频预处理具体方法为:使用adobe audition软件,对原始海洋哺乳动物叫声的音频数据集和仿海洋哺乳动物叫声的音频数据集进行降噪、声音增强、回声消除、咔嗒声去除操作,再对以上音频信号进行数字化处理,来提高音频信号的质量、准确性和适用性。

16、优选的,步骤s2中,所述特征筛选是通过计算所选特征之间的pca线性相关性和互相关度,对于相关性系数大于2的每对特征,删除其中之一,具体方法如下:

17、s2.1设计并实现pca相关性分析,计算特征之间的线性相关性,pca计算两个特征之间的相关性公式为:

18、,

19、式中,x,y分别代表不同的特征,为特征x的均值,为特征y的均值,m代表特征样本的数量;

20、s2.2设计并实现互信息相关性分析,计算特征之间的非线性相关性,对于两个离散随机变量x和y,其互信息 mi(x, y) 的计算公式为:

21、,

22、式中,p(x,y)是联合概率分布,p(x)和p(y)分别是各自的边缘概率分布;

23、s2.3进行特征选择,主选择的是各类海洋哺乳动物叫声信号的通用型特征而非某一类海洋哺乳动物叫声信号特有的强相关特征,并根据计算得到的pca线性相关性和互信息非线性相关性,对于相关性系数大于2的每对特征,删除其中之一,最终得到六种特征:第一种音频特征数据和第二种音频特征数据,所述第一种音频特征数据包括客观差异等级(odg)、信号水印能量比(swr)和梅尔倒谱距离(dmel),所述第二种音频特征数据包括信号波形相似度(ρ)、基波频率最小误差(ef)和信号幅度最小误差(ea)。

24、优选的,步骤s3.1具体为:

25、采用pqevalaudio_v3r0软件对嵌入隐藏信息的叫声信号进行odg测试,来获取叫声信号的客观等级差异,软件将原始叫声信号作为参考信号,将带有隐藏信息的仿生信号作为测试信号,两路信号同时进入心理声学模型计算,结果通过感知模型进行特征提取和综合得到一系列的输出参数mov,最后通过神经网络把上述参数映射作为一个odg输出,当odg值大于0或小于0时,其绝对值越大表示原始信号与带有隐藏信息的仿生信号差异越小,仿生信号的不可感知性越好,隐蔽性越好。

26、优选的,步骤s3.2具体为:

27、将嵌入叫声信号的隐藏信息当作噪声,其数值大小作为对原始叫声信号所产生的影响程度,也就是信号水印能量比(swr),swr数值越大表示失真度越小,嵌入强度越低,说明仿生信号的隐蔽性越好,信号水印能量比计算公式为:

28、;

29、其中x(n)表示原始叫声信号,y(n)表示嵌入隐藏信息后的叫声信号,l表示叫声信号的长度,swr单位为db;

30、优选的,步骤s3.3具体为:

31、信号的波形相似度指在信号形式上难以分辨原始信号与嵌入信息后的仿生信号,即两者在时域和频域上的相似度均高,信号在时域和频域上的相似度用相关系数来衡量,计算公式为:

32、;

33、其中,s(n)表示原始叫声信号片段,s’(n)表示嵌入信息后的仿生信号片段,将s’(n)-s(n)视为有用信号;值越接近1,说明仿生信号与原始叫声信号越接近,隐蔽性越好。

34、优选的,步骤s3.4具体为:

35、mel频率倒谱系数是一种基于人类听觉系统的有效声音表示,人的主观听觉频率公式为:

36、;

37、式中,fmel为以mel为单位的感觉频率,为以hz为单位的实际频率;

38、定义人类听力频率范围内第m个带通滤波器的传递函数为hm(k),其中,m为听力范围内同组滤波器的总数;若各滤波器具有中心频率为的三角形滤波特性,且各滤波器在mel频率尺度上带宽相等,则各滤波器的离散传递函数hm(k)定义为:

39、;

40、中心频率定义为:

41、;

42、其中、分别为滤波器hm(k)的下限频率和上限频率,定义为;

43、基于mel滤波器组,对于1帧的mfccs通过以下方法获得:

44、;

45、其中n=1,2,....,m,是第i帧信号的第m个mel滤波器能量;为了比较仿生信号和原始信号,将每个叫声信号第i帧的mel距离di定义为

46、;

47、每个信号所有帧的梅尔距离平均值定义为:

48、;

49、其中i=1,2,...,k;

50、梅尔距离越小意味着仿生信号与原始信号之间的差异越小,仿生信号更有可能被忽视为海洋哺乳动物叫声信号,也就是隐蔽性越好。

51、优选的,步骤s3.5具体为:

52、假设经降噪后的叫声信号时频图为,其中表示频率,m表示由窗函数划分的时间段,表示第m个时间段傅里叶变换的结果;f(m)表示第m个时间段的基频频率,采用最大值提取方法的表达式如下:

53、;

54、分别计算嵌入信息前后的叫声信号的每个时间段的基频频率,取所有时间段基频频率的最小误差,计算公式如下:

55、;

56、其中,n表示所取时间段的个数,ft(m)表示原始叫声信号第m个时间段的基频频率,fl(m)表示嵌入信息后的叫声信号第m个时间段的基频频率;

57、采用窗长度为l的短时傅里叶变换,获得第r次谐波的第m个数据块能量er(m),其公式如下:

58、;

59、令每个数据块第一个采样点幅度为ar[m1],其公式如下所示:

60、;

61、采用插值的方法,获得该数据块每一个采样点的值,最终得到第r次谐波在每个采样点上的幅度值ar[n];嵌入信息前后的叫声信号的每个谐波中所有采样点的平均幅度误差,计算公式如下如示:

62、;

63、其中,表示原始叫声信号第r次谐波第i个采样点的幅度值,表示嵌入信息后的叫声信号第r次谐波第i个采样点的幅度值,n表示采样点的个数,最后计算信号幅度最小误差,其定义为所有谐波平均幅度误差的最小误差,其计算公式如下:

64、;

65、其中,m表示谐波的个数,表示第r次谐波的平均幅度误差。

66、优选的,步骤s4具体为:

67、计算每个特征所有数据的均值和标准差,然后对数据进行标准化处理,标准化是一种数据预处理技术,它将每个数据点减去均值,然后除以标准差,从而将数据映射到均值为0、标准差为1的标准化分布,标准化公式如下所示:

68、;

69、步骤s5具体为:

70、通过随机森林来计算上述得到的六种特征的重要性,得到的特征重要性评分会在随机森林中归一化,以确保所有特征的评分和为1;

71、使用皮尔逊相关系数公式来计算上述得到的六种特征的相关性,皮尔逊相关系数的计算公式如下:

72、;

73、当相关系数r>0时,说明特征与相似度评分之间是正相关,当相关系数r<0时,说明特征与相似度评分之间是负相关。

74、优选的,步骤s6具体为:

75、s6.1使用线性回归方法计算权重系数公式

76、使用线性回归建立预测模型的回归算法,找到一个适合数据的线性函数,线性回归的权重系数计算公式是:

77、;

78、其中x是一个 m×n 的矩阵,每行代表一个样本,每列代表一个特征,y是一个 m维的向量,表示目标变量;

79、通过线性回归得到的权重系数公式分别如下所示:

80、;

81、s6.2使用岭回归方法计算权重系数公式

82、使用岭回归建立预测模型的回归算法,找到一个适合数据的线性函数,岭回归的权重系数计算公式是:

83、;

84、其中,是岭回归的权重向量,是正则化参数,是单位矩阵,正则化参数控制着正则化的强度;

85、通过岭回归得到的权重系数公式分别如下所示:

86、。

87、本发明的有益效果:

88、本发明的基于特征提取的仿海洋哺乳动物叫声信号隐蔽性评分方法,从人类听觉和信号处理这两个角度提取出了多种海洋哺乳动物叫声信号的六种通用型特征,并利用这些特征通过权重系数公式得到了第二种仿生信号隐蔽性评分,更准确地评价仿生信号与真实信号之间的差异,从评分数值的大小可以直观地描述出仿生信号隐蔽性的好坏。

89、该隐蔽性评分方法从人类听觉和信号处理这两个角度提取出了多种海洋哺乳动物叫声信号的六种通用型特征,利用这些特征可以从信号更多的角度更加细致地刻画仿生信号的内在信息,计算准确度高、精确度高,从而更准确地评价仿生信号与真实信号之间的差异。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1