一种模型训练、鸟声降噪方法、装置、电子设备及介质

文档序号：37287853发布日期：2024-03-13 20:36阅读：20来源：国知局

本发明涉及数据处理，尤其涉及一种模型训练、鸟声降噪方法、装置、电子设备及介质。

背景技术：

1、声学监测为生态环境评价提供科学依据。随着传感器网络的发展与普及，声学传感器已经在生态监测中发挥了巨大的作用。声学传感器体积小，可以长时间部署在野外，按照规定的时间表记录声学数据，且基于它们的监测是非侵入性的，因而适合长期和大规模的生态监测。声学传感器记录的声学数据可用于计算生物多样性声学指数并进一步评估生物的多度、丰度、种群密度和群落组成，还能用来分析动物行为的空间和时间趋势。然而，野外长期记录的生物声学数据通常包含了风声、雨声和溪流声等地理声，以及汽车声和人声等人工声，低信噪比的声学录音数据会影响后续的目标物种检测和识别分类以及声学指数计算。面对被噪声污染的鸟声录音，人们在降噪方面做了很多努力，如传统的mmse stsa降噪，小波变换降噪等，这些方法可以消除生物声学信号的部分噪声，但当鸟声信号信噪比很低或鸟声与噪声频谱重叠时，降噪的效果并不好。

技术实现思路

1、本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明提出一种模型训练、鸟声降噪方法、装置、电子设备及介质，能够训练得到效果良好的鸟声降噪模型。

2、一方面，本发明实施例提供了一种模型训练方法，包括：

3、获取干净鸟声数据集；

4、对干净鸟声数据集进行加噪处理，得到带噪鸟声数据集；

5、配置鸟声降噪网络和音频分类损失网络；其中，鸟声降噪网络包括若干卷积层；最后一层卷积层包括卷积合成层，其余卷积层包括扩张卷积运算、自适应归一化和泄漏整流线性单元；音频分类损失网络包括多层卷积层、平均池化层和逻辑分类器层；

6、将第一训练样本输入鸟声降噪网络得到降噪鸟声；第一训练样本根据带噪鸟声数据集确定；

7、依次将降噪鸟声和第二训练样本输入不同的音频分类损失网络，对应获得两个激活特征；第二训练样本根据干净鸟声数据集确定；

8、根据两个激活特征得到损失值，根据损失值对鸟声降噪网络的参数进行调整；更新第一训练样本和第二训练样本，然后返回将第一训练样本输入鸟声降噪网络得到降噪鸟声这一步骤，直至满足预设训练条件，得到训练完成的鸟声降噪网络。

9、可选地，干净鸟声数据集包括多个干净鸟声信号；对干净鸟声数据集进行加噪处理，得到带噪鸟声数据集，包括：

10、基于预设噪声数据，结合增益系数对干净鸟声数据集中的各个干净鸟声信号进行加噪处理，得到对应的若干带噪鸟声信号；增益系数基于预设信噪比确定；

11、根据带噪鸟声信号整理得到带噪鸟声数据集。

12、可选地，配置音频分类损失网络，包括：

13、基于卷积运算、批量归一化、泄漏整流线性单元、归一化和非线性运算配置多层卷积层；其中，多层卷积层中，最后一层卷积层包括卷积运算、归一化和非线性运算，其余卷积层包括卷积运算、批量归一化和泄漏整流线性单元；多层卷积层中，各卷积层之间执行抽取运算；

14、根据依次连接的多层卷积层、平均池化层和逻辑分类器层配置得到音频分类损失网络。

15、可选地，将第一训练样本输入鸟声降噪网络得到降噪鸟声，包括：

16、对第一训练样本进行多层卷积处理，进而对多层卷积处理的结果进行线性变换，得到降噪鸟声；

17、其中，多层卷积处理中，每个中间层通过上一层的特征映射结合扩张卷积运算、自适应归一化和预设的膨胀系数得到。

18、可选地，根据两个激活特征得到损失值，包括：

19、通过计算两个激活特征之间的加权最小绝对距离，得到损失值。

20、另一方面，本发明实施例提供了一种鸟声降噪方法，包括：

21、获取待降噪的鸟声信号；

22、将鸟声信号输入鸟声降噪网络进行鸟声降噪得到目标鸟声信号；其中，鸟声降噪网络通过前面的模型训练方法训练得到。

23、另一方面，本发明实施例提供了一种模型训练装置，包括：

24、第一模块，用于获取干净鸟声数据集；

25、第二模块，用于对干净鸟声数据集进行加噪处理，得到带噪鸟声数据集；

26、第三模块，用于配置鸟声降噪网络和音频分类损失网络；其中，鸟声降噪网络包括若干卷积层；最后一层卷积层包括卷积合成层，其余卷积层包括扩张卷积运算、自适应归一化和泄漏整流线性单元；音频分类损失网络包括多层卷积层、平均池化层和逻辑分类器层；

27、第四模块，用于将第一训练样本输入鸟声降噪网络得到降噪鸟声；第一训练样本根据带噪鸟声数据集确定；

28、第五模块，用于依次将降噪鸟声和第二训练样本输入不同的音频分类损失网络，对应获得两个激活特征；第二训练样本根据干净鸟声数据集确定；

29、第六模块，用于根据两个激活特征得到损失值，根据损失值对鸟声降噪网络的参数进行调整；更新第一训练样本和第二训练样本，然后返回第四模块，直至满足预设训练条件，得到训练完成的鸟声降噪网络。

30、另一方面，本发明实施例提供了一种鸟声降噪装置，包括：

31、第七模块，用于获取待降噪的鸟声信号；

32、第八模块，用于将鸟声信号输入鸟声降噪网络进行鸟声降噪得到目标鸟声信号；其中，鸟声降噪网络通过前面的模型训练装置确定。

33、另一方面，本发明实施例提供了一种电子设备，包括：处理器以及存储器；存储器用于存储程序；处理器执行程序实现上述模型训练方法或鸟声降噪方法。

34、另一方面，本发明实施例提供了一种计算机存储介质，其中存储有处理器可执行的程序，处理器可执行的程序在由处理器执行时用于实现上述模型训练方法或鸟声降噪方法。

35、本发明实施例首先获取干净鸟声数据集；对干净鸟声数据集进行加噪处理，得到带噪鸟声数据集；配置鸟声降噪网络和音频分类损失网络；其中，鸟声降噪网络包括若干卷积层；最后一层卷积层包括卷积合成层，其余卷积层包括扩张卷积运算、自适应归一化和泄漏整流线性单元；音频分类损失网络包括多层卷积层、平均池化层和逻辑分类器层；将第一训练样本输入鸟声降噪网络得到降噪鸟声；第一训练样本根据带噪鸟声数据集确定；依次将降噪鸟声和第二训练样本输入不同的音频分类损失网络，对应获得两个激活特征；第二训练样本根据干净鸟声数据集确定；根据两个激活特征得到损失值，根据损失值对鸟声降噪网络的参数进行调整；更新第一训练样本和第二训练样本，然后返回将第一训练样本输入鸟声降噪网络得到降噪鸟声这一步骤，直至满足预设训练条件，得到训练完成的鸟声降噪网络。本发明实施例从预训练的音频分类损失网络中提取深度特征损失来训练鸟声降噪网络，不需要增加降噪网络本身的复杂性，就可以在强干扰噪声背景下实现更好的降噪性能。该网络在带噪鸟类声音数据集上显示出优异的降噪性能。

技术特征：

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述干净鸟声数据集包括多个干净鸟声信号；所述对所述干净鸟声数据集进行加噪处理，得到带噪鸟声数据集，包括：

3.根据权利要求1所述的模型训练方法，其特征在于，所述配置音频分类损失网络，包括：

4.根据权利要求1所述的模型训练方法，其特征在于，所述将第一训练样本输入所述鸟声降噪网络得到降噪鸟声，包括：

5.根据权利要求1所述的模型训练方法，其特征在于，所述根据两个所述激活特征得到损失值，包括：

6.一种鸟声降噪方法，其特征在于，包括：

7.一种模型训练装置，其特征在于，包括：

8.一种鸟声降噪装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器以及存储器；

10.一种计算机存储介质，其中存储有处理器可执行的程序，其特征在于，所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1至5或权利要求6中任一项所述的方法。

技术总结
本发明公开了一种模型训练、鸟声降噪方法、装置、电子设备及介质，方法包括：获取干净鸟声数据集；对干净鸟声数据集进行加噪处理，得到带噪鸟声数据集；配置鸟声降噪网络和音频分类损失网络；将第一训练样本输入鸟声降噪网络得到降噪鸟声；依次将降噪鸟声和第二训练样本输入不同的音频分类损失网络，获得两个激活特征；根据激活特征得到损失值，根据损失值对鸟声降噪网络的参数进行调整；更新第一训练样本和第二训练样本，然后返回将第一训练样本输入鸟声降噪网络得到降噪鸟声这一步骤，直至满足预设训练条件，得到训练完成的鸟声降噪网络。本发明的鸟声降噪网络在带噪鸟类声音数据集上显示出优异的降噪性能，可广泛应用于数据处理技术领域。

技术研发人员：张承云,何凯莹,高星辉
受保护的技术使用者：广州大学
技术研发日：
技术公布日：2024/3/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张承云,何凯莹,高星辉
技术所有人：广州大学
我是此专利的发明人