本发明涉及声音识别。更具体地,本发明涉及环境噪声污染智能实时识别与定位监测系统及方法。
背景技术:
1、环境监测自动化已成为环境监测的主要技术手段,这也对环境监测信息化工作提出了更高要求。同时,环境质量领域,尤其是环境噪声问题也愈加凸显。噪声污染来源复杂,源头类型多样,针对工业噪声、建筑工地施工噪声、交通噪声、社会生活噪声不同类来源。噪声事件发生之后,噪声分类若无法尽快准确判定,会影响通知责任部门处理进程。
2、相关技术中,例如公开号为cn109767785a的中国专利申请文件,公开了一种基于卷积神经网络的环境噪声识别分类方法,公开了将声音片段输入,声音特征信息(频率)被提取,输出的是分类结果,可以实现自动提取声音特征信息,并克服了现有傅立叶变换不能反映时间维度局部区域上的特征,缺少时间信息的标号不足的问题。
3、基于上述神经网络的噪声分类算法,对于目前的神经网络的噪声分类算法的分类结果的准确率存在偏差,因为对声音提取中只采用了频率特征进行识别,但对于一些噪声来说,只靠频率特征进行分类会存在部分难以界定的噪声,从而导致使用神经网络分类结果的准确性出现偏差。
技术实现思路
1、本发明提供一种环境噪声污染智能实时识别与定位监测系统及方法,旨在解决相关技术中对于一些噪声来说,只靠频率特征进行分类会存在部分难以界定的噪声,从而导致使用神经网络分类结果的准确性出现偏差的问题。
2、在第一方面中,本发明提供了环境噪声污染智能实时识别与定位监测方法,包括:获取目标音频数据,并提取第帧音频数据的特征,所述特征包括对数梅尔频谱图和波谱图,进而得到所述第帧音频数据所属的各个类型标签的第一概率值和第帧音频数据的特征向量;计算所述第帧音频数据与各个类型标签的偏差距离值,计算公式为:;式中,表示所述第帧音频数据与第类型标签之间的偏差距离值,表示第个类型标签中所有历史音频数据对应的特征向量的平均值,表示所述第帧音频数据的响度,表示第个类型标签中所有历史音频数据的响度的平均值;对所述偏差距离值进行归一化处理,得到第二概率值;对所述第一概率值和第二概率值进行加权求和,得到第帧音频数据属于各个类型标签的第三概率值,按照各个类型标签的第三概率值的大小,确定第帧音频数据所属的类型标签。
3、其效果在于:根据目标音频数据与历史数据中各个类型标签对应的特征向量和响度,采用了音频的另一特性(响度),计算目标音频数据所属的各个类型标签的第二概率值。然后通过对第一概率值和第二概率值进行加权求和得到第三概率值,考虑到了音频本身较多的因素对声音分类的影响,进而提高了对噪声的分类结果准确性。
4、在一实施例中,得到所述第帧音频数据所属的各个类型标签的第一概率值,包括:将所述对数梅尔频谱图和波谱图输入训练好的cnn网络分类模型中,输出为所述第帧音频数据所属的各个类型标签的第一概率值。
5、其效果在于,采用cnn网络分类模型,能够自动学习和提取数据中的特征,可以有效地捕获图像、音频等数据中的空间和时间特征,提高分类效率。
6、在一实施例中,得到第帧音频数据的特征向量,包括:在训练好的cnn网络分类模型中获取数梅尔频谱图对应的第一特征图和波谱图对应的第二特征图,根据所述第一特征图和第二特征图提取出特征向量。
7、其效果在于:采用cnn网络分类模型本身的计算过程,可以快速获取特征向量。
8、在一实施例中,得到所述第帧音频数据对应各个类型标签的第二概率值,包括:;其中,表示所述第帧音频数据属于第类型标签的第二概率值,表示所述第帧音频数据与第类型标签之间的偏差值,表示所述第帧音频数据与第一类型标签之间的偏差距离值。
9、其效果在于:通过该技术手段,能够不通过cnn网络分类模型的分类结果,但采用音频的响度特征,得到第帧音频数据与各个类型标签的第二概率值。
10、在一实施例中,所述第三概率值的计算公式为:;其中,表示所述第帧音频数据属于第类型标签的第三概率值,表示cnn网络分类模型分类得到的第一概率值对应的权重,表示所述第帧音频数据经过cnn网络分类模型分类后属于第类型标签的第一概率值,表示所述第帧音频数据属于第类型标签的第二概率值。
11、其效果在于:结合两种分类器的分类结果,并采用加权的方式对第一概率值和第二概率值进行处理,使得最后分类的结果更加准确。
12、在一实施例中,包括:采用所述cnn网络分类模型分类得到的第一概率值对应的权重的值为0.8。
13、在一实施例中,按照各个类型标签的第三概率值的大小,确定所述第帧音频数据所属的类型标签,包括:统计所述第帧音频数据对应的各个类型标签的第三概率值;将每个类型标签的第三概率值按大小排列,将最大的第三概率值对应的类型标签标识为所述第帧音频数据的类型标签。
14、其效果在于:采用对各个类型标签的第三概率值按大小排列,便于对数据进行运算,提高了处理数据的效率。
15、在一实施例中,对所述偏差距离值进行归一化处理,得到第二概率值,包括:对所述第帧音频数据与各个类型标签之间的偏差距离值进行归一化处理,得到所述第帧音频数据对应各个类型标签的第二概率值;其效果在于:对偏差距离值进行归一化处理,可以消除由于量纲和单位差异所带来的影响,并便于对数据进行分析和处理。
16、本发明第二方面,还提供了一种环境噪声污染智能实时识别与定位监测系统,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序以实现以上任一项所述的环境噪声污染智能实时识别与定位监测方法。
17、本发明的有益效果
18、(一)通过训练好的cnn网络分类模型,并利用音频的特征向量(频率)得到目标音频数据所属的各个类型标签的第一概率值,而采用cnn网络分类模型,能够自动学习和提取数据中的特征,可以有效地捕获图像、音频等数据中的空间和时间特征,提高分类效率。
19、(二)根据目标音频数据与历史数据中各个类型标签对应的特征向量和其它的音频特性(响度)进行分类,利用多个音频本身具有的因素,对噪声进行分类,从而提高分类结果的准确性。
20、(三)由于计算第二概率值中的部分数据来自于网络分类模型中,因此根据此特性合理的赋予第一概率值和第二概率值相应的权重,进而通过两个分类器的分类结果并加权求和,得到第三概率值,通过加权求和的方式,使得计算出的第三概率值更准确,因此本发明考虑到了音频本身较多的因素对其分类的影响,并采用两种分类器的分类结果,并赋予对应的权重,使得最终计算的第三概率值更加准确,因此提高了对噪声的分类结果得准确性。
1.一种环境噪声污染智能实时识别与定位监测方法,其特征在于,包括:
2.根据权利要求1所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,得到所述第帧音频数据所属的各个类型标签的第一概率值,包括:
3.根据权利要求1所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,得到第帧音频数据的特征向量,包括:
4.根据权利要求3所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,得到所述第帧音频数据对应各个类型标签的第二概率值,包括:
5.根据权利要求4所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,所述第三概率值的计算公式为:
6.根据权利要求5所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,包括:
7.根据权利要求1所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,按照各个类型标签的第三概率值的大小,确定所述第帧音频数据所属的类型标签,包括:
8.根据权利要求1所述的环境噪声污染智能实时识别与定位监测方法,其特征在于,对所述偏差距离值进行归一化处理,得到第二概率值,包括:
9.一种环境噪声污染智能实时识别与定位监测系统,包括处理器和存储器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1-8任一项所述的环境噪声污染智能实时识别与定位监测方法。