基于机器学习的管网阀门典型声音信号识别方法

文档序号:38966853发布日期:2024-08-14 14:28阅读:20来源:国知局
基于机器学习的管网阀门典型声音信号识别方法

本发明属于声音信号识别,涉及一种管网阀门声音信号的识别方法。


背景技术:

1、随着我国城镇化进程的加速推进,水资源短缺问题逐渐凸显,逐渐阻碍城市经济发展,影响人民生活水平。我国用水量60%以上是农业用水,生活用水不到15%。供水量中,地下水比重也在持续减少,人工生态环境补水在持续增加。水资源紧缺,优良的饮用水则更为匮乏。城市供水管网是一个庞大而复杂的管线网络系统,是城市正常运转所必需的基础设施。传统供水设施维护管理理念中,常采用“先爆管后修复”的被动式管理,这与现代城市供水管理强调的“预防为主,维抢修前置”先进理念不相吻合。现代城市供水管理更加关注管线巡检制度化、管道抢修计划与实施之间的协调配合、阀门及阀门井维护流程化等综合性管理举措,以确保供水系统的稳定运行和高效服务。

2、供水管网中阀门是至关重要的设施,在日常供水管道运行中扮演着重要角色,用于输送、关断、调节供水流量、压力和改变流向等管网调控任务。然而,目前阀门的启闭和调节仍然需要操作工人到现场进行手动操作完成。阀门出现故障,就会引起水量流失,造成浪费现象。更重要的是,在处理爆管等突发性事件时,由于工作人员无法对阀门运行状态做出及时判断,不能及时关闭阀门,这将导致抢修时间的贻误,给城市带来严重后果。因此,人们需要高度重视供水管网中阀门的运行和管理工作,如何有效管理监控阀门设备对于管网建设和运行管理变得越来越重要。

3、日常阀门的巡查和养护工作需要做到及时发现问题、及时处理问题。目前对于城市管网阀门的巡查和养护等工作大多体现在供水管网系统建模上,并没有基于阀门声音信号来判断其运行状态的研究,现有管网阀门声音信号的分析主要是人工分析,不仅需要花费大量的人力,而且效果也不好,还存在发现问题的效率低,无法保证及时发现问题的要求,因此目前缺乏一种快速的自动化和智能化分析手段。


技术实现思路

1、本发明为了解决当前人工对城市管网阀门声音信号的分析存在效率低、准确率差的问题。

2、一种基于机器学习的管网阀门典型声音信号识别方法,包括:

3、针对采集到的待识别管网阀门工作时的每一段音频信号进行去噪处理;再使用三门限脉冲提取算法对每一段音频进行脉冲提取;然后提取初始特征并对初始特征进行归一化处理,提取的初始特征包括:脉冲面积s、左右对称程度dczy、脉冲上升百分比tp、持续时间t1、能量密度md、脉冲占比zb、波峰系数bf、脉冲上下对称度dcsx、面积占比dp、幅度最大值max_value、幅度最小值min_value、幅度均值mean、峰峰值p_p_value、幅度绝对平均值abs_mean、方根幅值square_root_amplitude、幅度标准差std、峭度kurtosis、偏度skewness、均方根幅度rms、幅度均方根差rmscha、幅度方差fangcha、裕度指标clearance_factor、波形指标shape_factor、脉冲指标impulse_factor、峰值指标crest_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、频率方差vf、平均频率mf、均方根频率rmsf和标准13维mfcc特征,将标准13维mfcc特征中的第1维至第13维的特征分别记为mfcc_1、mfcc_2、……、mfcc_13;

4、针对归一化处理后的初始特征,选取用于分类的特征,用于分类的特征包括:脉冲面积s、脉冲上升百分比tp、持续时间t1、脉冲上下对称度dcsx、峭度kurtosis、波形指标shape_factor、脉冲指标impulse_factor、峰值指标crest_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、频率方差vf、平均频率mf、频率均方根rmsf、mfcc_1、mfcc_2和mfcc_3;将用于分类的特征输入排气状态识别模型预测管网阀门的排气状态类型,所述排气状态包括大排气声音状态、小排气声音状态和其他声音状态;

5、针对预测为大排气声音状态的管网阀门,基于归一化处理后的初始特征选取用于软投票融合模型的特征,大排气对应的用于软投票融合模型的特征包括:脉冲面积s、脉冲上升百分比tp、持续时间t1、方根幅值mean、square_root_amplitude、峭度kurtosis、波形指标shape_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、平均频率mf、频率均方根rmsf、mfcc_2、mfcc_7、mfcc_9、mfcc_12,将大排气对应的用于软投票融合模型的特征输入大排气对应的加权软投票的水压识别模型预测水压值;

6、针对预测为小排气声音状态的管网阀门,基于归一化处理后的初始特征选取用于软投票融合模型的特征,小排气对应的用于软投票融合模型的特征包括:脉冲面积s、持续时间t1、方根幅值mean、square_root_amplitude、峭度kurtosis、波形指标shape_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、平均频率mf、频率均方根rmsf、mfcc_5、mfcc_7、mfcc_8、mfcc_9、mfcc_10,将小排气对应的用于软投票融合模型的特征输入小排气对应的加权软投票的水压识别模型预测水压值。

7、然后基于预测水压值,将预测水压值落入的水压范围区间作为最终确定的水压范围。

8、进一步地,针对采集到的待识别管网阀门工作时的每一段音频信号进行去噪处理的过程中,首先针对300hz-3400hz采用通滤波方式进行滤除,然后采用去噪算法进行二次降噪。

9、优选地,所述水压范围区间包括0.25-0.3mpa、0.35-0.45mpa、0.5-0.55mpa。

10、进一步地,排气状态识别模型采用catboost机器学习模型。

11、进一步地,加权软投票的水压识别模型为多个机器学习模型组成的加权融合模型。

12、进一步地,组成的加权融合模型的多个机器学习模型包括gbdt、xgboost和catboost模型。

13、进一步地,所述排气状态识别模型是预先构建并训练好的,具体过程包括:

14、采集到的管网阀门工作时的音频信号,音频信号包括大排气和小排气两种排气状态对应的音频信号,将大排气和小排气两种排气状态对应的音频信号分别记为大排气声音状态、小排气声音状态,将声音信号不属于大排气声音状态、小排气声音状态的声音信号记为其他声音状态;

15、首先针对采集到的每一段音频信号,进行去噪处理;再使用三门限脉冲提取算法对每一段音频进行脉冲提取;然后提取特征并构建第一特征集,提取的特征包括:脉冲面积s、脉冲上升百分比tp、持续时间t1、脉冲上下对称度dcsx、峭度kurtosis、波形指标shape_factor、脉冲指标impulse_factor、峰值指标crest_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、频率方差vf、平均频率mf、频率均方根rmsf和标准13维mfcc特征,以及方根幅值mean、square_root_amplitude;

16、对第一特征集进行降维得到第三特征集;

17、对第三特征集中的特征进行归一化处理,将归一化处理后的第三特征集分为第三特征集训练集和第三特征集测试集,第三特征集训练集和第三特征集测试集中的样本标签为大排气声音状态、小排气声音状态和其他声音状态;利用第三特征集训练集训练多个机器学习模型,并利用第三特征集测试集测试多个机器学习模型,筛选出分类准确率最高的机器学习模型作为排气状态识别模型。

18、进一步地,对第一特征集进行降维得到第三特征集的过程包括以下步骤:

19、选择基于基尼系数的随机森林重要性排序法对所第一特征集中的特征进行重要性排序,将得分低于第一得分阈值的特征进行删除,得到第二特征集;再基于皮尔逊相关系数法去对第二特征集中特征进一步筛选,得到第三特征集。

20、进一步地,所述水压识别模型是预先构建并训练好的,具体过程包括:

21、采集到的管网阀门工作时的音频信号,音频信号包括大排气和小排气两种排气状态对应的音频信号,同时采集大排气和小排气两种排气状态下管网阀门的压力值,即水压值;将大排气和小排气两种排气状态对应的音频信号分别记为大排气声音状态、小排气声音状态,将声音信号不属于大排气声音状态、小排气声音状态的声音信号记为其他声音状态;

22、首先采用smote过采样算法来对数据不平衡进行处理,然后针对采集到的每一段音频信号,进行去噪处理;再使用三门限脉冲提取算法对每一段音频进行脉冲提取;然后提取特征并构建第一特征集,提取的特征包括:脉冲面积s、脉冲上升百分比tp、持续时间t1、脉冲上下对称度dcsx、峭度kurtosis、波形指标shape_factor、脉冲指标impulse_factor、峰值指标crest_factor、峭度指标kurtosis_factor、过零率zerorate、频谱质心mainhz、频率方差vf、平均频率mf、频率均方根rmsf和标准13维mfcc特征,以及均值mean、方根幅值square_root_amplitude;

23、针对大排气声音状态,对第一特征集进行降维得到第四特征集;针对小排气声音状态,对第一特征集进行降维得到第五特征集;对第四、五特征集中的特征进行归一化处理;

24、将归一化处理后的第四特征集分为第四特征集训练集和第四特征集测试集,第四特征集训练集和第四特征集测试集中的样本标签为水压值;将多个机器学习模型作为基分类器,利用第四特征集训练集训练每个基分类器,采用优化算法对基分类器进行参数优化,然后利用第四特征集测试集测试参数优化后的每个基分类器,根据每个基分类器分类性能分配权重,并将多个基分类器构成加权软投票融合模型,即大排气对应的加权软投票的水压识别模型;

25、将归一化处理后的第五特征集分为第五特征集训练集和第五特征集测试集,第五特征集训练集和第五特征集测试集中的样本标签为水压值;将多个机器学习模型作为基分类器,利用第五特征集训练集训练每个基分类器,采用优化算法对基分类器进行参数优化,然后利用第五特征集测试集测试参数优化后的每个基分类器,根据每个基分类器分类性能分配权重,并将多个基分类器构成加权软投票融合模型,即小排气对应的加权软投票的水压识别模型。

26、进一步地,对第一特征集进行降维得到第四特征集,对第一特征集进行降维得到第五特征集的过程包括以下步骤:

27、针对大排气声音状态,选择基于基尼系数的随机森林重要性排序法对所第一特征集中的特征进行重要性排序,将得分低于0.022的特征进行删除;再基于皮尔逊相关系数法进一步筛选,得到第四特征集;

28、针对小排气声音状态,选择基于基尼系数的随机森林重要性排序法对所第一特征集中的特征进行重要性排序,将得分低于0.003的特征进行删除;再基于皮尔逊相关系数法进一步筛选,得到第五特征集。

29、有益效果:

30、本发明对管网阀门声音信号数据进行降噪处理,有效的对噪声进行消除,从而得到相对纯净的阀门声音数据,降低噪声对阀门运行识别效果产生的影响,保证了后期识别的效果。此外本发明通过脉冲提取获取数据集,基于机器学习方法训练排气状态识别模型与基于加权软投票的水压识别模型,并将两种模型相结合,提高了对不同声音类型识别的准确性和效率。

31、本发明利用深机器学习的方法和技术,实现对管网阀门典型声音信号的自动识别,克服了传统方法需要人工分析存在的效率低,缺乏自动化和智能化分析手段的问题。本发明实现了自动化和智能化分析,极大的提高了信号分析的效率和准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1