本发明属于油气管道安全评估领域,具体涉及一种基于可解释集成学习的油气管道腐蚀速率预测方法及系统。
背景技术:
1、随着能源需求的不断增长,油气管道作为能源运输的重要动脉,其安全运行对于保障能源供应具有至关重要的作用。油气管道在运行过程中,由于受到内外部多种因素(如化学腐蚀、微生物腐蚀、磨损腐蚀等)的影响,容易发生腐蚀现象,这不仅会增加维护成本,还可能引发泄漏甚至爆炸事故,对环境和人类安全构成严重威胁。
2、目前,油气管道腐蚀检技术主要包括直接检测法和间接检测法。直接检测法,如超声波检测、射线检测等,虽然检测结果直观,但往往需要管道停产或部分停产,且检测成本较高。间接检测法则主要依赖于腐蚀数据的收集与分析,通过建立数学模型来预测腐蚀速率和剩余寿命。然而,上述基于物理模型的方法依赖于经验知识,受主观因素影响,造成模型预测精度不高。
3、近年来,机器学习技术在油气管道腐蚀预测中得到了广泛应用,尤其是集成学习方法,因其强大的预测能力而受到关注。然而,现有的集成学习方法往往注重模型的预测精度,而忽视了模型的可解释性,这在实际应用中可能导致难以对预测结果进行有效解释和验证,限制了其在工程实践中的应用。
技术实现思路
1、为了解决现有技术中存在的问题,本发明提供一种基于可解释集成学习的油气管道腐蚀速率预测方法,构建集成学习模型,采用可解释方法实现对油气管道腐蚀速率的快速预测及腐蚀影响因素分析,为油气管道的安全评估提供指导。
2、为了实现上述目的,本发明采用的技术方案是:一种基于可解释集成学习的油气管道腐蚀速率预测方法,包括以下步骤:
3、获取现场勘测的油气管道腐蚀数据;
4、对所述油气管道腐蚀数据进行特征工程,去掉与腐蚀速率相关性小于设定值的特征,获得特征筛选后的数据;
5、基于上述筛选后的数据构建集成学习模型,并比较不同模型的评估性能,选择最优模型作为腐蚀速率预测模型;
6、基于上述选择的最优模型对测试数据集进行测试,预测油气管道腐蚀速率;
7、基于额外树回归模型,采用可解释方法将模型输入特征对腐蚀速率的影响结果进行可视化,分析不同输入参数对腐蚀速率的影响。
8、进一步的,所述油气管道腐蚀数据包括管道长度、温度、液体滞留量、二氧化碳分压、液体流速、壁面剪应力、ph值、管道内腐蚀速率值。
9、进一步的,采用皮尔逊相关系数对油气管道腐蚀数据进行特征相关性分析,获得筛选后的数据。
10、进一步的,基于上述筛选后的数据构建集成学习模型,并比较不同模型的评估性能,选择最优模型作为腐蚀速率预测模型包括:
11、平均绝对误差、均方误差、均方根误差以及拟合优度r2评估随机森林(rf)、adaboost、梯度增强回归树、xgboost、catboost和额外树回归模型六种模型对油气管道数据的评估性能,采用额外树回归模型作为最终的腐蚀速率预测模型。
12、进一步的,基于额外树回归模型,采用可解释方法shap值将模型输入特征对腐蚀速率的影响结果进行可视化,分析不同输入参数对腐蚀速率的影响。
13、进一步的,shap值用于量化输入特征对模型输出的影响;shap为负值时,特征对预测有负面影响,模型输出值降低,导致更低的内部腐蚀率;shap值为正时,特征对预测有正向影响,导致更高的内部腐蚀率。
14、与所述方法相同的技术构思,本发明还提供一种基于可解释集成学习的油气管道腐蚀速率预测系统,数据获取模块、特征筛选模块、优化模块、预测模块以及评估模块;
15、数据获取模块用于获取现场勘测的油气管道腐蚀数据;
16、特征筛选模块用于对所述油气管道腐蚀数据进行特征工程,去掉与腐蚀速率相关性小于设定值的特征,获得特征筛选后的数据;
17、优化模块基于上述筛选后的数据构建集成学习模型,并比较不同模型的评估性能,选择最优模型作为腐蚀速率预测模型;
18、预测模块基于上述选择的最优模型对测试数据集进行测试,预测油气管道腐蚀速率;
19、评估模块基于上述集成学习模型,采用可解释方法将模型输入特征对腐蚀速率的影响结果进行可视化,得到不同输入参数对腐蚀速率的影响。
20、进一步的,评估模块中所述shap值用于量化输入特征对模型输出的影响;shap为负值时,特征对预测有负面影响,模型输出值降低,导致更低的内部腐蚀率;shap值为正时,特征对预测有正向影响,导致更高的内部腐蚀率。
21、本发明还可以提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现本发明所述基于可解释集成学习的油气管道腐蚀速率预测方法。
22、同时提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的基于可解释集成学习的油气管道腐蚀速率预测方法。
23、与现有技术相比,本发明至少具有以下有益效果:经过特征工程筛选后,本发明的集成学习模型的拟合优度从0.699提升到了0.933,模型性能提升了约23%;运用集成学习模型,对油气管道的腐蚀速率进行了高效预测。即使在样本量较小的情况下,该模型也展现出卓越的性能,其拟合优度高达0.93,这充分证明了其预测的准确性与可靠性。为深入理解各腐蚀因素对管道腐蚀速率的影响,进一步引入了shap可解释性方法;shap提供一个直观且全面的视角,来探究不同特征对腐蚀速率的贡献度;通过shap分析,我们可以清晰地看到各个腐蚀因素是如何影响管道腐蚀速率的,不仅有助于我们理解模型预测的背后逻辑,更能为管道的维护和保养提供有针对性的建议;有助于深入挖掘管道腐蚀影响因素与腐蚀速率之间的内在关联,为腐蚀机理的研究提供指导;总的来说,集成学习模型不仅在预测油气管道腐蚀速率上表现出色,而且通过结合shap方法,能够更深入地理解各因素对腐蚀速率的具体影响。为未来的管道维护和管理提供了有力的数据支持和科学依据。
1.一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,所述油气管道腐蚀数据包括管道长度、温度、液体滞留量、二氧化碳分压、液体流速、壁面剪应力、ph值、管道内腐蚀速率值。
3.根据权利要求1所述一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,采用皮尔逊相关系数对油气管道腐蚀数据进行特征相关性分析,获得筛选后的数据。
4.根据权利要求1所述一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,基于上述筛选后的数据构建集成学习模型,并比较不同模型的评估性能,选择最优模型作为腐蚀速率预测模型包括:
5.根据权利要求1所述一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,还包括基于额外树回归模型,采用可解释方法shap值将模型输入特征对腐蚀速率的影响结果进行可视化,分析不同输入参数对腐蚀速率的影响。
6.根据权利要求5所述一种基于可解释集成学习的油气管道腐蚀速率预测方法,其特征在于,shap值用于量化输入特征对模型输出的影响;shap为负值时,特征对预测有负面影响,模型输出值降低,导致更低的内部腐蚀率;shap值为正时,特征对预测有正向影响,导致更高的内部腐蚀率。
7.一种基于可解释集成学习的油气管道腐蚀速率预测系统,其特征在于,数据获取模块、特征筛选模块、优化模块、预测模块以及评估模块;
8.根据权利要求7所述的基于可解释集成学习的油气管道腐蚀速率预测系统,其特征在于,评估模块中所述shap值用于量化输入特征对模型输出的影响;shap为负值时,特征对预测有负面影响,模型输出值降低,导致更低的内部腐蚀率;shap值为正时,特征对预测有正向影响,导致更高的内部腐蚀率。
9.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现权利要求1~8中任一项所述基于可解释集成学习的油气管道腐蚀速率预测方法。
10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现如权利要求1~8中任一项所述的基于可解释集成学习的油气管道腐蚀速率预测方法。