本发明涉及数据分析,具体是一种基于xgboost和shap模型解释重金属环境因素定量分析方法。
背景技术:
1、随着过去几十年的快速城市化和工业化,土壤中的重金属污染已成世界范围内的环境和公共卫生问题。重金属具有很强的稳定性和毒性,可以通过自然过程或人为输入在环境介质中积累和转移,威胁农产品质量、生态安全和人类健康。土壤污染具有多源、跨介质和复合途径特征,重金属在土壤中的迁移和累积过程受到多种环境因素的影响。因此,明确土壤重金属累积的环境因素及其贡献率、了解环境因素对重金属含量的影响,对制定污染防治措施具有重要意义。
2、现有的土壤重金属污染的分析方法,例如相关性分析、聚类分析、地统计分析和主成分分析,假设来自于同一污染源的重金属之间具有较强的相关性,可以通过识别具有相似数据分布特征,来定性判定重金属潜在来源。然而,这些方法对于空间信息欠缺考虑、对重金属污染源的分析缺少环境因素的贡献率量化以及对分析结果无法解释。
技术实现思路
1、针对上述缺陷,本发明提出了一种基于xgboost和shap模型解释重金属环境因素定量分析方法,目的在于解决现有的土壤重金属污染的分析方法对于空间信息欠缺考虑、对重金属污染源的分析缺少环境因素的贡献率量化以及对分析结果无法解释的问题。
2、为达此目的,本发明采用以下技术方案:
3、一种基于xgboost和shap模型解释重金属环境因素定量分析方法,包括以下步骤:
4、步骤s1:对研究目标区域进行土壤采样,获取土壤样品;
5、步骤s2:对所述土壤样品进行化学分析,获得所述土壤样品中重金属浓度数据;
6、步骤s3:对所述土壤样品中重金属浓度数据进行空间特征分析,获得环境因素的空间信息参数;
7、步骤s4:根据所述土壤样品中重金属浓度数据和环境因素的空间信息参数,利用极限梯度提升算法(xgboost)模型和可解释机器学习(shap)模型计算得到所述土壤样品中重金属环境因素定量分析结果。
8、优选地,在步骤s1中,具体包括以下子步骤:
9、步骤s11:确定所述研究目标区域的范围与所述土壤样品的采样方法;
10、步骤s12:根据所述研究目标区域的范围和所述土壤样品的采样方法,获取所述土壤样品。
11、优选地,在步骤s1中,还包括以下步骤:获取所述研究目标区域的重金属源解析辅助数据。
12、优选地,在步骤s2中,具体包括以下子步骤:
13、步骤s21:将所述土壤样品进行风干研磨过筛处理,得到第一土壤样品;
14、步骤s22:对所述第一土壤样品进行消解处理,得到第二土壤样品;
15、步骤s23:利用电感耦合等离子体-质谱(icp-ms)测定所述第二土壤样品的重金属浓度数据。
16、优选地,在步骤s3中,具体包括以下步骤:
17、采用克里金法,以所述研究目标区域作为分布点位,并以所述分布点位作为重金属浓度插值,以得到空间分布特征。
18、优选地,在步骤s3中,还包括以下步骤:
19、利用arcgis计算所述研究目标区域中重金属浓度插值。
20、优选地,在步骤s4中,具体包括以下子步骤:
21、步骤s41:对所述土壤样品中重金属浓度数据进行描述性统计,得到所述研究目标区域中的重金属基本特征信息;
22、步骤s42:以所述土壤样品中重金属浓度数据和环境因素的空间信息参数作为xgboost模型的输入,得到环境因素对重金属的贡献信息;
23、步骤s43:使用shap模型探究所述土壤样品中重金属浓度数据的程度变化趋势,并分析得到关键环境因素影响的边界与阈值;
24、步骤s44:将所述研究目标区域中的重金属基本特征信息、所述环境因素对重金属的贡献信息、以及所述关键环境因素影响的边界与阈值作为所述土壤样品中重金属环境因素定量分析结果。
25、本申请实施例提供的技术方案可以包括以下有益效果:
26、本方案中通过xgboost模型和shap模型计算得到的土壤样品中重金属环境因素定量分析结果,以确定各种污染源对重金属的贡献率,明确各环境因素对重金属污染的贡献率和重要度,并且探究环境因素对重金属污染影响程度变化趋势。此外,对空间信息参数和各形式的环境变量对相关性数据进行扩充,评估了关键环境变量对重金属污染的影响范围与程度,进而实现了土壤污染信息的全面性和完整性,为后期的环境治理提供了帮助。
1.一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s1中,具体包括以下子步骤:
3.根据权利要求1所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s1中,还包括以下步骤:获取所述研究目标区域的重金属源解析辅助数据。
4.根据权利要求1所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s2中,具体包括以下子步骤:
5.根据权利要求1所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s3中,具体包括以下步骤:
6.根据权利要求5所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s3中,还包括以下步骤:
7.根据权利要求1所述的一种基于xgboost和shap模型解释重金属环境因素定量分析方法,其特征在于:在步骤s4中,具体包括以下子步骤: