本发明涉及遥感应用、滑坡灾害管理和工程运营维护,尤其涉及一种考虑邻域特征和信息融合的全自动滑坡易发性评价方法及系统。
背景技术:
1、山体滑坡的成因机理是复杂多变的,往往归结于多种内部变量和外部触发因素,被认为是最具破坏性和最广泛的地质灾害之一。滑坡易发性是基于各项滑坡致灾因素对未来该区域内给定边坡在空间上失稳的概率进行等级划分。研究表明,山体滑坡在十年内更可能发生在已有的滑坡路径上,且这种遗留效应对受滑坡影响的地区有相当大的作用。因此,从区域角度而言,制作滑坡易发性评价图能为区域防灾减灾工作提供理论参考并有助于预防和减轻山体滑坡造成的损失。
2、近年来,相关学者尝试在滑坡易发性评价中引入机器学习模型,例如,逻辑回归,支持向量机,随机森林、人工神经网络等。然而,机器学习模型结构相对较浅,很难完全捕获滑坡分布与各种环境影响因子间隐藏的、复杂的和非线性的关系。如何对海量灾害数据进行精确分析以及应对数据的时空性和非线性是滑坡易发性评价中十分重要的部分。
技术实现思路
1、针对传统的滑坡易发性评价模型难以充分、全面挖掘栅格数据结构表征的滑坡致灾因素的空间特征信息,且致灾因素的选择、分级对专家信息依赖严重等问题,本发明提供了一种考虑邻域特征和信息融合的全自动滑坡易发性评价方法及系统,采用将机器学习中的随机森林模型与深度学习领域的卷积神经网络相结合,一方面,通过随机森林模型挖掘传统一维数据结构样本的特征信息,另一方面,利用卷积神经网络挖掘三维数据结构样本中的滑坡及邻域空间特征信息,并通过加权融合二者预测结果的优势形成最终的滑坡易发性评价结果。
2、为了实现上述目的,本发明采用以下技术方案:
3、本发明一方面提出一种考虑邻域特征和信息融合的全自动滑坡易发性评价方法,包括:
4、步骤1:利用arcgis软件预处理生成具有相同数据结构、地理坐标系和空间分辨率的滑坡致灾因素,收集研究区历史滑坡分布清单,并根据历史滑坡分布清单制作非滑坡矢量分布清单;
5、步骤2:根据滑坡和非滑坡分布清单,结合滑坡致灾因素数据,制作用于滑坡致灾因素评价的csv文件,并计算每类滑坡致灾因素的方差膨胀因子和基尼不纯度值;
6、步骤3:根据设定的阈值,剔除方差膨胀因子超过10的致灾因素以及基尼不纯度值最小的两类致灾因素,将剩余的致灾因素叠加生成通道数为致灾因素数的单个栅格数据;
7、步骤4:分别构建一维和三维数据结构的滑坡样本作为模型训练的输入,并分别构建基于随机森林和卷积神经网络的滑坡易发性评价模型,其中随机森林模型的超参数通过网格搜寻法确定;
8、步骤5:将步骤4生成的两类训练样本分别输入随机森林模型和卷积神经网络模型开展训练,得到训练完成的两类滑坡易发性评价模型;
9、步骤6:根据选择的精度评价指标(包括:accuracy、precision、recall、f1-score、roc曲线)分别计算两类模型的性能表现,并输出roc曲线图;
10、步骤7:基于所述步骤5中训练完成的两类滑坡易发性评价模型,逐像元预测全区域内的滑坡易发性指数,两个模型单独生成两种易发性结果,其值分布为0-1之间;
11、步骤8:结合所述步骤7中提取的两类易发性结果,加权融合两类滑坡易发性指数并生成最终评价结果,然后将数据导入arcgis软件并采取自然间断法生成研究区滑坡易发性区划图。
12、进一步地,所述步骤1中,选取的滑坡致灾因素来自于地质构造、地形地貌、水文气象和人类活动,并通过arcgis软件统一构建为tif格式的栅格图层,且非滑坡矢量样本的生成通过缓冲区功能选择。
13、进一步地,所述步骤2中,用于致灾因素评估的csv文件为以样本质心为中心所提取的对应不同滑坡致灾因素图层的值,以该值作为评估致灾因素的数据;分别采用公式(1)和(2)计算第i类滑坡致灾因素的基尼不纯度值gini和方差膨胀因子vifi:
14、
15、
16、其中,pi(c)为在第i个滑坡致灾因素条件下,样本归属于第c个类别的概率,所述类别包括滑坡和非滑坡,c为总类别个数,ri为第i类滑坡致灾因素与其他全部滑坡致灾因素的复相关系数。
17、进一步地,所述步骤3中,剔除方差膨胀因子大于10的致灾因素以及基尼不纯度值排名最后两名的致灾因素,利用剩余因素叠加生成波段为致灾因素个数的致灾因素图层。
18、进一步地,所述步骤4中,一维数据结构的训练样本为以样本质心为中心,对应滑坡致灾因素图层数据为元素的列向量;三维数据结构的训练样本在构建时,通过引入地理第一定律,将质心周围一定尺度的致灾因素全部纳入样本表达;随机森林模型的超参数通过网格搜寻法确定,该模型用于拟合一维数据结构的训练样本与滑坡易发性指数间的关系;卷积神经网络模型的超参数通过试错法更新并确定,该模型用于挖掘三维数据结构训练样本内的空间信息。
19、进一步地,所述步骤5中,两类滑坡易发性评价模型均采用训练数据中的70%训练模型,并通过30%的数据测试模型的性能。
20、进一步地,所述步骤6中,通过设定的精度评价指标基于测试样本评估两类模型的性能并输出评价结果。
21、进一步地,所述步骤7中,训练完成的两类滑坡易发性评价模型基于叠加的滑坡致灾因素图层,逐像元预测滑坡易发性指数值。
22、本发明另一方面提出一种考虑邻域特征和信息融合的全自动滑坡易发性评价系统,包括:
23、滑坡和非滑坡分布清单获取模块,用于利用arcgis软件预处理生成具有相同数据结构、地理坐标系和空间分辨率的滑坡致灾因素,收集研究区历史滑坡分布清单,并根据历史滑坡分布清单制作非滑坡矢量分布清单;
24、计算模块,用于根据滑坡和非滑坡分布清单,结合滑坡致灾因素数据,制作用于滑坡致灾因素评价的csv文件,并计算每类滑坡致灾因素的方差膨胀因子和基尼不纯度值;
25、致灾因素剔除模块,用于根据设定的阈值,剔除方差膨胀因子超过10的致灾因素以及基尼不纯度值最小的两类致灾因素,将剩余的致灾因素叠加生成通道数为致灾因素数的单个栅格数据;
26、模型构建模块,用于分别构建一维和三维数据结构的滑坡样本作为模型训练的输入,并分别构建基于随机森林和卷积神经网络的滑坡易发性评价模型,其中随机森林模型的超参数通过网格搜寻法确定;
27、模型训练模块,用于将模型构建模块生成的两类训练样本分别输入随机森林模型和卷积神经网络模型开展训练,得到训练完成的两类滑坡易发性评价模型;
28、模型性能评价模块,用于根据选择的精度评价指标分别计算两类模型的性能表现,并输出roc曲线图;
29、滑坡易发性预测模块,用于基于所述模型训练模块中中训练完成的两类滑坡易发性评价模型,逐像元预测全区域内的滑坡易发性指数,两个模型单独生成两种易发性结果,其值分布为0-1之间;
30、滑坡易发性评价模块,用于结合所述滑坡易发性预测模块中提取的两类易发性结果,加权融合两类滑坡易发性指数并生成最终评价结果,然后将数据导入arcgis软件并采取自然间断法生成研究区滑坡易发性区划图。
31、进一步地,所述滑坡和非滑坡分布清单获取模块中,选取的滑坡致灾因素来自于地质构造、地形地貌、水文气象和人类活动,并通过arcgis软件统一构建为tif格式的栅格图层,且非滑坡矢量样本的生成通过缓冲区功能选择。
32、进一步地,所述计算模块中,用于致灾因素评估的csv文件为以样本质心为中心所提取的对应不同滑坡致灾因素图层的值,以该值作为评估致灾因素的数据;分别采用公式(1)和(2)计算第i类滑坡致灾因素的基尼不纯度值gini和方差膨胀因子vifi:
33、
34、
35、其中,pi(c)为在第i个滑坡致灾因素条件下,样本归属于第c个类别的概率,所述类别包括滑坡和非滑坡,c为总类别个数,ri为第i类滑坡致灾因素与其他全部滑坡致灾因素的复相关系数。
36、进一步地,所述致灾因素剔除模块中,剔除方差膨胀因子大于10的致灾因素以及基尼不纯度值排名最后两名的致灾因素,利用剩余因素叠加生成波段为致灾因素个数的致灾因素图层。
37、进一步地,所述模型构建模块中,一维数据结构的训练样本为以样本质心为中心,对应滑坡致灾因素图层数据为元素的列向量;三维数据结构的训练样本在构建时,通过引入地理第一定律,将质心周围一定尺度的致灾因素全部纳入样本表达;随机森林模型的超参数通过网格搜寻法确定,该模型用于拟合一维数据结构的训练样本与滑坡易发性指数间的关系;卷积神经网络模型的超参数通过试错法更新并确定,该模型用于挖掘三维数据结构训练样本内的空间信息。
38、进一步地,所述模型训练模块中,两类滑坡易发性评价模型均采用训练数据中的70%训练模型,并通过30%的数据测试模型的性能。
39、进一步地,所述模型性能评价模块中,通过设定的精度评价指标基于测试样本评估两类模型的性能并输出评价结果。
40、进一步地,所述滑坡易发性预测模块中,训练完成的两类滑坡易发性评价模型基于叠加的滑坡致灾因素图层,逐像元预测滑坡易发性指数值。
41、与现有技术相比,本发明具有的有益效果:
42、1、本发明通过挖掘三维样本信息,能够为模型提供与滑坡本身及周围环境相关的丰富特征,符合地理学第一定律。
43、2、本发明采用基于三维样本的卷积神经网络,能够更精确地拟合致灾因素与滑坡易发性指数间的关系,生成具有更稳定梯度变化的滑坡易发性评价结果。
44、3、本发明通过加权融合基于随机森林模型和卷积神经网络模型的滑坡易发性评价结果,能够缓解卷积神经网络普遍将栅格单元预估为高易发性的现象。