基于多卷积自编码神经网络的多元化探异常识别方法与流程

文档序号:15761585发布日期:2018-10-26 19:22阅读:1052来源:国知局
基于多卷积自编码神经网络的多元化探异常识别方法与流程

本发明涉及地球化探异常识别领域、人工智能应用领域,尤其涉及一种基于多个卷积自编码神经网络模型的多元地球化学异常识别方法。



背景技术:

多元地球化探异常识别是矿产勘探的重要工作之一,汇编多元素综合地球化学异常图,仍是目前区域化探数据处理中需要不断探索的课题化探异常识别的方法很多,近年来,分形/多重分形模型,组分数据分析和机器学习在化探异常识别领域被广泛使用。传统的化探异常识别方法,有时会存在一些问题,如地球化学数据之间会存在虚假的相关性,识别低地球化学背景的弱异常方面的局限性等。分析/多重分形模型考虑到地球化学模式的频率和空间方差,可以在复杂的地质背景下高效地识别地球化探异常;组分数据分析,利用对数比变换可以取消数据之间的虚假相关性。随着人工智能领域的技术发展和机器学习的广泛应用,神经网络深层次隐含结构的特征学习能力使其在化探异常识别领域引起了广泛关注。神经网络的优势在于它们可以学习并且拟合复杂的非线性映射,并且无需假设数据的分布便可以利用数据集中包含的信息。研究表明,深度自编码等神经网络模型可以成功地整合多元素地球化学数据并且拟合多元地球化学背景。然而,由于现存神经网络模型未能利用多元化探数据的局部空间自相关,其异常识别能力还有提升空间,因此需要对现存的神经网络模型进行扩展以提高其在多元化探背景学习的性能。



技术实现要素:

本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于多个卷积自编码神经网络模型的多元地球化学异常识别方法与系统,以实现复杂地质环境下的多元化探异常识别,为区域性找矿圈定潜在含矿单元提供技术支持。

根据本发明的其中一方面,本发明解决其技术问题所采用的技术方案是:构造一种多卷积自编码神经网络的多元化探异常识别方法,包括以下步骤:

s1、获取原始数据,原始数据为依据规则网格采样所得的采样数据,采样数据中每个采样点包含多个元素的浓度值;利用空间插值算法对原始数据中的缺失样本数据进行补全,并且对补全后的数据进行归一化处理;

s2、利用多个cae模型并行处理学习所述多个元素的化学元素背景,学习时,是以归一化的样本数据为cae模型输入数据,为每一个元素提供一个同超参同网络结构的cae;

s3、计算所述多个cae模型的输入数据与输出数据之间的欧式距离作为异常得分;

s4、将所述异常得分映射到地理空间上,生成多元化探异常图。

进一步地,在本发明的多卷积自编码神经网络的多元化探异常识别方法中,步骤s1中的空间插值算法为idw法。

进一步地,在本发明的多卷积自编码神经网络的多元化探异常识别方法中,步骤s2中,cae模型中卷积窗口大小为根据局部元素相关范围设定,且利用池化法以保证多元素背景特征的平移不变性、旋转不变性、尺度不变性,利用多个cae模型并行训练,分别提取元素背景特征,再以背景特征重构元素背景,作为输出数据。

进一步地,在本发明的多卷积自编码神经网络的多元化探异常识别方法中,所述池化法中池化设定为最大值池化法。

进一步地,在本发明的多卷积自编码神经网络的多元化探异常识别方法中,所述卷积窗口大小为12*12。

实施本发明的多卷积自编码神经网络的多元化探异常识别方法,具有以下有益效果:本发明将卷积自编码神经网络与欧氏距离结合,采用多个cae模型并行训练建模的方法,每个cae学习一个元素的背景特征方式,避免了单模型处理能力不足以及多元数据降维时造成的信息损耗,有效提取复杂地质环境下的多元化探数据的普遍规律(即地球化学背景),深度挖掘各元素中最能体现无矿背景区特性的数据以此提高各元素背景拟合精度,从而有效提高化探有价值异常识别的准确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例的方法流程图;

图2是本发明实施例的闽西铁矿带研究区的缺失样本补齐图;

图3是本发明对空间域数据进行cae模型训练的流程图;

图4是本发明输出的化探异常地图以及利用已知铁矿点对异常地图的roc曲线评估。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。

如图1所示,其为本发明的多卷积自编码神经网络模型的多元地球化学异常识别方法一实施例的流程图,包括以下步骤:

步骤1)数据预处理:获取原始数据,原始数据为依据规则网格(如正方形、矩形或菱形)采样所得的采样数据,采样数据中每个采样点包含cu、zn、pb、mn、fe2o3元素的浓度值;分别对cu、zn、pb、mn、fe2o3使用idw方法补全空白无采样区的样本数据,如图2所示。对补全后的数据进行归一化处理,将数据转化为(0,1)之间的小数,提高迭代求解的收敛速度和精度。

步骤2)多元地球化学背景学习:即利用5个卷积自编码(cae)模型并行学习上述cu、zn、pb、mn、fe2o3共5个化学元素背景,以归一化后的样本数据为输入,为每一个地球化学元素提供一个同超参同网络结构的cae,其中cae模型中卷积窗口大小根据局部元素相关范围设定为12*12,池化设定为最大值池化法,利用多个cae模型并行训练,分别提取其元素背景特征,再以特征重构元素背景,如图3所示;cae模型训练的计算细节如图3中第一层所示,通过灰色窗口提取局部元素背景特征,完成卷积层计算,卷积采用多卷积特征图以保证化探研究区内的同一局部范围的不同背景特征的提取,再通过最大值池化层实现元素背景特征的平移不变性、旋转不变性、尺度不变性,最后通过反卷积和反池化完成元素背景特征重构,重构的元素背景即为cae模型的输出数据。

步骤3)异常值计算:计算cae模型的输入数据(即归一化数据)与cae模型的输出值之间的欧氏距离。

l:样本异常值

xk:样本归一化的数据中元素k的含量

x'k:模型输出数据中元素k的含量

n:化学元素的个数

步骤4)异常图生成,将异常得分映射到地理空间上,生成多元化探异常图(如图4(a)所示)。

为了给生成多元化探异常图做结果评价,先利用空间插值算法idw对异常图做空间插值,再利用研究区内已知矿点对异常识别结果进行评估,采用roc曲线,计算auc值,auc大于50%证明识别有效性,本实施例中auc值为84%(roc曲线如图4(b)所示),同时student’st指标为3.54,大于1.96的空间相关性评价标准,故本发明识别的异常与研究区已知铁矿具有较大空间相关性。

异常识别效果评价:利用研究区内已知矿点对异常地图进行评估,采用roc曲线,计算auc值。auc值大于50%,证明异常识别的有效性,student’st统计指标大于1.96,证明是模型识别的异常与已知铁矿具有较大空间相关性。本实施例中,auc值为84%(图4(b)所示),优于普通bp神经网络的auc值(59%)以及无局部空间自相关神经网络模型——自编码器模型的auc值(76.76%)。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1