本发明涉及地质勘探领域,具体的涉及一种基于空间数据集分析的异常遥感信息提取方法及装置。
背景技术:
目前所谓的遥感异常信息提取主要是提取的羟基基团和铁染电子缺失引起的异常,常常用来表征与矿化最相关的蚀变岩石的信息。电子异常和基团异常遥感信息主要作为找矿标志,具有地质依据和光谱依据,并且被实践证明和广泛应用。
矿床的形成过程是某种有用元素的逐步富集过程,而这种成矿物质通常由成矿热液搬运和富集的。近矿围岩蚀变是成矿物质逐步富集成矿过程中留下的印迹。最常见的蚀变为:硅化、绢云母化、绿泥石化、云英岩化、重晶石化及锰铁碳酸盐化。地质学家断言绝大多数内生矿床都伴随有其围岩的交代蚀变现象,而且蚀变带范围大于矿体分布的范围数倍至数十倍。尽管有蚀变岩存在也不一定有矿,但大型、特大型内生矿床一般均有强烈且较大范围的围岩蚀变。能够肯定的是蚀变岩石的发现,可以指示找矿方向,增加找到矿床的机会。根据围岩蚀变发现的大型金属、非金属矿床很多,例如:北美、俄罗斯的大部分斑岩铜矿,美国的许多白钨矿和犹他州的大铝矿,我国的铜官山铜矿,西澳大利亚的大型金矿,墨西哥的大铂矿,哈萨克斯坦的刚玉矿以及世界大多数锡矿等,这些实例均证明围岩蚀变现象作为找矿标志的重要意义。
20世纪70年代hunt和他领导的实验室系统地发表了关于矿物岩石波谱测试结果的文章,hunt(1977)(huntg.r..spectralsignatureofparticularminerals,inthevisibleandinfrared[j].geophysics,1977,(42):501-513)利用近300个粒状矿物的测定结果成功地制成一张“光谱特征标记图(spectralsignaturediagram)”,该图可以方便地理解tm和aster遥感数据中常遇到的光谱特征。矿物岩石的各种光谱特征均起因于电子过程或振动过程。hunt之所以能够将不同种类性质各异的200多种矿物的光谱特征在同一张图上表示出来,就是因为大多数矿物的主要成分在vnir区不产生吸收谱带,因此vnir区所获信息来自为数不多的几种结构离子和置换离子的电子过程,以及数目有限的阴离子基团的振动过程。电子过程中fe2+、fe3+占主要地位,也就是说,在矿物(当然也包括岩石和土壤)的vnir光谱中,最常遇到的电子过程特征是以某种形式存在的铁产生的。振动过程中占主要地位的有水和羟基(oh-),此外还有碳酸根
自此,科学家把遥感应用于地质学上,利用遥感大角度、大视眼、信息丰富、定时定位、宏观观测、多波段、立体感强、地形地貌特征明显等特点研究地球表层的地质体,从而为研究地质构造、地质填图、区域地质调查、矿产资源勘查、地质灾害监测等提供帮助。
我国遥感地质经历了从传统的目视解译到计算机自动识别、从定性解释到定量分析的过程。由于遥感技术能在短时间内最大限度的集成地球表面和表层的宏观信息,并以直观清晰的图像形式显示地物景观,能够直接或间接的分析地表地质特征和地下隐伏地质特征,是对物探、化探等勘查手段的有效补充,在一定程度上弥补了上述勘查手段的不足,因此被广泛的应用在地质研究中。经过科技攻关和应用实践,遥感逐渐形成了一套操作性、标准化的方法技术。基础地质方面,遥感应用于地质填图;矿产地质方面,通过遥感识别蚀变异常信息、地质构造信息、与矿有关的其他地质信息,综合地球物理、地球化学、地质构造等多种找矿信息进行矿产资源勘查,取得了丰硕成果,发展了遥感信息提取的技术。该技术在推广中,发现在植被区效果比较差,在全世界范围内,植被区的异常提取也是非常难的,异常提取难,提取的假异常多,对地质矿产勘查来说,增加了分析与判别有效找矿信息的难度。这里所说的分析与判别有效找矿信息是非常重要的。将遥感技术应用于找矿勘查,一般分为三个步骤:数据处理、数据分析和有效找矿信息判别。对应用蚀变遥感异常找矿来说,首先需要提取遥感数据中包含的蚀变遥感异常,然后分析这些异常的性质,判别其与矿化的关系。已有的蚀变遥感异常提取方法提取出来的异常信息是一个包含各种蚀变的信息,也就是说,利用主成分分析技术提取出来的异常是某个特征组合优先排序的结果。目前,蚀变遥感异常应用在找矿中已经取得了巨大的进步,并且取得了很大的成效,蚀变遥感异常是提取蚀变矿物及其组合的遥感信息提取方法。目前异常提取主要为铁染异常和羟基异常两类异常,主要的信息提取为主成分分析方法,但经过对比发现,主成分分析需通过坐标系平移和旋转,从而达到可以识别异常,但如果平移和旋转后与所提取的异常发生了偏离,这种情况也存在。假若在异常提取中,根据主成分分析算法提取的异常存在偏离,那么就有两种情况,其一是提取的异常包含太多的其他异常,假异常多,大量的与找矿关系不大的“面积型”异常出现,其二是提取的目标异常信息损失较多。故上述方法对膏盐类信息提取还具有一定的局限。
技术实现要素:
为解决现有技术不同景观区蚀变遥感异常提取方法难度大,假异常多,大量的与找矿关系不大的“面积型”异常出现,使得找矿没有针对性等问题,本发明提供一种基于空间数据集分析的异常遥感信息提取方法,该方法采用空间数据集分析基础的电子异常和基团异常提取技术获取的异常分布范围小,减少了与找矿关系不大的“面积型”异常,对不同景观区的矿床的侦查针对性强,有利于更快更准的优选找矿靶区。本发明还提供一种基于空间数据集分析的异常遥感信息提取装置。
本发明技术方案如下:
一种基于空间数据集分析的异常遥感信息提取方法,其特征在于,包括如下步骤:
第一步骤,根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,并根据计算得到的特征值和特征向量进行数据分割;
第二步骤,采用主成分分析法对分割后的数据进行异常信息提取,并依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验;
第三步骤,切割和校验后的数据再结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。
进一步地,所述第一步骤在获取遥感图像数据后先进行预处理,所述预处理包括去边界处理和去干扰处理,并在预处理后再采用空间数据集分析的方式先计算波段协方差矩阵,再根据协方差矩阵计算得到特征向量和特征值。
进一步地,所述第二步骤是利用正态分布进行异常信息的切割,将切割后的数据采用蚀变异常中心坐标与样品坐标重合度比较,利用多元线性回归法获取回归平方和以及残差平方和来衡量回归效果并结合自变量值检验实现异常信息的校验和评价。
进一步地,所述第二步骤采用主成分分析法对分割后的数据进行异常信息提取,获取异常信息提取的本征向量,再对各波段的异常信息的本征向量进行符号判别处理,并在符号判别处理后进行异常信息的切割处理。
进一步地,所述第一步骤中所述预处理的去边界处理是将各波段的遥感图像数据结合二值图像处理技术去除边界信息,所述预处理的去干扰处理采用比值法、切割法、q值法和/或光谱角法;
和/或,第三步骤先对切割和校验后的数据进行异常滤波优化处理,再结合由遥感图像数据经波段选择合成的假彩色图像,所述的异常滤波优化处理依次采用q值法和中值滤波法进行滤波处理。
一种基于空间数据集分析的异常遥感信息提取装置,其特征在于,包括依次连接的第一装置、第二装置和第三装置,
所述第一装置,根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,并根据计算得到的特征值和特征向量进行数据分割;
所述第二装置,采用主成分分析法对分割后的数据进行异常信息提取,并依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验;
所述第三装置,切割和校验后的数据再结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。
进一步地,所述第一装置包括依次连接的图像获取装置、预处理装置、空间数据集分析器和数据分割器,以及与图像获取装置相连的波段选择处理装置,所述图像获取装置用于获取原始的遥感图像数据,所述遥感图像数据为多波段的遥感图像数据;所述预处理装置用于对获取的遥感图像数据进行预处理,所述预处理包括去边界处理和去干扰处理;所述空间数据集分析器根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值;所述数据分割器根据计算得到的特征值和特征向量基于突出主要信息的原则进行数据分割;所述波段选择处理装置用于对所述遥感图像数据进行波段选择,合成假彩色图像;
所述第二装置包括相互连接的异常提取装置和异常切割校验装置,所述异常提取装置采用主成分分析法对分割后的数据进行异常信息提取,所述异常切割校验装置依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验;
所述第三装置包括相互连接的滤波优化装置和合成装置,所述滤波优化装置将切割和校验后的数据进行异常滤波优化处理,所述合成装置将异常滤波优化处理的数据结合第一装置的波段选择处理装置输出的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。
进一步地,所述第二装置还包括数据判别装置,所述数据判别装置设置在异常提取装置和异常切割校验装置之间,所述异常提取装置采用主成分分析法对分割后的数据进行异常信息提取从而获取异常信息提取的本征向量,再由数据判别装置对各波段的异常信息的本征向量进行符号判别处理,并在符号判别处理后由异常切割校验装置进行异常信息的切割和校验处理。
进一步地,所述第二装置的异常切割校验装置利用正态分布进行异常信息的切割,将切割后的数据采用蚀变异常中心坐标与样品坐标重合度比较,利用多元线性回归法获取回归平方和以及残差平方和来衡量回归效果并结合自变量值检验实现异常信息的校验和评价。
进一步地,所述预处理装置包括去边界处理模块和去干扰处理模块,所述去边界处理模块,用于将各波段的原始的遥感图像结合二值图像处理技术进行去边界处理,得到去边界后的遥感图像数据;所述去干扰处理模块,用于采用比值法、切割法、q值法和/或光谱角法对所述去除边界后的遥感图像数据去干扰,得到去除干扰后的遥感图像;
和/或,所述第三装置的所述滤波优化装置包括q值法滤波模块和中值法滤波模块;所述q值法滤波模块用于对所述异常信息进行q值法滤波,所述中值法滤波模块用于对所述q值法滤波后的图像数据进行中值法滤波处理。
本发明的技术效果如下:
本发明提供一种基于空间数据集分析的异常遥感信息提取方法,在获取遥感图像数据后,根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,并根据计算得到的特征值和特征向量进行数据分割,再采用主成分分析法对分割后的数据进行异常信息提取,即能够利用空间数据集的分析方法,来去除提取电子异常和基团异常相关的干扰,从而使得主成分分析在空间变换的时候能够把电子异常或者基团异常的特征抓住,这样提取出来的异常能够更加与实际情况相近,将其结果有针对性的应用于不同景观区得矿床的遥感找矿信息提取技术。用正态分布和多元线性回归法分别进行异常信息的切割和校验,精确获取参数,结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像,本发明能够解决不同景观区蚀变遥感异常提取方法难度大,假异常多,大量的与找矿关系不大的“面积型”异常出现,找矿没有针对性等多个问题。采用空间数据集分析基础的电子异常和基团异常提取技术获取的异常分布范围小,减少了与找矿关系不大的“面积型”异常,对不同景观区的矿床的勘查针对性强,有利于更快更准的优选找矿靶区,对于矿产勘查工作可以起到节省时间、节约人力物力,事半功倍的作用,是科学技术进步促进生产发展的新技术。
本发明还涉及一种基于空间数据集分析的异常遥感信息提取装置,该提取装置与本发明基于空间数据集分析的异常遥感信息提取方法相对应,也可以理解为是实现本发明基于空间数据集分析的异常遥感信息提取方法的装置,设置依次连接的第一装置、第二装置和第三装置,各装置协同工作,第一装置根据电子异常和基团异常的特征,对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,根据分析,特征向量和特征值所代表的地理类型,根据计算得到的特征值和特征向量可以分割空间数据集,再由第二装置采用主成分分析法对分割后的数据进行异常信息提取,依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验,由第三装置将切割和校验后的数据结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。本发明的提取装置通过分析空间数据集,去除变换过程中不利的统计因素,不断的减少干扰来实现不同景观区的跨越式蚀变遥感异常提取的工作,配合主成分分析在遥感蚀变异常提取中具有非常好的效果,本发明采用空间数据集的分析方法结合主成分分析算法解决了遥感信息提取的异常存在偏离导致的种种问题,在中国西部戈壁荒漠区已经取得了非常好的结果。
附图说明
图1是本发明基于空间数据集分析的异常遥感信息提取方法的优选流程图。
图2是预处理中的边界信息去除对比图。
图3是空间数据集分析示意图。
图4a-4c是空间数据集分割示意图。
图5是最终输出的一幅遥感异常图像。
图6是本发明基于空间数据集分析的异常遥感信息提取装置的优选结构框图。
具体实施方式
下面结合附图对本发明进行说明。
本发明涉及一种基于空间数据集分析的异常遥感信息提取方法,包括:第一步骤,根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,并根据计算得到的特征值和特征向量进行数据分割;第二步骤,采用主成分分析法对分割后的数据进行异常信息提取,并依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验;第三步骤,切割和校验后的数据再结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。也就是说,采用空间数据集分析基础的电子异常和基团异常提取技术获取的异常分布范围小,减少了与找矿关系不大的“面积型”异常,对不同景观区的矿床的侦查针对性强,有利于更快更准的优选找矿靶区。还配合主成分分析法对分割后的数据进行异常信息提取以及结合栅格矢量合成技术,实现电子异常和基团异常的遥感信息提取,这样提取的异常具有很好的结果。
优选地,本发明基于空间数据集分析的异常遥感信息提取方法的主要目的是为了电子异常和基团异常信息提取,该方法包括:第一步骤s1-s4,s1:获取遥感图像数据,该遥感图像数据为多波段的遥感图像数据;s2:对所述遥感图像数据进行预处理,这里所述的预处理包括去边界处理和去干扰处理;以及对所述遥感图像数据进行波段选择,合成假彩色图像;s3:采用空间数据集分析的方式先计算波段协方差矩阵,再根据协方差矩阵计算得到特征向量和特征值;s4:根据计算获得的特征值和特征向量进行数据分割。第二步骤s5-s8,s5:采用主成分分析法对分割后的数据进行异常信息提取,获取异常信息提取的本征向量;s6:对各波段的异常信息的本征向量进行符号判别处理;s7:利用正态分布进行异常信息的切割,将切割后的数据采用蚀变异常中心坐标与样品坐标重合度比较,利用多元线性回归法获取回归平方和以及残差平方和来衡量回归效果并结合自变量值检验实现异常信息的校验和评价;s8:判断所述异常信息是否满足异常特征,若不满足,则对所述异常信息进行检验并返回第一步骤的s3重新进行空间数据集分析,在满足异常特征时进入第三步骤。第三步骤s9-s10,s9:对切割和校验后的数据进行异常滤波优化处理,得到优化后的异常信息;s10:将优化后的异常信息与所述合成的假彩色图像合成,利用坐标分层把栅格和矢量进行叠加处理,得到适合人眼观察的遥感异常图像。
下面结合图1所示的优选流程图对本发明基于空间数据集分析的异常遥感信息提取方法进行详细说明。
第一步骤中,步骤s1:获取遥感图像数据;所述遥感图像数据是多波段的遥感图像数据;在本实施例中,上述遥感是指非接触的,远距离的探测技术。一般指运用传感器/遥感器对物体的电磁波的辐射、反射特性的探测。遥感是通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标条件下探测目标地物、获取其反射、辐射或散射的电磁波信息。遥感图像数据是指运载工具中搭载的电磁波获取装置采集到的、记载在胶片上的电磁波信息;该电磁波信息在不同的波段内采集到的图片合成多通道的图像数据,该图像数据是数字化的数据。该步骤可理解为是下一步骤开始前进行的数据选择与输入,数据选择可以是landsat系列数据、aster系列数据和worldview3系列数据等具有短波红外波段的数据。对于不同的数据格式进行输入并把可见光-短波红外波段进行合成,使其具有统一的分辨率。
步骤s2:对该遥感图像数据进行图像数据预处理,以及对该遥感图像数据进行波段选择,合成假彩色图像。其中,图像数据预处理,是指为消除图像中无关的,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,而在图像分析前进行的一系列数据处理过程。在本实施例中,预处理可包括去边界处理和去干扰处理,优选去边界处理是将各波段的遥感图像数据结合二值图像处理技术去除边界信息,优选去干扰处理采用比值法、切割法、q值法和/或光谱角法。下面对本发明采用的几种预处理方法进行详细的介绍。
上述边界即是指边框,边界信息即是边框信息。合成后图像可能不同波段范围不一样,各波段在平面(代表地球表面)的坐标(x,y)是不重合的,主要反映在边界上的一些信息不重合,在获取遥感图像数据时,每个波段所获取的数据是不一样的,如图2所示对比图中的符号a所示,如果所研究的区域正好含有边界信息,这将会影响数据处理的准确度,此时需要将边界信息去除,使得每一个波段都含有有效信息。本发明所采用的方法是,对每一个波段是否含有信息进行判断,如果含有信息,则赋值为1,没有信息则赋值为0,生成一个二值图像,最后把每一个波段生成的二值图像相乘,生成一个新的二值图像,最后再将每个波段对应的遥感数据与生成的新的二值图像相乘,实现去除边界信息的目的。具体公式如下:
其中n指所使用的遥感图像波段总数,i=1,…,n,xi和yi指分别指i波段去除波段前后的值。如图2所示的符号b代表的去除边界信息后的图像。
上述干扰是指对图像数据分析有影响的数据,像噪声信息、遮挡信息等等都属于干扰信息,在遥感图像数据中,往往有云、水体、阴影区、白泥地、冰雪等典型的可以直接识别的干扰信息。由于一般干扰地物能够在tm/etm的743彩色合成图像或aster的631彩色合成图像都能够有明显的特征,比如云的白色等,故一般情况下,目测就可以判断存在干扰。对于干扰的去除有比值法、高端或低端切割法、q值法、光谱角法等。
上述高端或低端切割法是利用干扰地物在遥感图像上某个波段有高反射或强吸收的特征,即某波段干扰地物有高值或者低值,比如水体在tm/etm的第7波段有低值,采用低端切割方法处理,而云在tm/etm的第1波段有高值,采用高端切割方法处理,白泥地在tm/etm的第3波段有高值,采用高端切割方法处理等。公式如下:
其中,i=0,…,n,n指所使用的遥感图像波段总数,xi和yi指分别指i波段去除干扰信息前和后的波段值,b∈[1,…,n],cb是常数,xb是原始b波段对应的值。这个公式的目的就是:给定一个约束的条件,使得这个条件大于或小于某一个数值的图像保留下来,其他的全部被赋值为零。
上述比值法常用于去除阴影、水体、冰雪、白泥地等多种干扰,首先判断干扰地物的各个波段的波谱特征,比如,tm/etm图像的阴影区第一波段明显大于地7波段,因此,采用第7波段比第1波段的方法,设定一个阈值进行去除,植被采用第5波段比第4波段或者第3波段比第4波段的方法等等。公式如下:
其中,i=0,…,n,n指所使用的遥感图像波段总数,xi和yi指分别指i波段去除“尖锐”信息前和后的波段值,a∈[1,…,n],ca是常数,xa,xb是原始a、b波段对应的值。这个公式的目的就是:给定一个约束的条件,使得这个条件大于或小于某一个数值的图像保留下来,其他的全部被赋值为零。
上述q值法主要解决雪边或湖边湿地、干河道、冲积区、薄云等干扰。定义q值如下:
q=(xa×ka-xb×kb)/xc×kc
其中,xa,xb,xc为参与主成分分析的波段,ka,kb,kc为参与主成分变化的xa,xb,xc对应本征向量的值。
上述光谱角法常用于去除薄云等去除难度较大的干扰。光谱角法把每一个多维空间点以空间向量来表征,对比空间向量角的相似性。该方法是一种监督分类,要求对每一类别有一个已知参考谱。此参考谱可以是地面测得存入参考谱库,也可以是从已知条件的图面单元做感兴趣区统计,存入参考谱库。公式如下:
式中(α,β)为n维向量α,β的内积,按内积定义
(α,β)=α1β1+α2β2+…+αnβn
当α,β为列向量时(α,β)=α′β+β′α
|α|、|β|为向量α、β的长度,
求出α,β的内积和长度,便可求出夹角的cos,查表可得其夹角。
步骤s3:根据电子异常和基团异常的特征,采用特征值分析空间数据集的方法来分析电子异常和基团异常的特征情况。先是计算波段协方差矩阵,能够得出波段之间相关性(协变)的特征。根据协方差定义,如果给定两个随机变量(向量)x,y,那么两个变量的协方差如下:
cov(x,y)=e(xy)-e(x)e(y)
经过前面的处理,认为每个波段都是随机变量,假设n个波段参与计算,那么可以得出协方差矩阵
根据协方差矩阵计算特征向量和特征值ct=λt
求得的t为特征向量,l为特征值,那么根据分析,特征值和特征向量所代表的地物类型,根据特征值和特征向量可以分割空间数据集。如图3所示的空间数据集分析示意图,显示了某类地物特征和空间数据特征。
步骤s4:根据计算获得的特征值和特征向量进行数据分割,给定ε,如果特征值大于ε那么可以进行分割λi>εj
假设数据矩阵为
根据λ和ε的关系,对数据进行分割,分割主要为突出主要信息,如图4a-4c所示的空间数据集分割示意图,其中,图4a为分割前数据,图4b和图4c均为分割后的两数据:数据1和数据2。
分割后的数据特征d1……dm如下:
……
第二步骤中,步骤s5:采用主成分分析法对分割后的数据进行异常信息提取,获取异常信息提取的本征向量。主成分分析法原理为:第一步是移动坐标原点,使平均值为零。在这一步骤后,可将坐标旋转,使一个坐标轴与数据具有最大分布的方向相符合,这个旋转后的新轴即第一主分量,它占有总变异的第一大分额。垂直于它的另一个坐标轴则代表其余变异的方向,这就是第二主分量。在两维以上的多维空间里,这样的处理将继续进行,以确定一组直角坐标轴,这些轴逐渐将全部变异分配(消耗)掉,它并不能全部包含在一个次一级主分量中,而是有多少个原始参数就会有几个主分量。各主分量变异值的总和与变换前的变异值总和相等,这就是信息量守恒。
原始有几个波段的数据就影射到几个新的主分量上。各主分量是本征向量线性相加组合而成的。假设有p个新变量ξ1,ξ2,……,ξp,使这p个新变量是原变量x的线性函数,而且彼此不相关,即
实际上,就是求出p2个常数lik(i,k=1,…,p)按矩阵表示:
cl=λl(3)
由式(2)、(3)可知:l可称为式(2)的变换矩阵,也可称为式(3)的本征矩阵,各lik是此本征向量的分量;λ为协方差矩阵c的本征值。l和l有以下特点:
求协方差矩c
求本征值λ|λi|-c=0
求本征向量l(λi-c)l=0
在n波段数据坐标轴转置的时候,协方差矩阵也将被变换,变换之后各波段之间的协方差变为零。各点与其重心距离的平方和即为本征值之和,这个和可表示为s。在一定意义上,可以说第一个分量“构成”的变异与总变异的比例是l1/s,前两个分量“构成”的变异与总变异之比是(l1+l2)/s,如此等等。有时为了方便譬如可以说“前4个分量构成变异的p%”。
步骤s6:对各波段的异常信息的本征向量进行符号判别处理。某主分量的本征值就是若消去该主分量后,对相应的本征向量所引入的均方误差值。对于求出的本征向量,按照与参与主成分分析的各个波段进行对应,考虑符合蚀变异常特征的那个本征向量,一般为第4个向量。考虑第四个本征向量的各个分量是否满足蚀变异常信息对应的特征,若不符合,需对该第四本征向量进行符合转化。举例来说,如下表1:
表1
如果某一异常信息对应的本征向量的分量的特征为va4>vb4<vc4>vd4,那么,va4、vc4一定与vb4、vd4的符号相反,而va4与vc4、vb4与vd4的符号相同。如果用于蚀变遥感切割的本征向量4要求vc4为正号,而计算结果为负号,则需要经过转换变成正号,即进行取反处理,公式如下:
其中,
步骤s7:异常优化和校验:即依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验,具体地,利用正态分布进行异常信息的切割,将切割后的数据采用蚀变异常中心坐标与样品坐标重合度比较,利用多元线性回归法获取回归平方和以及残差平方和来衡量回归效果并结合自变量值检验实现异常信息的校验和评价。
由于在主成分分析前,经过处理后使得每个波段的直方图为正态分布,转化后的异常主分量(即某本征向量)直方图也为正态分布,我们利用正态分布的有关理论进行异常的切割。
正态分布公式如下:
其中,x为随机变量,σ称为标准误差。对于主成分分析的多元分析来说,σ称为标准离差,定义如下:
n为样本数,
切割异常时有了这一尺度可以减少主观任意性,异常分级是按式计算的:
l=127.5+k*sf;或l=127.5+k*127.5/4;h=l+1
式中,h、l分别为切割高、低门限值;k为倍数;σ为标准离差;sk为比例因子;sf和sk由主分量分析报告给出。
对异常分割后的数据x采用其蚀变异常中心坐标与我们既定样品y的坐标其重合度进行比较,如果重合度大于某个给定的值ε,那么定义y为给定的检验变量(矿点或已知异常点),x1,x2,…,xn为n个自变量(对应的变化后的数据x),共观测m次,首先假设y与n个自变量之间存在线性关系:
y=a0+a1×x1+a2x2+…+anxn+ε
式中,a0,a1,a2,…,an为回归系数,是常数,表示在其它自变量不变情况下,xj(j=1,2,…n)增加或减少一个单位时的平均变化量,ε为去除n个自变量对y的影响后的随机误差,上式称为多元线性回归模型。多元线性回归其条件是(1)y与x1,x2,…,xn之间具有线性关系;(2)每个观测值yj(j=1,2,…,m)相互独立;(3)ε服从正态分布。
首先用a0+a1×x1+a2x2+…+anxn来估计y的均值e(y),假定ε服从均值为0,方差为σ2的正态分布,即ε~n(0,σ2),则y服从均值为e(y),方差为的σ2的正态分布,即y~n[e(y),σ2],那么m组样本观测数据:
x11,x12,…,x1n,y1
x21,x22,…,x2n,y2
…………………
xm1,xm2,…,xmn,ym
式中,xij表示xj在第i次的观测值。有如下公式:
上式为n元线性回归的数学模型,式中,a0,a1,a2,…,an为n+1个待定参数,ε1,ε2,…,εm为m个相互独立并且服从同一正态分布的随机变量。为了简化表示,利用矩阵形式:
则n元线性回归的数学模型为
y=ax+ε
根据公式来进行最小二乘估计,首先假设b0,b1,b2,…,bn分别为n+1个回归系数a0,a1,a2,…,an的最小二乘估计值,于是观测值如下表示:
yj=b0xj1+b1xj2+…+bnxjn+ej
ej为误差εj的估计值,称残差,假设
上述式中,j=1,2,…,m。残差ej表示实际值yj与估计值
达到最小,根据高等数学原理,极值在函数微分值为0处,确立方程,
从上述公式中得到正规方程,
根据矩阵x,系数两边等式用c和d表示,则,
那么,正规方程的矩阵形式为
cb=(x′x)b=x′y=d
b为未知向量,如果矩阵系数c满秩,其逆矩阵存在,可以反解出未知向量b,
b=a-1d=(x′x)x′y
向量b为优化参数。
回归方程的假设检验和评价可采用离差分析法。定义总变异,
ss为回归平方和,是回归值
ms为残差平方和,是实测值yj与回归值
总变异自由度为m-1。
如果观测值给定,总变异确定,可以用ss和ms来衡量回归效果,ss越大回归效果越显著,ms越大回归效果不好。
为了检验总的回归效果,定义了无量纲指标-决定系数r2来表示,
r2反映回归离差对总变异的贡献比例。r=r1/2称为复相关系数,反映全部自变量与因变量的相关程度。r2和r值越大,回归效果越好。
步骤s8:判断所述异常信息是否满足异常特征,若不满足,则对所述异常信息进行检验并返回第一步骤的s3重新进行空间数据集分析,在满足异常特征时进入第三步骤。也就是说,对满足预设回归效果的所述切割后的异常信息的蚀变异常中心坐标的每个分量进行假设检验,对满足检验条件的分量保留,获得优化的异常信息。
上述为总体回归效果检验,不能说明每个自变量x1,x2,…,xn对因变量y都重要,有些自变量对因变量可能不起作用,或者作用为其他自变量所代替,这就需要把这些自变量从回归方程中剔除,建议每个自变量xi是否显著,假设h0:ai=0,i=1,2,…n。
(1)f值检验
f检验(f-test),最常用的别名叫做联合假设检验(jointhypothesestest),此外也称方差比率检验、方差齐性检验。它是一种在零假设(nullhypothesis,h0)之下,统计值服从f-分布的检验。
在h0:ai=0假设下,
对给定置信度α,从f值分布表中查与β对应的临界值fβ,如果|fi|〉fβ,拒绝假设h0,认为n个自变量总体回归效果显著,反之,总体回归效果不显著。
(2)t检验
t检验,亦称studentt检验(student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。在h0:ai=0假设下,t检验公式
对给定检验水平β,从t值分布表中查与β对应的临界值tβ,如果|ti|〉tβ,拒绝假设h0,认为ai与0值有显著差异,不应剔除,反之,应剔除。
(3)p值检验
假设检验是推断统计中的一项重要内容。用sas、spss等专业统计软件进行假设检验,在假设检验中常见到p值(p-value,probability,pr),p值是进行检验决策的另一个依据。
p值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的p值,一般以p<0.05为有统计学差异,p<0.01为有显著统计学差异,p<0.001为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于0.05、0.01、0.001。实际上,p值不能赋予数据任何重要性,只能说明某事件发生的几率。统计结果中显示pr>f,也可写成pr(>f),p=p{f0.05>f}或p=p{f0.01>f}。
假设h0:ai=0,服从自由度分别为1与m-n-1的p分布统计量,
对给定检验水平β,从p值分布表中可以查到临界值pβ(1,m-n-1),如果pi〉pβ(1,m-n-1),拒绝假设h0,认为xi对y值有重要作用,不应剔除,反之,应剔除。
第三步骤中,步骤s9:对切割和校验后的数据进行异常滤波优化处理,得到优化后的异常信息。为防止去除过多,伤害有价值信息,在异常提取之后优选进一步仔细观察是否存在残余干扰造成的假异常,采取数字手段通过后处理对异常加以优化。优选采用q值法进行后处理,q定义为:q=(%5×k5-%7×k7)/%1×k1
式中(%n)表示tm第n波段或数据库第n通道中的像素值,如%1表示tm第1波段或数据库第1通道中的像素值,%5表示tm第5波段或数据库第5通道中的像素值,%7表示tm第7波段或数据库第7通道中的像素值;kn表示tm第n波段的贡献系数(由pca本征向量所决定),如k1表示tm第1波段的贡献系数,k5表示tm第5波段的贡献系数,k7表示tm第7波段的贡献系数。
然后进行中值滤波进一步优化异常。中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为
g(x,y)=med{f(x-k,y-l),(k,l∈w)}
其中,f(x,y),g(x,y)分别为原始图像和处理后图像。w为二维模板,通常为3*3,5*5区域,也可以是不同的形状,如线状,圆形,十字形,圆环形等。
步骤s10:将优化后的异常信息与所述合成的假彩色图像合成,利用坐标分层把栅格和矢量进行叠加处理,得到适合人眼观察的遥感异常图像。也就是说,对于底图采用具有信息熵最大的波段组合的假彩色图,矢量采用具有相同投影的点线面表示。利用坐标分层把栅格和矢量进行叠加处理。从而形成适合人眼习惯的图像。
矢量f(x,y,z),x,y为对应的坐标,z为特征值,f(x,y,z)为矢量值,栅格g(x',y'),x和y为对应的坐标,g(x',y')为栅格灰度值,令,x=x'y=y',从而实现栅格g(x',y')灰度值和矢量g(x',y')的叠加。
最终输出一幅适合人眼观察的矿化蚀变遥感异常图像,可输出成为jpg或者tif格式的最终图像。如图5所示最终图像能够显示电子异常和矿化的遥感蚀变异常。
本发明还涉及一种基于空间数据集分析的异常遥感信息提取装置,该提取装置与本发明基于空间数据集分析的异常遥感信息提取方法相对应,也可以理解为是实现本发明基于空间数据集分析的异常遥感信息提取方法的装置,参见图6所示的优选结构框图,设置依次连接的第一装置、第二装置和第三装置。具体地,第一装置,根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值,并根据计算得到的特征值和特征向量进行数据分割。优选地,第一装置包括依次连接的图像获取装置、预处理装置、空间数据集分析器和数据分割器,以及与图像获取装置相连的波段选择处理装置,所述图像获取装置用于获取原始的遥感图像数据,所述遥感图像数据为多波段的遥感图像数据;所述预处理装置用于对获取的遥感图像数据进行预处理,所述预处理包括去边界处理和去干扰处理;所述空间数据集分析器根据电子异常和基团异常的特征对获取的遥感图像数据采用空间数据集分析的方式计算特征向量和特征值;所述数据分割器根据计算得到的特征值和特征向量基于突出主要信息的原则进行数据分割;所述波段选择处理装置用于对所述遥感图像数据进行波段选择,合成假彩色图像。其中,预处理装置优选包括去边界处理模块和去干扰处理模块,所述去边界处理模块,用于将各波段的原始的遥感图像结合二值图像处理技术进行去边界处理,得到去边界后的遥感图像数据;所述去干扰处理模块,用于采用比值法、切割法、q值法和/或光谱角法对所述去除边界后的遥感图像数据去干扰,得到去除干扰后的遥感图像数据。
第二装置,采用主成分分析法对分割后的数据进行异常信息提取,并依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验。具体地,第二装置包括相互连接的异常提取装置和异常切割校验装置,所述异常提取装置与第一装置的数据分割器相连,异常提取装置采用主成分分析法对分割后的数据进行异常信息提取,所述异常切割校验装置依次利用正态分布和多元线性回归法分别进行异常信息的切割和校验,进一步地,异常切割校验装置利用正态分布进行异常信息的切割,将切割后的数据采用蚀变异常中心坐标与样品坐标重合度比较,利用多元线性回归法获取回归平方和以及残差平方和来衡量回归效果并结合自变量值检验实现异常信息的校验和评价。此外,进一步优选地,第二装置还可以包括数据判别装置,所述数据判别装置设置在异常提取装置和异常切割校验装置之间,异常提取装置采用主成分分析法对分割后的数据进行异常信息提取从而获取异常信息提取的本征向量,再由数据判别装置对各波段的异常信息的本征向量进行符号判别处理,并在符号判别处理后由异常切割校验装置进行异常信息的切割和校验处理。
第三装置,切割和校验后的数据再结合由遥感图像数据经波段选择合成的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。优选地,第三装置包括相互连接的滤波优化装置和合成装置,所述滤波优化装置将切割和校验后的数据进行异常滤波优化处理,所述合成装置将异常滤波优化处理的数据结合第一装置的波段选择处理装置输出的假彩色图像,利用坐标分层把栅格和矢量进行叠加处理,进而输出适合人眼观察的遥感异常图像。其中,滤波优化装置包括q值法滤波模块和中值法滤波模块;所述q值法滤波模块用于对所述异常信息进行q值法滤波,所述中值法滤波模块用于对所述q值法滤波后的图像数据进行中值法滤波处理。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。