一种沉积型稀土La元素含量的高光谱反演方法与流程

文档序号:19483799发布日期:2019-12-21 03:36阅读:355来源:国知局
一种沉积型稀土La元素含量的高光谱反演方法与流程
本发明涉及土壤/岩石成分高光谱分析
技术领域
,更具体地说,涉及一种沉积型稀土la元素含量的高光谱反演方法。
背景技术
:稀土作为国家关键矿产资源,在工业4.0和第四次科技革命中占有重要的战略地位,在战略性新兴产业中能起到“关键作用”,往往现实处“不可替代性”,因而成为近年来的一个研究热点。因此,稀土元素的快速无损检测对加快稀土资源的快速筛查评价和摸清稀土资源现状有着重要的意义。近年来的调查研究已初步摸清了重点省份稀土资源家底,实现从战略研究到战略侦察再到找矿突破的跨越,但是探测技术手段有限,主要是从传统矿山企业通过“边采边探”增加资源量,发现的新矿产地相对较少。虽然有新的现代分析仪器方法的建立,如稀土元素常用的icp-aes、icp-ms方法,其成本依然高昂、耗时较长。虽然部分仪器如pxrf(手持式x射线荧光分析仪)能够现场快速进行定量-半定量测试,但目前只能进行点上样品的分析测试,短时间内无法进行区域性大规模的扫面式筛查。由于稀土其特殊的电子构型,它们的4f电子f-f组态之间的跃迁,在可见光-近红外有其特有的波普吸收特征,因此,可见-近红外光谱可以反映稀土的含量。高光谱技术具有宏观、经济、快捷、准确等技术优势,近些年在微量元素半定量-定量反演及区域面积性含量分布反演评价方面已展现出良好的应用价值。国内外基于高光谱分析的稀土含量分析与找矿研究已有初步的探索,但侧重点有所差别,代晶晶等主要侧重于稀土水溶液浓度的估算及稀土水溶液光谱响应机理研究;batsanov、meer、chen主要通过对矿物/化合物在可见光和近红外波段范围内的光谱反射特征进行分析,为获取矿物化学成分信息提供了一种快速而廉价的首端;cheng对离子吸附型原矿稀土样品采用多元线性回归方法建立了矿样稀土含量的定量预测模型,对稀土矿快速定量-半定量评估提供了一定的参考价值。尽管前人对稀土矿高光谱定量评价有所探索,但是对于沉积型原矿稀土含量及其反射光谱特征的相关研究还比较少。由于土壤、岩石中目标元素含量的稀少(如重金属、“三稀”元素往往为ppm级别),而且土壤/岩石成分复杂,目标元素与土壤/岩石反射光谱往往呈现出非线性的关系,而以往常用的经典线性回归方法(如pls、mlr)建模反演模型受到一定的限制,近些年及其学习的方法(如elm)在这种非线性拟合有着良好的建模表现。而关于机器学习方法在沉积型稀土元素高光谱反演建模中还未见有相关报道。技术实现要素:鉴于国内掀起了新一轮找寻稀土元素矿床的热潮,但又受制传统地球化学分析手段的局限性,便携式高光谱仪器的出现,为元素的快速检测提供了方便快捷手段,而且与航空、无人机高光谱遥感影像相结合可实现大面积的反演,了解稀土元素的区域分布状况。因此,本发明以黔西北上二叠统宣威组沉积型的稀土矿床la为目标元素,对其特征性光谱进行研究,找出相关规律,通过遗传算法优化后的极限学习机(ga-elm)反演建模,为黔西北沉积型稀土la元素的高光谱遥感研究提供依据,并未其他稀土元素的高光谱快速检测提供思路,以期为后期通过结合高光谱遥感影像对区域性稀土元素的含量进行高光谱反演估算提供依据,为进一步的稀土资源评价提供有价值的参考。本发明的发明目的在于为了解决上述技术问题,提供了一种基于spa-ga-elm算法的沉积型稀土la元素含量的高光谱反演方法,选取了多种光谱特征的参数对沉积型稀土la元素的含量进行反演建模,并用spa-ga-elm对模型进行优化,对比分析,得到最佳反演模型。为了解决上述现有技术中存在的问题,本发明是通过下述技术方案实现的:一种沉积型稀土la元素含量的高光谱反演方法,其特征在于,包括以下步骤:步骤a、采集稀土矿石,根据稀土矿的出露规律进行分层采取,每个样品的重量1.5-2.5kg,采集到的稀土矿石去除石块、植物根系后研磨过筛;每个样品分成两份,一份用于化学分析,另一份用于室内反射光谱测量;步骤b、使用地物光谱仪,地物光谱仪的波长范围为350-2500nm,在暗室内对步骤a中处理后的用于室内反射光谱测量的样品进行反射光谱测量,每个样品采集10条光谱,剔除异常,经算数平均后作为该样品的实际反射光谱;步骤c、la元素含量测定:步骤a中处理后的用于化学分析的样品,通过电感耦合等离子体质谱法,进行la元素的测定,所述电感耦合等离子体质谱法的检出限为0.05ug/g,测定范围为0.15-500ug/g;步骤d、数据处理,将步骤b中的样品光谱采用高斯模型采样为1nm光谱分辨率,进行s-g平滑光谱曲线,对光谱数据以10nm为间隔进行算数平均运算,选取400-2450nm范围内的光谱数据作为研究对象,对处理后的反射率光谱进行连续去除、连续统去除一阶微分、一阶微分、二阶微分、吸光率及吸光率一阶和二阶微分变换;步骤e、建立模型,根据样品光谱参数与实测la元素含量,采用变量重要性评价特征变量选取方法建立ga-elm(遗传算法优化的极限学习机)模型,所述ga-elm模型中通过变量重要性评价特征变量选取方法选取的参数包括个体数目、最大遗传代数、变量的二进制位数、代沟、交叉概率和变异概率;所述变量重要性评价方法提取的特征光谱使用了spa算法。所述地物光谱仪采用美国spectravista公司生产的svchr-1024i地物光谱仪。步骤b中,将样品放于盛样器皿内,将表面刮平,光源采用svchr-1024i光谱仪配套标准光源,天顶角设为30°,传感器探头垂直于土壤表面,距离为10cm;传感器探头的视场角为25°。与现有技术相比,本发明所带来的有益的技术效果表现在:本发明提供的一种基于spa-ga-elm算法的沉积型稀土la元素含量的高光谱反演方法,与其他各光谱参数及特征选择方法所建立的ga-elm模型相比,决定系数较大,均方根误差较小,平均相对误差较小,表明经spa算法筛选的特征光谱与la元素含量值所建立的ga-elm模型比其他参数与la元素含量值所建立的ga-elm模型具有更高的精度及更好的预测能力。附图说明图1是不同la含量样品反射光谱曲线;图2是不同la含量样品光谱曲线连续统去除;图3是稀土元素la含量与反射光(r)、吸光率(a)、吸光率一阶微分(fdofa)、吸光率二阶微分(sdofa)的光谱参数相关性曲线图;图4是稀土元素la含量与反射光(r)、反光率一阶微分(fdofr)、反光率二阶微分(sdofr)光谱参数的相关性曲线图;图5是spa算法选取的特征波长结果;图6是随机青蛙(rf)算法选取的特征波长结果;图7是cars算法不同参数选取的特征波长结果(a-cars;b-cars1;c-cars2;d-cars3);图8是spa-ga-elm与cars1-ga-elm模型稀土la含量预测集散点图。具体实施方式下面结合说明书附图和具体实施例,对本发明的技术方案作出进一步详细地说明。样品的采集:研究区位于黔西北毕节市威宁县哲觉镇一带,样品采集于该地峨眉山玄武岩顶部、上二叠系宣威组底部发育一套富稀土黏土岩。与典型的风化壳离子吸附型稀土不一样的是,该稀土矿稀土元素主要以类质同象替代的形式赋存于粘土矿物中。在矿层界面附近的剖面从底到顶采集了46件样品,土壤/岩石类型以高岭石为主,样品的设计根据稀土矿的出露规律进行分层采取,每个样品重量约2kg,采集时间为2018年8月。在实验室自然风干后,去除石块、植物根系后研磨过40目筛,每个样品分成两份,一份用于化学分析,另一份用于室内反射光谱测量。本研究中矿样的化学分析工作由中国地质科学院成都矿产综合所测试中心完成,依据国家土壤测定标准进行土壤稀土la元素含量的测定,将46个样品通过箱型图进行了异常光谱和样品的筛查,剔除2个异常样品后统计含量如表1所示。表1矿样la含量统计描述特征(mg/kg)样品的光谱测定使用美国spectravista公司生产的svchr-1024i地物光谱仪(波长范围350~2500nm,波长范围覆盖了vis-nir-swir,),在暗室对处理后的土壤样品进行反射光谱测量。样品放于直径10cm,深2cm的盛样器皿内,用直尺将表面刮平。光源为svchr-1024i光谱仪配套标准光源,天顶角设为30°。传感器探头(视场角25°)垂直土壤表面,距离10cm。用白板校正后进行光谱测量,每个样品采集10条光谱,剔除异常,经算术平均后作为该样品的实际反射光谱。沉积型稀土la元素含量的测定野外采集的样品粉碎后消解和测试流程参照中华人民共和国地质矿产行业标准[dz/t0279.32—2016]区域地球化学样品分析方法第32部分:镧、铈等15个稀土元素量测定封闭酸溶—电感耦合等离子体质谱法(icp-ms),进行la元素的测定。其方法检出限为0.05ug/g,测定范围为0.15~500ug/g。数据处理将样品光谱采用高斯模型重采样为1nm光谱分辨率,为了减弱噪声影响,s-g平滑光谱曲线,解决相邻波段信息重合导致的数据冗余问题,对土壤光谱数据以10nm为间隔进行算术平均运算。反射光谱信息在小于400nm和大于2450nm光谱区间受干扰严重,信噪比低,所以研究选取400-2450nm光谱数据作为研究对象。对预处理后的反射率光谱进行连续统去除、连续统去除一阶微分、一阶微分、二阶微分、吸光率及吸光率一阶和二阶微分变换。由于svc-hr2014i高的光谱分辨率,即使在对全谱进行了10nm平均后,仍然达到206维,当自变量维数过大易导致冗余数据太多,建立的回归模型容易出现过拟合现象或模型无法收敛。在利用vis-swir建立反演模型时,应用的特征变量选取方法和参数直接影响建模集的自变量数量和光谱特征信息结构,是决定模型精度和稳定性的关键因素。特征光谱的提取选择了目前广泛使用的相关性分析和评价变量重要性两种方法进行特征光谱的选择的对比研究,对比两种方法在稀土la含量定量反演时模型的差异。将采集的46个样本进行了异常光谱和样本含量的筛查,剔除2个异常样品后按照ks(kennard-stone)抽样算法按3:1的比例分为训练集和预测集,分别包含33个样本和11个样本用于光谱参数与实测la元素含量值的相关性系数法与变量重要性评价(cars、spa、rf)两种特征变量选取方法所建立的ga-elm(遗传算法优化的极限学习机)数学模型的建立与检验。数据处理及建模在excel、origin及matlab中完成。结果分析研究区土壤反射光谱曲线波形大致相同(图1),呈上凸的抛物线型,在400-800nm光谱区间,随着波长增大,光谱曲线呈较快的单调上升,波长超过800nm后光谱曲线变化较为平缓,在1400,1900和2200nm附近出现3个明显的吸收峰,通常认为与粘土矿物中所含的水分子和羟基有关;反射光谱曲线经连续统去除变换后(图2),有效压抑了背景光谱,并扩大光谱的弱吸收,光谱吸收特征明显增强,得到五个土壤光谱特征吸收带:400~650、750~1250、1310~1650、1820~2140、2150~2350nm以及两个小的特征吸收带:650~750、2350~2420nm。对原始光谱进行分别进行一阶微分、二阶微分以消除部分基线和其它背景干扰,可看出显著增加了多个光谱峰、谷,分辨率和灵敏度显著增加。总体看来,不同la元素含量土壤光谱曲线趋势大致相同,且随着la含量的增加,反射率增加,这些明显的光谱特征差异都为建立稀土la元素预测模型提供基础。光谱特征分析与构建:(1)相关性系数方法筛选特征光谱变量通过相关性系数来筛选变量是常用的方法,将及进行光谱预处理后的反射光谱与la元素进行相关性分析,发现相关系数绝对值较小且变化幅度不大,难以区分敏感波段,将反射光谱进行一阶微分(fd/r’)、二阶微分(sd/r’’)变换后相关系数正负交替变化(图3、图4)值存在较大差异,可以根据相关系数值的大小判断出特征波段,而相关系数绝对值达0.23已达到显著相关(p<0.05),相关性系数达到0.3时已经是极显著相关(p<0.01),而相关系数绝对值>0.4已属于较高层次。由于原始和部分变换后的光谱相关性较低(<0.3),但如果以显著相关标准选取变量则太多,则降维效果有限,因此根据具体光谱相关性特征选择相对较高系数调整进行特征变量筛选,如原始反射率以相关性系数绝对值大于0.22为界限得到11个变量,其余进行光谱变换后的特征变量也依此法进行优选,得到各变量的特征敏感光谱波长如表2所示。表2基于相关性系数法的光谱变换特征变量提取综合表注:*表示相关系数绝对值>0.3,**表示相关系数绝对值>0.4,***表示相关系数绝对值>0.5(2)变量重要性程度评价方法(spa、cars、rf)提取特征光谱变量spa、cars是常用的波长重要性评价变量优选方法,rf(radomfrog,随机青蛙)算法li在2014年报道的关于变量筛选一种高效新方法。采用spa、cars和rf三种波长优选方法研究稀土la元素有效信息提取,建立la元素的无损检测模型。由于cars的变量选取的差别也会影响,因此也对cars中不同变量参数选取做了对比试验,分别编号为cars(标准竞争性适应重加权算法)、cars1(考虑标准误差的竞争性适应重加权算法)、cars2(删除随机因素下的竞争性自适应重加权算法)、cars3(考虑标准误差并删除随机因素下的竞争性自适应重加权算法)。图5、图6、图7和表2分别为spa、rf(选择概率>0.2)、和不同参数条件下4种cars算法波长选择的变量综合图表。表3基于变量重要性评价方法的特征光谱提取综合表变量筛选算法变量数特征光谱波长/nmspa6104014801810199021902340rf1346056010201150132014201800197019902000211021902320cars125605701430197019902000211021202160220022302320cars11256013801430187018801930199021202130216022002230cars2204104605605701380143018701930197019902000207021102120213021602200223023202350cars31841046056057014301870193019701990200020702110212021302160220022302320稀土la含量模型的建立与分析遗传优化算法中的参数,经过多次尝试后,统一选择使用了建模效果较好的如下参数:个体数目nind=40,最大遗传代数maxgen=100,变量的二进制维数preci=10,代沟ggap=0.95,交叉概率px=0.7,变异概率pm=0.01。表4为基于变量相关性和变量重要性评价两种特征光谱提取方法的稀土la元素含量的ga-elm模型。基于变量相关性系数方法使用了原始光谱反射率(r)、一阶微分(fd或r’)、二阶微分(sd或r’’)、连续统去除(cr)、连续统去除一阶微分(cr’)、吸光率(1/logr)、吸光率一阶微分((1/logr)’)/吸光率二阶微分((1/logr)’’)。基于变量重要性评价方法提取的特征光谱使用了spa、cars、cars1、cars2、cars3和rf算法。总体来看,后者的降维效果与建模表现优于前者,前者la反演模型较好的为基于吸光率一阶微分的ga-elm模型,其预测模型决定系数r2为0.89,均方根误差(rmse)为36.26mg/kg,平均相对误差(mre)为45.07%,对应变量个数为28个。后者建模效果最佳的为spa-ga-elm和cars1-ga-elm其预测模型决定系数r2、均方根误差(rmse)、平均相对误差(mre)和变量个数分别为0.91,14.99mg/kg,11.71%,6个和0.95,24.10mg/kg,12.94%,12个。与原始全谱(206个变量)所建立的ga-elm模型对比(表4),spa-ga-elm(6个变量)和cars1-ga-elm(12个变量)的反演模型降维效果优秀(图6),10%左右的精度误差实现了稀土la元素的高光谱定量-半定量快速分析。表4基于两种不用特征光谱提取方法的稀土la元素含量的ga-elm模型结论:利用黔西北二叠系宣威组46个沉积型稀土样品的la元素含量与预处理后不同变换形式(fd、sd、cr等)的光谱反射率之间的相关分析和变量重要性评价(spa、cars、rf)两种方法筛选特征变量,通过ga-elm(遗传优化后的极限学习机)的机器学习方法建立la元素的反演模型,取得了较好的反演效果。不同的光谱变换方法对矿样中的la元素含量提取能力不同,每种光谱变换对应有特定的敏感波长,其中通过相关性分析方法得出,相关性绝对值达到0.303时即为极显著相关(p<0.01),经过不同形式的光谱变换后与原始光谱对比,与la的含量相关性都具有较大的提升,而且光谱细节凸显更加显著,其中吸光率二阶微分中1120nm与la元素有最高的极显著相关性,可达0.51。但总体来看光谱与稀土la含量的线性相关关系较差,可能表明二者为非线性关系,因此使用机器学习中的对于非线性建模效果较好的ga-elm进行稀土la含量的模型反演。反演模型效果较一般,其中原始光谱进行全谱反演的预测模型r2为0.41,rmse为60.33mg/kg,平均相对误差为52.09%,而吸光率一阶微分对la的反演效果相对较好一些,预测模型r2可达0.89,rmse为36.26mg/kg,平均相对误差为45.97%,相对应的的特征敏感波长达到28个,具体为420~450,490~520,1080~1260和1460nm。选择光谱细节显著凸显的二阶微分进行spa、cars、rf等变量重要性评价方法选取特征变量,三种方法中spa选取了6个变量,rf选取了13个变量,其中cars方法在四种不同参数情况下分别选取了12(cars)、12(cars1)、20(cars2)、18(cars3)中变量,反演模型显示spa-ga-elm和cars1-ga-elm的效果最佳,r2、rmse和平均相对误差分别达为0.91、14.99mg/kg、11.71%和0.95、24.10mg/kg、12.94%。模型所对应的特征波长分别为1040,1480,1810,1990,2190,2340nm和560,1380,1430,1870,1880,1930,1990,2120,2130,2160,2200,2230nm。通过相关性分析和变量重要性评价两种方法对比特征波长的提取效果,发现后者比前者整体提取效果要好,特别是反演模型中表现最佳的spa-ga-elm与cars1-ga-elm维数的下降到6维和12维,与原206个变量(sg平滑处理后光谱10nm平均)相比,大规模降维能够迅速提高分析速度,而精度上约10%的平均相对误差,也达到了快速定量-半定量分析的基本需求,表明沉积型稀土矿la元素反演模型较好,在可见光-近红外进行稀土元素的高光谱反演是可行的。本发明解决了通过室内实测光谱反射率与黔西北二叠系宣威组沉积型稀土矿样中la元素的定量反演估算模型,鉴于前人研究的是稀土溶液、矿物/化合物,赋存状态主要以风化壳离子吸附型成因,此次研究的稀土矿样为沉积型且赋存状态以类质同像为主,此次研究填补新类型、新赋存状态下稀土矿样高光谱反演模型的空白,也丰富了稀土矿样反演模型的研究实例,为其他新类型稀土的高光谱定量反演估算提供了思路,为航空和无人机高光谱遥感反演估算提供了理论基础。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1