本发明涉及页岩气勘探开发,尤其涉及一种提高libs检测钻遇碳酸盐岩钙元素含量精度的方法。
背景技术:
1、碳酸盐岩是由碳酸盐矿物(方解石、白云石等)组成的化学沉积岩,全世界50%的石油和天然气储存于碳酸盐岩中。钙(ca)元素是构成碳酸盐岩的主要元素之一,精确分析碳酸盐岩中钙元素含量,对后续进行岩性鉴别和定名,提高录井剖面的准确度具有重要作用。
2、传统的利用光谱进行元素分析的方法包括电感耦合等离子体原子发射光谱法(icp-aes)、原子吸收光谱法(aas)、x射线荧光光谱分析(xrf)等。icp-aes法需要对样品进行预处理,需要进行采样、溶解等一系列操作,对于固体和难溶解的样品不易实现;aas法对金属元素检测灵敏度比较高,对非金属元素的检测局限性比较大;xrf方法对轻元素的检测灵敏度较低,比较适合原子量大于23的元素测量。同时,这些方法都存在着对样品处理过程较为复杂的缺点,无法实现在线测量,不能满足快速智能评价的要求。激光诱导击穿光谱(libs)技术具有微损、原位、远程、实时、在线、样品处理简单、多元素同时检测的特点。因此,libs技术能很好的解决传统技术存在的缺点,并且提高碳酸盐岩岩屑信息采集分析时效和标准化程度。
3、libs技术虽然能满足现场快速智能评价的要求,但在精确度方面尚有不足。激光与物质相互作用的非线性过程复杂且快速,受激光特性、实验条件和环境条件等的影响,光谱会出现基线漂移、信噪比不高、重叠峰等现象。此外,自吸收效应也会对libs定量分析结果产生影响,特别注意的是,ca元素作为碳酸盐岩的主要成分之一,受自吸收效应的影响相比于其余元素更为显著,使谱峰出现凹陷、自蚀等现象。上述各因素综合作用使得采集到的谱线强度与元素含量出现非线性关系,从而影响最终的定量分析精度和检测限。
4、现有的自吸收效应校正方法主要有基于实验参数的优化、基于物理辅助装置和基于量化模型校正算法三大类。基于实验参数的优化方法目前还有待研究,基于物理辅助装置方法大多存在设备昂贵、自吸收抑制效果不稳定的缺点,故目前的自吸收校正方法大多集中于利用算法校正,主要有成长曲线法、自吸收系数法、积分法和光谱拟合法等。成长曲线法计算过程繁琐,且需要准确详细的谱线参数信息和等离子体信息;自吸收系数法需要无自吸收谱线作为参考,且计算所需的stark展宽系数较难获取;积分法计算过程复杂,因此,本发明采用voigt函数拟合法实现自吸收校正。
技术实现思路
1、本发明的目的在于克服现有技术的缺点,提供一种提高libs检测钻遇碳酸盐岩钙元素含量精度的方法;该方法通过对光谱数据进行降噪和基线校正,可以有效的降低噪声等干扰的影响,提高测量的准确性和可靠性;通过归一化可消除光谱数据的量纲对特征变量选择结果的影响,同时提高特征变量选择算法的收敛速度;通过ipls-rf算法实现数据降维、有效的剔除冗余信息,加速定量模型的训练和预测过程的同时也提高了模型的稳定性;通过voigt函数对特征波段进行拟合,得到更接近理论线性的谱线,完成对自吸收效应的校正,可进一步提高模型预测结果的准确程度,该方法对于提高libs检测钻遇碳酸盐岩钙元素含量精度具有重大意义;推广前景优异。
2、为实现以上技术效果,采用如下技术方案:
3、一种提高libs检测钻遇碳酸盐岩钙元素含量精度的方法,包括以下步骤:
4、步骤s1:获取标准碳酸盐岩岩屑样本和待测碳酸盐岩岩屑样本;利用libs设备分别对不同样本进行光谱数据采集,得到原始光谱数据;
5、步骤s2:对上述标准样品和待测样品的原始光谱数据进行数据预处理,包括数据降噪、基线校正和归一化,分别得到标准样品和待测样品预处理后的光谱数据;
6、步骤s3:利用区间偏最小二乘—随机跳蛙算法ipls-rf对标准样品和待测样品预处理后的光谱数据进行数据降维,得到特征波长筛选后的标准样品和待测样品光谱数据;
7、步骤s4:对上述特征波长筛选后的标准样品和待测样品光谱数据,利用voigt函数拟合法对谱线进行自吸收校正,得到自吸收校正后的标准样品和待测样品光谱数据;
8、步骤s5:将上述自吸收校正后的标准样品的光谱数据作为训练集,利用支持向量回归机svr作为定量分析模型,将光谱数据作为输入,ca元素含量作为浓度标签,训练所述svr模型;
9、步骤s6:自吸收校正后的待测样品光谱数据作为测试集,输入到训练好的svm模型中,得到预测的待测碳酸盐岩岩屑ca元素含量。
10、进一步的,所述步骤s1中利用libs设备分别对不同样本进行光谱数据采集,得到原始光谱数据的具体方法为:
11、利用libs设备分别对不同样本进行光谱数据采集,每次测量累计6个激光脉冲激发的等离子体发光,对每个样品的10个不同位置进行测量;每个采集的光谱由10次测量平均得到,得到原始光谱数据。
12、进一步的,所述步骤s2中数据降噪的具体方法为:
13、利用sg算法对原始光谱数据进行平滑降噪处理;步骤如下:
14、s21a:采用七点窗口,在原始数据的第i个点的左侧和右侧各取j个数据点,j=3,形成一个具有2j+1个数据点的窗口;
15、s22a:将窗内原始数据利用3阶多项式拟合,建立n=2j+1个多项式,通过最小二乘法确定拟合参数,模拟数据中窗口中心的数据将作为第i点的平滑值;拟合多项式为:
16、y=a0+a1x+a2x2+a3x3
17、其中,x为待拟合的数据,y为拟合后的输出数据,a0;a1;a2;a3为待求解的拟合参数;
18、s23a:将窗口沿着光谱数据从左至右移动,每次移动一个数据点,依次计算出平滑值,得到平滑后的整个光谱数据。
19、进一步的,所述步骤s2中基线校正的具体方法为:
20、利用离散小波变换对降噪后的光谱进行基线校正;步骤如下:
21、s21b:采用sym4小波基对降噪后光谱进行分解,获得信号在不同层次进行小波变换的低频逼近曲线,并选择最优分解层数m,m为5~8层;
22、s22b:在最优分解层数上对原始信号进行m次小波分解,得到的低频小波逼近系数a(m);
23、s23b:将a(m)置零后重构libs光谱,从而得到扣除背景的信号,完成基线校正。
24、进一步的,所述步骤s2中归一化的具体方法为:
25、采用最大最小归一化完成对光谱数据的归一化处理;利用数据列中的最大值和最小值进行标准化处理,使数值处于[0,1]之间,公式如下:
26、
27、其中,x为待归一化的数据,x′为归一化后的数据,xmax为光谱强度的最大值,xmin为光谱强度的最小值。
28、进一步的,所述步骤s3中利用区间偏最小二乘—随机跳蛙算法ipls-rf对标准样品和待测样品预处理后的光谱数据进行数据降维的具体方法为:
29、采用ipls算法筛选出光谱特征波段,具体步骤如下:
30、s31:将全光谱等分成20份,不能等分时,将多余的波点等分到后面几个区间里;
31、s32:在每个子区间进行偏最小二乘回归,得到20个局部回归模型;
32、s33:计算每个区间的均方根误差rmse值为各模型的精度衡量标准,取精度最高的局部模型所在的子区间为特征波段;rmse值计算公式如下:
33、
34、其中,rmse为均方根误差,为ca元素浓度预测值,yi为真实值,n为样本数量;
35、基于ipls算法筛选出的波段,作为初始变量自子集,利用rf算法完成对特征波长的选择;具体步骤如下:
36、s34:初始化:将ipls算法筛选出的波段作为初始变量子集v0,包含q个变量,即q个波点数;
37、s35:概率引导模型搜索:在v0的基础上随机选择一个包含q*个变量的候选变量子集v*,选择v*作为v1,用v1代替v0;具体步骤如下:
38、首先,从均值为q、方差为0.3q的正态分布中随机选择一个整数q*,之后通过以下三种方式之一产生一个包含q*个变量的候选变量子集v*;
39、如果q*=q,则令v*=v;
40、如果q*<q,则首先对v0建立pls模型,记录并比较模型中每个变量的回归系数的值,将q-q*个最小回归系数的相关变量从v0中移除,剩余的q*个变量为候选子集v*;
41、如果q*>q,则从v-v0中随机抽取ω(q*-q)个变量,ω默认值为3,生成一个变量子集t,v代表包含全部p个变量的集合;通过v0和t的组合建立pls模型,保留模型中回归系数最大的q*个变量,并将其设为候选子集v*;
42、s36:循环:循环上述s35过程,直至n次迭代完成,n=1000;
43、s37:变量估计:计算各个变量选择的概率值,以此作为变量重要性评价指标;n次迭代之后,总共获得n个变量子集;对于每个变量,可以使用下式计算其被选择的概率;
44、
45、其中,p为变量个数即光谱总的波长点数,j为变量即第j个波长点对应的强度值,pj为第j个变量被选择的概率,n为迭代次数,nj为第j个变量在n次迭代中被选择的次数;
46、s38:变量选择:对各个变量的概率值进行排序,选取概率最大的前15个变量作为特征波长。
47、进一步的,所述步骤s4中利用voigt函数拟合法对谱线进行自吸收校正的具体方法为:
48、s41:以筛选出的特征波长为拟合中心λ0,选择与λ0最近的2个波谷点组成的区域[v1,v2]作为待拟合区域,最终得到15个待拟合波段;
49、s42:利用wertheim提出的近似的voigt函数对上述15个波段进行拟合,得到自吸收校正后的特征波长处的光谱强度。近似的voigt函数表达式为:
50、
51、其中,f(λ,[α,λ0,δλv,η])是拟合结果,λ是待拟合处的波长,α是谱峰强度,λ0表示谱线中心位置,δλv是半峰宽,η是洛伦兹-高斯系数,0≤η≤1。
52、进一步的,所述步骤s5中训练所述svr模型的具体方法为:
53、s51:划分训练集和测试集:将自吸收校正后的标准样品光谱数据作为训练集,自吸收校正后的待测样品光谱数据作为测试集;
54、s52:选择核函数:根据光谱数据非线性的特征,选择径向基函数rbf作为核函数,其表达式为:
55、k(xi,xj)=exp(-γ||xi-xj||2)
56、其中,xj为核函数中心点在高维空间的位置,xi为输入变量,γ为rbf核的关键参数;
57、所使用的svr模型为:
58、yi=∑i∈mai×exp(-γ||xi-xj||2)+b
59、其中,yi为元素浓度值,m为支持向量集,ai为拉格朗日乘子,xj为核函数中心点在高维空间的位置,xi为输入变量,γ为rbf核的关键参数,b为常数;
60、s53:参数优化:在训练集内,采用最小二乘算法对核函数的超参数γ和模型关键参数惩罚因子c进行优化,确立最佳参数;并评估模型预测效果,评估指标为决定系数r2和均方根误差rmse,其中r2和rmse的计算公式为:
61、
62、
63、其中,r2为决定系数,,为ca元素浓度预测值,yi为元素浓度真实值,为元素浓度真实值的平均值,n为样本数量,rmse为均方根误差;
64、利用决定系数r2和均方根误差rmse值确定模型参数,得到训练好的模型。
65、本发明的有益效果为:
66、本发明公开了一种提高libs检测钻遇碳酸盐岩钙元素含量精度的方法;该方法通过对光谱数据进行降噪和基线校正,可以有效的降低噪声等干扰的影响,提高测量的准确性和可靠性;通过归一化可消除光谱数据的量纲对特征变量选择结果的影响,同时提高特征变量选择算法的收敛速度;通过ipls-rf算法实现数据降维、有效的剔除冗余信息,加速定量模型的训练和预测过程的同时也提高了模型的稳定性;通过voigt函数对特征波段进行拟合,得到更接近理论线性的谱线,完成对自吸收效应的校正,可进一步提高模型预测结果的准确程度,该方法对于提高libs检测钻遇碳酸盐岩钙元素含量精度具有重大意义;推广前景优异。
67、与现有技术相比,本发明所采用的技术方案至少具备以下优点:采用sg算法、离散小波变换和最大最小归一化对光谱进行综合数据预处理,有效的提高了libs光谱的信噪比,增强了数据的稳定性和定量分析结果的准确性。利用ipls-rf算法准确的筛选出ca元素相关的特征波长,实现数据降维、去除冗余信息的同时又避免了手动选择波长的不准确性。利用voigt函数对波段进行拟合实现自吸收校正,解决碳酸盐岩中ca元素含量高导致的谱线自吸收严重,最终导致定量分析结果不准确的问题。