本发明涉及利用反射式近红外光纤探头构建快速预测原油性质的模型的方法及其应用。
背景技术:
原油作为炼化企业的最主要原料,一方面,原油的需求量剧增、进口量扩大、价格居高不下且波动频繁;另一方面,原油产品存在着性质劣质化、种类丰富、同名油前后性质有差异、装置进料要求高、混兑油性质难掌握等诸多特点。这些给炼化企业带来了巨大的压力。及时获得当前原油的性质评价数据——即原油快速评价,将为原油贸易、原油输送、原油调合、原油加工、全厂生产计划、生产调度等生产过程优化提供支撑。原油评价包含指标众多,如密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线等。采用传统的评价方法,存在分析时间长、处理繁琐、仪器要求高、劳动强度大等现象,已不能满足实际应用的需求。
近红外分析技术是目前最有前景且应用最广泛的快速分析方法之一。近几年来光纤在近红外光谱技术领域的应用使近红外光谱技术从实验室走向现场,光纤化学和热稳定性、对电磁干扰不敏感、传输信号能量集中、灵敏度高、价格低廉等优点,使得近红外光谱仪可以在恶劣、危险的环境中进行远距离快速在线分析。近红外光谱仪的光纤测样附件,按照测样的形式可分为透射器件和漫反射器件;从样品的引入方式来看,有探头型和流通池型。基于光纤结构的近红外探头结构非常灵活,可按硬件要求设计。从现场应用效果看,光纤结构的近红外探头越来越受到急需远程和在线分析的各行业的青睐。
原油组分复杂,属于黏稠深色液体。原油的待测性质多,并且其近红外光谱吸收带较宽且重叠严重。在实际测量中,光谱分析系统探头的结构非常关键。光纤探头的性质和结构不同对测量信噪比有很大的影响。光纤探头的窗片或透镜表面被污染则会影响光通量使灵敏度降低,测试过程中有外来光的干扰则会使检测的信噪比和灵敏度下降。常规透射式光纤探头在测量深色原油时携带样品信息不够,并且在实际应用中流通池易被黏稠原油粘附,进而造成样品谱图失真,模型预测精度低、现场仪器维护工作量大等问题,影响实际投用效果。
因设计原理的不同,反射式光纤探头结合近红外光谱仪,在原油的近红外光谱检测上将一定程度上改善现有的分析不足。根据通过光纤技术远程采集信号,建立原油的近红外反射光谱数据库,利用光谱预处理技术以及近红外建模技术,可以快速获取原油性质,就有可能成为原油等深色重质油品物化性质的在线快速测定的一种良好手段。同时,由于近红外分析仪是二次测量仪表,即近红外分析仪并不是直接测量物质性质,必须先建立待测物质的属性与近红外光谱之间的数学模型然后根据模型来测量物质属性。因此,可以预想到,一种兼顾实用性、实时性、稳定性和良好预测精度的原油快速评价方法的发明,将倍受青睐。
技术实现要素:
鉴于上述问题,本发明提出了一种利用反射式近红外光纤探头构建快速预测原油性质的模型以及利用该模型快速预测原油性质的方法。该方法通过选取合适型号的反射式近红外光纤探头和离线/在线近红外分析仪,采用将光纤探头直接插入原油样品的测量方式,快速获取原油近红外光谱图。通过一阶微分对原油近红外光谱图进行预处理,采用主成分分析方法(pca)对预处理后的光谱样本进行筛选,利用偏最小二乘法(pls)建立的原油定量分析模型,基于此模型可实现未知原油性质的快速预测分析。该方法与其他的原油性质测量方法相比,无需复杂的样品预处理,具有操作简单、探头维护量小、近红外光谱信噪比高、定量分析模型精度高等特点,可快速预测原油的性质,在工业在线应用时具有较好的前景。
本发明提供的构建基于近红外反射式光纤探头检测原油性质的模型的方法包括以下步骤:
步骤一:构建原油校正集,测定校正集中原油的性质;
步骤二:利用反射式光纤探头采集原油近红外光谱;
步骤三:利用一阶微分对步骤二获得的原油近红外光谱进行预处理;
步骤四:利用主成分分析方法对预处理后的光谱数据进行训练集样本的选择;
步骤五:根据原油待测性质和原油光谱数据集,选择特定的光谱频段;和
步骤六:利用偏最小二乘法建立原油性质与近红外光谱数据之间的数学关联模型。
在一个或多个实施方案中,步骤一中,用于构建校正集的原油20℃的密度在0.7-1.1g/cm3的范围内,硫含量在0.03%-5.50%的范围内,酸值在0.01-12.00mgkoh/g的范围内。
在一个或多个实施方案中,所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点数据中的一个或多个。
在一个或多个实施方案中,步骤二包括,将校正集样品放置于30℃温度下(维持恒定),待原油样品温度达到稳定状态后,测定该原油样品的近红外光谱数据。
在一个或多个实施方案中,步骤二中,采用的反射式近红外光纤探头含有14根光纤,7根输出,7根输入,探头外部加装有一个底部由蓝宝石材质制成光窗材料的金属套筒,套筒可拆卸。
在一个或多个实施方案中,步骤二中,利用配置反射式近红外光纤探头的离线/在线近红外分析仪,将该反射式近红外光纤探头直接插入原油,探头外部套筒底的蓝宝石光窗材料被原油浸没即可的方式,测得原油近红外光谱数据。
在一个或多个实施方案中,步骤二中,扫描范围为4000-12500cm-1,扫描次数为10-400次。
在一个或多个实施方案中,步骤三包括,利用一阶微分对步骤二获得的波数范围为12500~4000cm-1区域的原油样本近红外光谱图进行预处理,消除基线和背景干扰,建立初始训练集。
在一个或多个实施方案中,步骤三所述的预处理为s-g一阶导数,用以消除背景干扰。
在一个或多个实施方案中,步骤四包括,对样本光谱进行主成分(pca)分析后,利用主成分得分作为特征变量,再利用样本间的欧式距离来选择样本,确定最终的训练集。
在一个或多个实施方案中,步骤四包括,采用剔除的方式对校正样本进行选择,其过程为:首先对样本光谱进行主成分(pca)分析,然后利用主成分得分作为特征计算每个样本与邻近样本之间的欧式距离,并根据样本分布的密度确定阈值;对于每一个样本,剔除与其距离小于阈值的样本,从而剔除冗余样本,剩余的样本作为校正样本;部分样本之间的欧式距离过小造成样本冗余,通过设定阈值并且剔除与其距离小于阈值的样本的方法来消除冗余样本。
在一个或多个实施方案中,步骤四所述的所有样本两两之间的欧式距离dij按下式计算:
式中,dij:第i个样本和第j个样本之间的欧式距离;
m:为主成分数;
xi:为第i个样本的主成分得分;
xj:为第j个样本的主成分得分。
在一个或多个实施方案中,步骤五中,对于密度选择波数范围为4247-6107cm-1、对于残炭选择波数范围4599-5456cm-1和6099-7500cm-1、对于酸值选择波数范围4599-7500cm-1、对于硫含量选择波数范围4599-7500cm-1、对于氮含量选择波数范围4500-6600cm-1、对于蜡含量选择波数范围4500-6600cm-1、对于胶质含量选择波数范围4500-6600cm-1、对于沥青质含量选择波数范围4500-6600cm-1和对于实沸点蒸馏数据选择波数范围为4599-7500cm-1。
在一个或多个实施方案中,步骤六中,所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点数据中的一个或多个。
在一个或多个实施方案中,步骤六中,所述数学关联模型如下式所示:
y=a0+a1x1+a2x2+…+anxn
其中,y为预测的性质,ai为模型参数,xi为光谱第i个波数点的吸光度。
在一个或多个实施方案中,所述数学关联模型如下建立:
(1)对光谱矩阵x和浓度矩阵y作标准化变换,变换后的矩阵分别记为v和u;
(2)计算v矩阵的权重ω′=u′v/u′u;
(3)对权重向量进行归一化ω′new=ωold′/(ωold′ωold)1/2;
(4)估计v矩阵得分向量t=vω′;
(5)计算u矩阵的载荷q′=t′u/t′t;
(6)产生u矩阵的得分向量u=uq/q′q;
比较u(old)与u(new),如果||u(old)-u(new)||<阈值,表明以收敛,迭代停止,否则转到第一步继续进行迭代;
(7)计算标量b用以内部关联b=u′t/t′t;
(8)计算v矩阵的载荷p′=t′v/t′t;
(9)计算v和u矩阵的残差e=v-tp′,f=u-uq′。
(10)计算预测标准差sep,如果sep大于预期精度,则表明最佳维数已得到,否则对下一维进行计算,则可得到最终的系数矩阵
b=w(p'w)-1q'。
本发明还包括一种利用反射式近红外光纤探头快速预测原油性质的方法,所述方法包括:
步骤a:利用反射式光纤探头采集原油样品的近红外光谱;
步骤b:利用一阶微分对步骤a获得的原油近红外光谱进行预处理;
步骤c:根据原油待测性质和原油光谱数据集,选择特定的光谱频段;和
步骤d:利用以下数学关联模型预测该原油样品的相关性质:
y=a0+a1x1+a2x2+…+anxn
其中,y为预测的性质,ai为模型参数,xi为光谱第i个波数点的吸光度。
在一个或多个实施方案中,所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点数据中的一个或多个。
在一个或多个实施方案中,步骤a包括,将原油样品放置于30℃温度下,并维持温度恒定,待原油样品温度达到稳定状态后,测定该原油样品的近红外光谱数据。
在一个或多个实施方案中,步骤a中,采用的反射式近红外光纤探头含有14根光纤,7根输出,7根输入,探头外部加装有一个底部由蓝宝石材质制成光窗材料的金属套筒,套筒可拆卸。
在一个或多个实施方案中,步骤a中,利用配置反射式近红外光纤探头的离线/在线近红外分析仪,将该反射式近红外光纤探头直接插入原油,探头外部套筒底的蓝宝石光窗材料被原油浸没即可的方式,测得原油近红外光谱数据。
在一个或多个实施方案中,步骤a中,扫描范围为4000-12500cm-1,扫描次数为10-400次。
在一个或多个实施方案中,步骤b包括,利用一阶微分对步骤a获得的波数范围为12500~4000cm-1区域的原油样本近红外光谱图进行预处理,消除基线和背景干扰,建立初始训练集。
在一个或多个实施方案中,步骤b所述的预处理为s-g一阶导数,用以消除背景干扰。
在一个或多个实施方案中,步骤c中,对于密度选择波数范围为4247-6107cm-1、对于残炭选择波数范围4599-5456cm-1和6099-7500cm-1、对于酸值选择波数范围4599-7500cm-1、对于硫含量选择波数范围4599-7500cm-1、对于氮含量选择波数范围4500-6600cm-1、对于蜡含量选择波数范围4500-6600cm-1、对于胶质含量选择波数范围4500-6600cm-1、对于沥青质含量选择波数范围4500-6600cm-1和对于实沸点蒸馏数据选择波数范围为4599-7500cm-1。本发明的有益效果如下:
本发明测试方式简单、快速、实用,利用近红外分析仪并配置含有14根光纤的反射式近红外探头,将配套可拆卸的底部带有蓝宝石光窗材料的金属套筒的反射式近红外光纤探头直接插入待测点的原油样品中,利用近红外光谱仪快速测定原油性质。与传统的测量方法相比,本发明方法大大缩短了检测时间,减少了人力、物力。测试过程中无需使用任何试剂对原油样品处理,不损坏样品;与其他近红外测量方式相比,不需要把样品从待测点取出送到近红外分析仪进而避免了繁琐的原油预处理系统,仅通过光纤的加长,即可实现原油样品原位、实时分析。同时,带蓝宝石光窗材料金属套筒的反射式探头的使用,可以有效减少原油黏稠而粘附在光纤探头上影响样品实时性的现象。在此基础上,本发明采用的综合建模方法,即,基于采用一阶微分对采集到的原油样本近红外光谱图进行预处理,通过主成分分析技术筛选样本,并选择原油光谱图合适的波数范围,利用偏最小二乘法建立原油属性值与其近红外光谱数据之间的数学模型,可实现未知原油属性值的快速预测分析。利用该方法,预处理后的近红外光谱信噪比高,建立的模型精度高,可以检测原油密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点蒸馏数据。该发明可为原油性质监控、储运、调合、常减压蒸馏装置操作等各项与原油有关业务的优化提供支撑。
附图说明
图1:基于反射式近红外光纤探头检测原油样品近红外光谱数据。(a)实验过程;(b)近红外光的路线示意图。
图2:基于反射光纤探头快速预测原油性质方法的总流程图。
图3:原始的原油近红外光谱图。
图4:预处理后的原油近红外谱图。
图5:pca分析主成分。
图6:剔除异常点的样本点图。
图7:近红外原油api回归模型。
图8:近红外原油硫含量回归模型。
具体实施方式
图1显示本发明基于反射式近红外光纤探头检测样品近红外光谱数据实验过程。图2为本发明预测原油性质的总流程图,具体包括以下步骤:
(1)构建原油校正集,利用标准分析方法测定样品相关性质;
(2)利用近红外分析仪和反射式探头,将配套可拆卸的底部带有蓝宝石光窗材料的金属套筒的反射式近红外光纤探头,直接插入待测点的原油样品中测得近红外光谱数据;
(3)利用一阶微分对光谱进行预处理;
(4)利用主成分分析技术对预处理后的光谱图进行特征变量筛选,并剔除异常样本;
(5)根据建模项目,确定近红外波数范围;和
(6)利用偏最小二乘法建立性质校正模型。
图2的流程图中还显示了利用所建的模型,结合步骤(2)、(3)、(5),测试未知原油性质的步骤。
下文将对这些步骤进行详细描述。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。
一、构建原油校正集,测定校正集中原油的性质
可收集不同种类的原油样本,通常覆盖石蜡基原油、中间基原油和环烷基原油等。通常,所收集的原油样本数量不少于50个。较好的是,所收集的原油样本的密度(20℃)、硫含量和酸值指标分别控制在0.7~1.1g/cm3、0.03%~5.50%和0.01~12.00mgkoh/g的范围之内。然后利用传统的标准方法测得所收集原油的多个性质属性,如密度、残炭、氮含量、硫含量、酸值、盐含量、蜡含量、胶质含量、沥青质含量和实沸点蒸馏数据等,并记录数据。
二、采集原油近红外光谱
可选取合适型号的离线或在线近红外光谱仪,配套可拆卸的底部带有蓝宝石光窗材料的金属套筒的反射式近红外光纤探头进行近红外光谱扫描,采用将反射式近红外光纤探头直接插入原油样品(原油样品温度维持在30℃以下的某个恒定温度)的测量方式,获得每份样本的近红外光谱图。例如,可将原油样品放置于30℃温度下,并维持温度恒定,待原油样品温度达到稳定状态后,测定该原油样品的近红外光谱数据。
本发明采用的反射式近红外光纤探头可含有14根光纤,7根输出,7根输入,探头外部可加装有一个底部由蓝宝石材质制成光窗材料的金属套筒,套筒可拆卸。
每张光谱图扫描时间为100-400次,取平均值。光谱扫描范围为4000-12500cm-1,分辨率16-32cm-1。示例性的原油预处理光谱见图3。
三、利用一阶微分对步骤二获得的原油近红外光谱进行预处理
该预处理包括对校正集每份样品的12500-4000cm-1的谱区进行一阶微分处理,消除基线和背景干扰,提高分辨率和灵敏度。预处理后,可建立初始训练集。示例性的预处理后的原油近红外谱图见图4。
四、利用主成分分析技术对预处理后的光谱图进行特征变量筛选,并剔除异常样本
本步骤是对步骤三中预处理过后的光谱进行校正样本的选择,从样本库中选择代表性强的样本建立模型,这样不仅可以提高模型的建立速度、减少模型库的储存空间,更为重要的是它便于模型的更新和维护。
在建立训练集之前,应首先剔除异常样本,这些异常样本可能含有异常化学组分或组分浓度较为极端,与其他样本存在显著差异。若这些样本点参与模型的建立,会影响分析模型的准确性和稳健性。
在本步骤中采用剔除的方式对训练样本进行选择,其基本过程为首先对样本光谱进行主成分(pca)分析后,利用主成分得分(示例性的pca分析主成分得分可见图5)作为特征计算每个样本与邻近样本之间的欧式距离,并根据样本分布的密度确定阈值。对于每一个样本,剔除与其距离小于阈值的样本,从而剔除冗余样本,剩余的样本作为训练样本。部分样本之间的欧式距离过小造成样本冗余,通过设定阈值并且剔除与其距离小于阈值的样本的方法来消除冗余样本。示例性的剔除异常样本点后训练集可见图6。
上述中所有样本两两之间的欧式距离dij按下式计算:
式中,dij:第i个样本和第j个样本之间的欧式距离;
m:为主成分数;
xi:为第i个样本的主成分得分;
xj:为第j个样本的主成分得分。
五、根据建模项目,确定近红外波数范围
本步骤对训练集中的光谱样本进行波数选择。随着对偏最小二乘等方法的深入研究,发现通过筛选特征波数或区间有可能得到更好地定量模型。通过波数选择可以简化模型,并且通过波数选择可以剔除不相关的变量,得到预测能力更强,稳健性更好的模型。
通常,波数选择范围为4000-12500cm-1之内的任何有限波数范围,可为多个波数段的组合。在本发明的某些实施方案中,对于密度选择波数范围为4247-6107cm-1、对于残炭选择波数范围4599-5456cm-1和6099-7500cm-1、对于酸值选择波数范围4599-7500cm-1、对于硫含量选择波数范围4599-7500cm-1、对于氮含量选择波数范围4500-6600cm-1、对于蜡含量选择波数范围4500-6600cm-1、对于胶质含量选择波数范围4500-6600cm-1、对于沥青质含量选择波数范围4500-6600cm-1和对于实沸点蒸馏选择波数范围为4599-7500cm-1。
六、利用偏最小二乘法建立原油性质与近红外光谱数据之间的数学关联模型
偏最小二乘回归与主成分回归相比,不仅仅考虑了光谱矩阵,同时也考虑了浓度矩阵的影响。此步骤利用经过预处理和波数选择的训练集中的原油样本的近红外光谱图与性质数值建立模型。该方法的数学关联模型如下式所示:
y=a0+a1x1+a2x2+…+anxn
其中,y为预测的性质,ai为模型参数,xi为光谱第i个波数点的吸光度。
在一个或多个实施方案中,所述数学关联模型如下建立:
(1)对光谱矩阵x和浓度矩阵y作标准化变换,变换后的矩阵分别记为v和u;
(2)计算v矩阵的权重ω′=u′v/u′u;
(3)对权重向量进行归一化ω′new=ωold′/(ωold′ωold)1/2;
(4)估计v矩阵得分向量t=vω′;
(5)计算u矩阵的载荷q′=t′u/t′t;
(6)产生u矩阵的得分向量u=uq/q′q;
比较u(old)与u(new),如果||u(old)-u(new)||<阈值,表明以收敛,迭代停止,否则转到第一步继续进行迭代;
(7)计算标量b用以内部关联b=u′t/t′t;
(8)计算v矩阵的载荷p′=t′v/t′t;
(9)计算v和u矩阵的残差e=v-tp′,f=u-uq′。
(10)计算预测标准差sep,如果sep大于预期精度,则表明最佳维数已得到,否则对下一维进行计算,则可得到最终的系数矩阵
b=w(p′w)-1q′。
本发明在预测待测原油样本的性质时,首先采用本发明步骤二中所述的方法测定待测原油样本的近红外光谱图,然后采用步骤三所述的方法对待测原油样本的近红外光谱图进行预处理,之后根据步骤五选择的波数范围选择变量,并利用步骤六中所建立的定量分析模型预测待测原油的相关性质。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,该领域的专业技术人员根据本发明的内容作出的一些非本质的改进和调整,仍属于本发明的保护范围。
实施例1
以下以硫含量预测的实施例来说明本发明具体步骤包括:
步骤一:采集不同种类的原油样本156个,122个作为校正集,34个作为验证集。
步骤二:样品温度控制在30℃,选用bruker布鲁克近红外光谱仪,以及配套可拆卸的底部带有蓝宝石光窗材料金属套筒的bruker布鲁克反射式近红外光纤探头,进行试验测定。通过将近红外光纤探头直接插入各原油样本的方式,测定原油样本的近红外光谱,光谱范围扫描范围为4000-12500cm-1,分辨率32cm-1,累计扫描次数400次。并且按照传统标准方法测量原油样本的硫含量和api。图3为原始的原油近红外光谱图。可以看到,原始光谱的基线漂移严重,谱峰重叠严重。
步骤三:选取8000-4000cm-1谱区范围的吸光度,对其进行一阶微分预处理,建立原油样本近红外光谱矩阵。图4为预处理之后的谱图。
步骤四:对预处理后的原油样本采用剔除的方式进行训练样本的选择,首先对预处理后的原油样本光谱进行主成分分析后,利用主成分得分(图5)作为特征计算每个样本与邻近样本之间的欧式距离,并对于每一个样本,比较其与邻近样本之间的欧氏距离与阈值1.8,剔除与其距离小于阈值的样本,本例中剔除样本14,27,35,86,91,101,111,117,122从而剔除冗余样本,剩余的样本作为训练样本。最终,选中103个训练样本构成原油光谱训练样本集(图6)。
步骤五:根据待测项目为硫含量,优选的波数区间为4599-7500cm-1;根据待测项目为api,优选的波数区间为4247-6107cm-1。
步骤六:运用偏最小二乘法建立硫含量值与近红外光谱的回归模型,预测属性与近红外光谱之间的关系如下式
y=a0+alxl+a2x2+…+anxn
其中:y为预测属性,ai为模型参数,xi为光谱第i个波数点的吸光度。
所建的硫含量回归模型如图7,所建的api回归模型如图8。利用验证集对模型进行验证:对待测原油样本首先根据步骤二测得近红外光谱,根据步骤三中的方法,对8000-4000cm-1谱区内对其进行一阶微分预处理,之后选择4599-7500cm-1(硫含量)或4247-6107cm-1(api)的波数区间,最后利用步骤六中建立的模型对其进行预测。硫含量模型的决定系数达0.9228,交互验证均方误差为0.373。api模型的决定系数达0.9674,交互验证均方误差为1.36预测值与实际值的比较结果如下表1所示,预测过程快速、简单,预测结果准确。
表1:原油api预测值与实际值结果对比
表2:原油硫含量预测值与实际值结果对比