本发明涉及层状盐岩水,具体涉及一种基于支持向量回归模型的层状盐岩水溶溶解速率预测方法。
背景技术:
1、层状盐岩(通常指盐岩层)是地质中一种重要的沉积岩石,它由盐矿物(主要是氯化钠)组成,以层状分布为特征,通常被埋藏在地下深处。这些盐岩层具有重要的化工和地质学意义,其水溶解速率的重要性体现在多个方面:
2、盐类的提取和加工:层状盐岩是食盐和工业盐的主要来源。了解盐岩的溶解速率对于提取和加工这些盐类产品非常重要。通过掌握溶解速率,可以更好地控制盐类的生产过程,提高生产效率和产品质量。
3、盐类溶解过程中的热效应:在工业领域中,有时需要对盐进行快速或大规模溶解。层状盐岩的溶解速率可以影响溶解过程中的热效应,例如温度变化和放热或吸热现象。了解这些热效应对于安全和工程设计至关重要,可以避免潜在的事故和设备故障。
4、地下储气库和储液库:层状盐岩通常被用作地下储气库和储液库。在这些场景中,了解盐岩的溶解速率至关重要。溶解速率的知识可以帮助管理和维护储气库和储液库的容量和稳定性,以确保安全储存和提取天然气、石油等。
5、地质储层稳定性:在地质勘探和工程领域,了解层状盐岩的溶解速率对于评估地质储层的稳定性非常重要。如果盐岩溶解速率较高,可能导致储层塌陷、地表下陷和地质灾害,严重影响工程项目的安全性和可持续性。
6、综上所述,层状盐岩的溶解速率在化工工业中具有重要性,涉及盐类的提取和加工、溶解过程中的热效应、地下储气库和储液库的管理、以及地质储层的稳定性评估等方面。这些知识有助于优化工艺设计、确保安全操作以及有效利用盐类资源。
7、当前对盐岩溶解速率的研究虽然对其部分因素进行了分析,揭示了一些相关的溶解规律,但却未能提供以溶解速率为目标的具体数学表达式或可靠的预测模型。这使得研究结论在盐岩水溶开采实际过程中的应用变得困难。特别是在盐岩水溶开采过程中,影响盐岩溶解速率的因素十分复杂,且难以通过实验进行有效的控制,因此建立多因素复杂条件下的盐岩溶解速率预测模型具有重要的实际意义。首先,这样的模型可以为盐岩水溶开采提供准确的预测,有助于优化生产过程,提高采收率。其次,对于难以直接测量或控制的因素,预测模型可以通过对已知因素的综合分析,提供对溶解速率的间接估计。这对于实际操作中的决策制定和过程优化具有重要意义。
8、目前预测方法众多,也较多都是通过收集实验室数据或现场检测数据作为数据集,通过传统数据分析方法例如:多元回归,多项式回归等进行递归拟合并预测,但结果拟合程度低,预测误差大;也有使用简单机器学习模型例如:人工神经网络ann等进行构建预测,但其考虑因素较少,模型也没有普适性,且优化不够到位,结果仍有较大误差。此外,基于自然条件下层状盐岩水溶溶解速率因素较多,具有非线性特征,而各影响要素间存在复杂的相互影响关系,所以目前难以用上述方法进行准确的预测。
9、因此,如何准确预测层状盐岩水溶溶解速率,是人们关心的问题。
10、为了解决以上问题,提出本发明。
技术实现思路
1、本发明采用支持向量回归模方法对层状盐岩水溶溶解速率进行了模拟研究,建立了基于遗传算法优化支持向量机的层状盐岩水溶溶解速率预测模型。本发明方法在预测关联nacl含量、不溶物含量、na2so4含量、溶液浓度、溶解倾角、温度等6个因素对溶解速率大小的影响规律方面预测准确度高,具有不可替代的优越性,必将在卤水化工领域得到广泛应用。
2、本发明采取点技术方案是:
3、本发明第一方面提供一种基于支持向量回归模型的层状盐岩水溶溶解速率预测方法,包括以下步骤:
4、(1)获得层状盐岩水溶溶解速率的基础数据;
5、(2)构建数据集,将数据分为目标集和特征集,并对数据进行标准化处理,然后将数据集分为训练集和测试集;
6、(3)建立支持向量回归模型,基于遗传算法优化对支持向量回归模型进行优化,得到用于实现层状盐岩水溶溶解速率预测的最优支持向量回归模型,然后将标准化后的训练集输入所述最优支持向量回归模型,测试所述最优支持向量回归模型性能;
7、(4)将标准化后的测试集输入到训练最优支持向量回归模型中,获得层状盐岩水溶溶解速率的预测值。
8、优选地,所述基础数据包括水溶溶解速率、nacl含量、不溶物含量、na2so4含量、溶液浓度、溶解倾角、温度。
9、优选地,所述目标集为水溶溶解速率数据集,所述特征集为所述nacl含量、所述不溶物含量、所述na2so4含量、所述溶液浓度、所述溶解倾角、所述温度的数据集。
10、优选地,步骤(2)中,使用standardscaler()方法将数据进行标准化处理:
11、标准化处理的计算公式为:x_scaled=(x-x.mean())/x.std();
12、其中:x.mean()为数据集的均值,x.std()为数据集的标准差。标准化处理的目的是将原数据集标准化为均值为0,方差为1的数据集。
13、优选地,步骤(2)中,将数据集以8:2的比例分为训练集和测试集。
14、优选地,步骤(3)中创建一个基于遗传算法优化的支持向量回归模型,包括以下步骤:
15、(31)选定rbf核函数、惩罚因子c、损失函数epsilon、核函数系数gamma,建立具有多个输入特征值以及一个输出值的支持向量回归模型;
16、(32)构建遗传算法,设置r2为适应度,对惩罚因子c、损失函数epsilon、核函数系数gamma设置调参范围,设置遗传每代个数以及遗传代数,最终得到最优超参数的值;
17、(33)最后将最优超参数输入到支持向量回归模型中得到最优支持向量回归模型。
18、优选地,步骤(32)中,最优的超参数惩罚参数c、损失函数epsilon、核系数gamma的解分别为c=104,epsilon=0.0778,gamma=3.9769。
19、相对于现有技术,本发明具有以下有益效果:
20、1.本发明填补了层状盐岩水溶溶解速率预测的空白。由于层状盐岩水溶溶解速率受到地下水溶条件(溶液浓度、溶解倾角、温度)和盐岩组分(nacl含量、不溶物含量、na2so4含量)影响,这些因素之间又相互影响,目前尚无多因素对层状盐岩水溶溶解速率的影响规律。
21、2.本发明采用支持向量回归模方法对层状盐岩水溶溶解速率进行了模拟研究,建立了基于遗传算法优化支持向量机的层状盐岩水溶溶解速率预测模型,本发明方法在预测关联nacl含量、不溶物含量、na2so4含量、溶液浓度、溶解倾角、温度等6个因素对溶解速率大小的影响规律方面预测准确度高,具有不可替代的优越性,必将在卤水化工领域得到广泛应用。
22、3.本发明利用模拟地下层状盐岩水溶开采实验得到的基础数据进行训练基于遗传算法优化的支持向量回归模型,其正确性经过验证后可反复使用,无需多次训练,使用简便。
23、4.根据对mlr和svr模型在训练集和测试集上的性能指标的比较,可以清晰地看出svr模型在各方面都明显优于mlr模型。具体而言,svr模型在训练集和测试集上的均方根误差(rmse)和平均绝对误差(mae)都远远低于mlr模型,差异分别达到了约9.01和14.61(对于rmse),以及约10.04和9.91(对于mae)。此外,在平均绝对百分比误差(mape)方面,svr模型在训练集和测试集上的表现也比mlr模型优异,分别降低了约11.36个百分点和6.88个百分点。最后,在决定系数(r2)方面,svr模型在训练集和测试集上的r2值也分别高出约0.41和0.53。综合来看,这些差异值表明svr模型相对于mlr模型在预测精度和数据拟合方面都具有显著的优势。