本发明属于油气田开发,尤其涉及一种基于测井数据的多任务储层参数预测方法。
背景技术:
1、测井,也叫地球物理测井,是利用岩层的电化学特性、导电特性、声学特性、放射性等地球物理特性,测量地球物理参数的方法,属于应用地球物理方法之一。利用测井资料预测储层参数是油气田开发的重要内容。
2、孔隙度(por)、渗透率(perm)和含水饱和度(sw)是储层的重要物性参数,要想为储层评价提供可靠的参考依据,就必须对它们进行准确计算。目前在油田勘探开发领域中,确定储层物性参数的方法主要有两种:一是直接法,即利用仪器设备直接对钻井取心后的岩石进行物理分析测试,获得参数结果,但由于岩心样本在实际工程中获取十分有限,并不能准确估计整个工区的物性参数,尤其是老油气田、老井的测井系列资料不齐全,储层评价难度大;二是间接法,根据测井资料利用岩石地层的地球物理特性建立数学方程或者经验公式来间接计算储层物性参数,可分为常规测井解释方法和机器学习方法两大类,但该方法所构成的经验公式、统计模型可移植性差,且未充分考虑到储层参数与测井数据之间复杂的非线性特征映射关系及空间的连续性。
3、随着数据驱动时代的到来以及数字油田的普及,通过测井技术可以得到大量岩石特性参数,它们之间存在极其复杂的非线性关系,利用直接法和常规测井解释法计算储层参数显然存在着许多制约。部分专家学者开始使用机器学习算法来解决储层参数预测不精等问题。这些机器学习算法相较于传统的岩石物理模型和地质参数建模,在预测效果上表现更佳。然而,也存在一些局限,首先,这些模型在复杂地质区块上的泛化能力会受到一定的制约;其次,大多数算法未充分考虑测井数据和储层参数的时序特点,忽略了测井数据随地层深度的变化趋势和相关性,因此预测精度有待进一步提高。
4、现有地球物理测井机器学习的研究主要是基于单任务学习,单任务学习的局限性在于面对复杂问题时需要将其分解为多个单一独立的子问题,逐一解决再归纳合并,从而得到原始复杂问题的解。然而地球物理测井中的许多复杂问题内部相互关联,无法分解为单一独立的子问题。此外,如果将储层参数预测分解为单任务处理,会忽略储层参数之间的关联信息。相较于单任务机器学习,多任务学习在储层参数预测方面更具优势。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种基于测井数据的多任务储层参数预测方法,本发明能充分捕捉储层参数与测井数据之间复杂关系,解决了传统方法未能充分利用测井数据随地层深度变化趋势的问题。
2、为了达到以上目的,本发明采用的技术方案为:一种基于测井数据的多任务储层参数预测方法,包括以下步骤:
3、s1、获取测井曲线数据,并对测井曲线数据进行预处理;
4、s2、构建lstm-cnn曲线重构模型,并对经预处理后的测井缺失曲线数据进行重构;
5、s3、构建transformer多任务模型,并根据重构后的测井缺失曲线数据,利用transformer多任务模型对储层参数进行预测,完成对多任务储层参数的预测。
6、本发明的有益效果是:本发明能实现在老井场景下的应用,本发明利用lstm-cnn曲线重构模型对测井缺失曲线数据进行重构,在提高了准确率的基础上,确保了后续预测数据的完整性,并采用transformer多任务模型对储层参数进行预测,该transformer多任务模型充分捕捉储层参数与测井数据之间复杂关系,相较于传统方法,平均预测储层参数的均方根误差降低了约15%,相关系数提高了约11%,解决了传统方法未能充分利用测井数据随地层深度变化趋势的问题。
7、进一步地,所述s1包括以下步骤:
8、s101、收集测井曲线数据,并进行逐井检查,以对拼接曲线单位进行统一,对井位曲线进行深度校正;
9、s102、将检查后的测井曲线数据分为特征曲线数据和待重构曲线数据,以获取测井曲线数据;
10、s103、利用k邻近分类算法对获取的测井曲线数据中的缺失进行填充;
11、s104、根据经缺失填充后的测井曲线数据,对超出预设范围的测井曲线数据利用有效值进行替换;
12、s105、根据替换后的测井曲线数据,对于上下限差距最大的测井曲线数据,使其落在预设范围内;
13、s106、经s105处理后的测井曲线数据,对每个序列进行归一化处理;
14、s107、根据经归一化处理后的测井曲线数据,通过滑动窗口将原始数据划分为若干个子序列,完成对测井曲线数据的预处理。
15、上述进一步方案的有益效果是:本发明通过单位统一、深度校正和异常值处理,确保测井曲线数据的一致性和可靠性;通过缺失值填充和异常值替换,增强测井曲线数据的完整性,减少缺失和异常数据对分析的影响;通过归一化处理,使得测井曲线数据尺度一致,提高模型的训练效果;通过滑动窗口划分数据,增强对局部特征的捕捉能力,提高模型的学习效果。整体上,这些步骤共同作用,显著提升了测井曲线数据的质量和可用性,为后续的分析和建模提供了高质量的数据基础。
16、再进一步地,所述s2包括以下步骤:
17、s201、构建lstm-cnn曲线重构模型;
18、s202、将经预处理后的测井曲线数据划分为训练集、测试集以及验证集,其中,利用训练集对lstm-cnn曲线重构模型进行训练,利用验证集评估lstm-cnn曲线重构模型在训练过程中的性能,利用测试集评估lstm-cnn曲线重构模型的性能,且不参与lstm-cnn曲线重构模型的训练;
19、s203、利用均方误差作为lstm-cnn曲线重构模型的损失函数;
20、s204、利用平均绝对百分比误差评估lstm-cnn曲线重构模型的精度;
21、s205、针对精度达到要求后,将待重构数据的测井曲线数据输入至lstm-cnn曲线重构模型中,并对预测输出通过反归一化处理,得到与对应真实数据尺度相同的预测数据;
22、s206、利用与对应真实数据尺度相同的预测数据填充重构测井曲线数据的缺失部分,完成对经预处理后的测井缺失曲线数据的重构。
23、上述进一步方案的有益效果是:lstm-cnn曲线重构模型结合了长短期记忆网络lstm和卷积神经网络cnn的优势,能够同时捕捉时间序列数据的长短期赖关系和局部特征,提高了重构精度;通过合理的数据集划分,确保了lstm-cnn曲线重构模型的泛化能力和可靠性,防止过拟合;使用均方误差和平均绝对百分比误差作为损失函数和评估指标,有效衡量和提高模型的重构性能;通过反归一化处理恢复预测数据的原始尺度,使得重构结果在实际应用中更具可靠性;重构后的数据填补了缺失部分,增强了数据的连续性和完整性,为后续地质分析和决策提供了高质量的数据基础。
24、再进一步地,所述lstm-cnn曲线重构模型包括卷积网络以及长短期记忆网络lstm;
25、所述卷积网络,用于提取经预处理后的测井缺失曲线数据的特征;
26、所述长短期记忆网络lstm,用于根据提取的特征,对测井曲线序列进行预测,并经过反归一化后,利用与对应真实数据尺度相同的预测数据填充重构测井曲线数据的缺失部分。
27、上述进一步方案的有益效果是:lstm-cnn曲线重构模型结合了长短期记忆网络lstm和卷积神经网络cnn的优点,能够有效捕捉时间序列数据的长短期依赖关系以及局部特征。长短期记忆网络lstm用于处理时间序列数据,捕捉长时间依赖信息;卷积神经网络cnn用于提取局部特征,提高lstm-cnn曲线重构模型对复杂模式的识别能力,该lstm-cnn曲线重构模型结构提升了曲线重构的准确性和有效性。
28、再进一步地,所述s3包括以下步骤:
29、s301、构建transformer多任务模型;
30、s302、将重构后的测井缺失曲线数据作为输入数据,并通过线性变换将输入数据映射至高维嵌入空间:;其中,表示高维嵌入后的测井曲线数据,表示输入数据,表示权重矩阵,表示偏置向量;
31、s303、根据映射结果,利用构建的transformer多任务模型对储层参数进行预测,完成对多任务储层参数的预测,其中,在多任务学习中,对于孔隙度和含水饱和度,利用均方误差作为损失函数,对于渗透率,利用下式中平滑的l1损失函数smoothl1loss作为损失函数,且在多任务学习中,利用不确定性加权损失函数动态调整每个任务的损失权重:;其中,表示损失函数的值,表示真实值与预测值之间的差值,时,平滑的l1损失函数smoothl1loss退化为平方损失,时平滑的l1损失函数smoothl1loss退化为绝对损失,表示取绝对值;
32、所述不确定性加权损失函数的表达式如下:;其中,表示不确定性加权损失函数, i表示第 i个任务,表示任务的不确定性参数,表示第 i个任务的损失。
33、上述进一步方案的有益效果是:transformer多任务模型擅长处理长时间序列数据,能够捕捉到数据中的复杂特征关系;多任务学习方法利用任务间的相关性,提升了整体预测性能和效率,transformer多任务模型能够同时优化多个储层参数预测任务,提供更全面的预测结果;通过线性变换将输入数据映射到高维嵌入空间,使得transformer多任务模型能够更好地表示和学习数据特征,提高预测精度;不确定性加权损失函数动态调整每个任务的损失权重,使得transformer多任务模型在训练过程中更加灵活,能够根据各任务的难度自适应调整,提高transformer多任务模型的鲁棒性;结合以上技术,transformer多任务模型能够更高效地处理和预测储层参数,提高整体预测精度,为后续的地质分析和决策提供高质量的数据支持。
34、再进一步地,所述transformer多任务模型包括若干个编码器和若干个解码器:
35、编码器,用于根据映射结果,通过下式,提取输入数据的特征:;其中,表示transformer多任务模型的编码器;
36、解码器,用于根据提取的特征以及目标序列,对储层参数进行预测,生成预测输出,并利用下式,将预测输出映射至任务对应的输出维度:;;其中,表示第 i个任务的输出,和分别表示第 i个任务解码器的权重矩阵和偏置矩阵,表示transformer多任务模型的解码器,表示目标序列。
37、上述进一步方案的有益效果是:通过引入编码器和解码器的详细架构,transformer多任务模型在特征提取和预测生成方面的能力得到了显著增强,为储层参数的高效预测和分析提供了更先进、更可靠的技术手段。
38、再进一步地,所述transformer多任务模型的训练过程如下:
39、a1、初始化transformer多任务模型,包括transformer多任务模型参数和不确定性参数;
40、a2、对于每个任务,将输入数据通过transformer多任务模型,得到预测输出,并分别计算每个任务的损失;
41、a3、利用不确定性加权损失函数对各任务的损失函数进行加权求和;
42、a4、通过反向传播,分别计算不确定性加权损失函数对transformer多任务模型参数的梯度和不确定性参数的梯度;
43、a5、使用adam优化器分别更新transformer多任务模型参数和不确定性参数;
44、a6、重复a2到a5,直到不确定性加权损失函数收敛,完成对transformer多任务模型的训练。
45、上述进一步方案的有益效果是:初始化transformer多任务模型参数和不确定性参数,有效避免训练初期的梯度消失或爆炸问题,加速transformer多任务模型收敛;对每个任务分别计算损失,使得transformer多任务模型能够精确捕捉每个任务的具体需求和难度,有助于提升多任务学习的精度;利用不确定性加权损失函数,根据每个任务的预测不确定性动态调整损失权重,平衡各任务的贡献,避免过拟合或欠拟合;通过反向传播计算梯度,确保参数更新的方向和幅度,使得transformer多任务模型能够逐步降低损失,优化性能;使用adam优化器更新transformer多任务模型参数和不确定性参数,加速训练过程,提高transformer多任务模型收敛速度和稳定性,增强训练过程的灵活性和自适应性。整体上,通过详细的训练过程描述,transformer多任务模型在训练效率、收敛、预测精度和灵活性等方面的能力得到了显著提升,为储层参数的高效预测和分析提供了更先进、更可靠的技术手段。
46、再进一步地,所述transformer多任务模型参数的梯度的表达式如下:;其中,表示transformer多任务模型参数;
47、所述不确定性参数的梯度的表达式如下:。
48、上述进一步方案的有益效果是:初始化transformer多任务模型参数和不确定性参数,有效避免训练初期的梯度消失或爆炸问题,加速transformer多任务模型收敛;对每个任务分别计算损失,使得transformer多任务模型能够精确捕捉每个任务的具体需求和难度,有助于提升多任务学习的精度;利用不确定性加权损失函数,根据每个任务的预测不确定性动态调整损失权重,平衡各任务的贡献,避免过拟合或欠拟合;通过反向传播计算梯度,确保参数更新的方向和幅度,使得模型能够逐步降低损失,优化性能;使用adam优化器更新模型参数和不确定性参数,加速训练过程,提高模型收敛速度和稳定性,增强训练过程的灵活性和自适应性。
49、再进一步地,所述transformer多任务模型参数和不确定性参数的更新,具体为:
50、利用adam优化器,通过计算梯度更新transformer多任务模型参数和不确定性参数,其中,adam优化器的更新规则如下:;其中,和分别表示更新后的参数和更新前的参数,表示学习率,和分别表示动量估计和二阶动量估计的偏差校正,表示极小值。
51、上述进一步方案的有益效果是:adam优化器结合了动量和自适应学习率调整的优点,能够高效且稳健地更新transformer多任务模型参数。使用adam优化器,可以加速训练过程,提高transformer多任务模型收敛速度,并确保参数更新的稳定性。对不确定性参数的更新使得transformer多任务模型能够动态调整各任务的损失权重,提高训练过程的灵活性和自适应性。