1.本发明涉及气井生产动态预测技术领域,尤其涉及一种面向碳酸盐岩气井的短周期产气量预测方法及系统。
背景技术:2.天然气是我国能源结构转型中的连接桥梁,用天然气代替煤炭和石油消费能够大大促进“双碳”目标的实现。天然气的产量预测是油气藏开发工程研究的主要内容之一,是开发方案编制和生产制度动态调整的重要依据,准确预测碳酸盐岩气井的动态产量,可以帮助研究人员科学评估开发的成本、风险和收益,制定合理的开采方案,对油气田企业把控生产制度、调整生产计划和决策有着重要的指导意义。
3.在实际开采过程中,碳酸盐岩气井会由于生产时间短或作业引起的间断性而导致无法获取长期完整的生产数据,而传统的数值模拟方法和产量递减曲线分析方法在进行产量预测时需要获取完整的地层资料及开发资料,对数据的要求极高,且计算量巨大,应用条件极为苛刻。随着机器学习方法在油气田开发领域的应用,也有更多学者应用神经网络算法,如经典时间序列模型中的长短期记忆网络和门控循环网络实现对油气产量的预测,但此类网络模型的建立往往需要目标气井已有两三年甚至更长时间的生产动态数据,并且在网络数量较多时训练速度缓慢,计算成本高昂。
4.基于上述情况,亟需一种针对短周期、高精度的碳酸盐岩气井生产动态预测方法。
技术实现要素:5.针对现有技术存在的问题,本发明提供了一种面向碳酸盐岩气井的短周期产气量预测方法及系统,具有较高预测精度且能够适应油气藏在某开发阶段内短周期的产气量预测。
6.一种面向碳酸盐岩气井的短周期产气量预测方法,包括:
7.对天然气生产数据进行预处理;
8.对所有气井进行近邻传播聚类,并得到每个井群类别的聚类中心;
9.利用极大似然法判别目标气井的所属类别;
10.采用时间卷积网络对目标气井的未来短期内产气量进行预测。
11.优选地,所述的对天然气生产数据进行预处理,具体包括:
12.对原始数据进行初步筛选与清洗,最终选择日产气量、日产水量、累计产气量、累计产水量、最高油压、最低油压、平均油压、最高套压、最低套压、平均套压、关井油压、关井套压、输压共13个生产指标作为输入变量;
13.根据每口气井的日产气量数据计算单一气井日产气量的绝对波动率:
[0014][0015]
式中:t为生产天数,x
t
为第t天的产气量,x
t+1
为第t+1天的产气量,同样根据其日
产气量数据计算单一气井日产气量的相对波动率:
[0016][0017]
对所有生产指标进行归一化处理,将所有数据映射到0~1的范围内。
[0018]
优选地,所述的对所有气井进行近邻传播聚类,并得到每个井群类别的聚类中心,具体包括:
[0019]
将绝对波动率和相对波动率作为聚类算法的输入变量,通过欧氏距离计算任意两口气井之间的相似度,得到所有气井间的相似度矩阵;
[0020]
分别计算任意两口气井间的吸引度和归属度,其中吸引度信息r(i,k)代表气井k作为气井i的聚类中心的合适程度,归属度信息a(i,k)代表气井i选择气井k作为聚类中心的合适程度,得到所有气井之间的吸引度矩阵和归属度矩阵;
[0021]
迭代更新每个气井的吸引度信息和归属度信息,当出现r(k,k)+a(k,k)>0时将气井k视为一个聚类中心,将吸引度信息和归属度信息之和最大的气井作为某个井群类别的聚类中心,直到所有聚类中心不再发生改变或是迭代次数达到设定阈值,视为聚类收敛;
[0022]
收敛后根据剩余气井与聚类中心的相似度,将剩余的气井分配到其对应的类别中,得到最终聚类后的m个井群类别。
[0023]
优选地,所述的利用极大似然法判别目标气井的所属类别,具体包括:
[0024]
将绝对波动率和相对波动率作为极大似然估计的输入变量,假定m个井群类别中所有气井的数据{x1,x2,...,xn}(总共n口气井)都服从高斯正态分布,则对每个类别都构建其对应的概率密度函数:
[0025][0026]
式中:μ是均值,∑是协方差矩阵,|∑|是∑的行列式,∑-1
是∑的逆矩阵,d是数据维度;
[0027]
根据似然函数l(μ,σ)=f
μ,σ
(x1)f
μ,σ
(x2)f
μ,σ
(x3)......f
μ,σ
(xn)求得每个类别对应的概率密度函数的最优均值和协方差矩阵组合(uj*,∑j*),j∈(1,2,...,m),使每个类别在其对应最优均值和协方差矩阵组合下产生的概率最大;
[0028]
对于一口待预测的目标气井x,代入所有类别的最优均值和协方差矩阵组合计算其对应类别的概率密度得到其概率密度值最大的类别:则判定目标气井x属于第d类井群。
[0029]
优选地,所述的采用时间卷积网络对目标气井的未来短期内产气量进行预测,具体包括:
[0030]
通过一维卷积对生产数据进行处理,将13个生产指标进行横向的扩充,再将此训练数据重塑为(样本数目
×
时间步长
×
特征数目)的三维数据,作为时间卷积网络的输入变量;
[0031]
将目标气井所属类别的聚类中心的处理后数据作为训练集,对时间卷积网络进行训练;
[0032]
利用训练好的时间卷积网络对目标气井的未来短期内产气量进行预测。
[0033]
一种面向碳酸盐岩气井的短周期产气量预测系统,包括:
[0034]
预测时长确定模块,用于输入想要得到的预测天数;
[0035]
数据处理模块,用于对天然气生产数据进行预处理;
[0036]
井群划分模块,用于对所有气井进行近邻传播聚类,并得到每个井群类别的聚类中心;
[0037]
气井匹配模块,用于利用极大似然法判别目标气井的所属类别;
[0038]
产气量预测模块,用于采用时间卷积网络对目标气井的未来短期内产气量进行预测。
[0039]
优选地,所述的数据处理模块包括:
[0040]
数据筛选单元,用于对原始数据进行初步筛选与清洗,最终选择日产气量、日产水量、累计产气量、累计产水量、最高油压、最低油压、平均油压、最高套压、最低套压、平均套压、关井油压、关井套压、输压共13个生产指标作为输入变量;
[0041]
波动率计算单元,用于根据每口气井的日产气量数据计算单一气井日产气量的绝对波动率:
[0042][0043]
式中:t为生产天数,x
t
为第t天的产气量,x
t+1
为第t+1天的产气量,同样根据其日产气量数据计算单一气井日产气量的相对波动率:
[0044][0045]
归一化处理单元,用于对所有生产指标进行归一化处理,将所有数据映射到0~1的范围内。
[0046]
优选地,所述的井群划分模块包括:
[0047]
相似度计算单元,用于将绝对波动率和相对波动率作为聚类算法的输入变量,通过欧氏距离计算任意两口气井之间的相似度,得到所有气井间的相似度矩阵;
[0048]
吸引度和归属度计算单元,用于分别计算任意两口气井间的吸引度和归属度,其中吸引度信息r(i,k)代表气井k作为气井i的聚类中心的合适程度,归属度信息a(i,k)代表气井i选择气井k作为聚类中心的合适程度,得到所有气井之间的吸引度矩阵和归属度矩阵;
[0049]
迭代更新单元,用于迭代更新每个气井的吸引度信息和归属度信息,当出现r(k,k)+a(k,k)>0时将气井k视为一个聚类中心,将吸引度信息和归属度信息之和最大的气井作为某个井群类别的聚类中心,直到所有聚类中心不再发生改变或是迭代次数达到设定阈值,视为聚类收敛,
[0050]
聚类分配单元,用于收敛后根据剩余气井与聚类中心的相似度,将剩余的气井分
配到其对应的类别中,得到最终聚类后的m个井群类别。
[0051]
优选地,所述的气井匹配模块包括:
[0052]
概率密度函数构建单元,用于假定m个井群类别中所有气井的绝对波动率和相对波动率数据{x1,x2,
…
,xn}(总共n口气井)都服从高斯正态分布,则对每个类别都构建其对应的概率密度函数:
[0053][0054]
式中:μ是均值,∑是协方差矩阵,|∑|是∑的行列式,∑-1
是∑的逆矩阵,d是数据维度;
[0055]
最优参数组合求解单元,用于根据似然函数l(μ,σ)=f
μ,σ
(x1)f
μ,σ
(x2)f
μ,σ
(x3)......f
μ,σ
(xn)求得每个类别对应的概率密度函数的最优均值和协方差矩阵组合(uj*,∑j*),j∈(1,2,...,m),使每个类别在其对应最优均值和协方差矩阵组合下产生的概率最大;
[0056]
井群类别判定单元,用于将一口待预测的目标气井x,代入所有类别的最优均值和协方差矩阵组合计算其对应类别的概率密度得到其概率密度值最大的类别:则判定目标气井x属于第d类井群。
[0057]
优选地,所述的产气量预测模块包括:
[0058]
输入处理单元,用于通过一维卷积对生产数据进行处理,将13个生产指标进行横向的扩充,再将此训练数据重塑为(样本数目
×
时间步长
×
特征数目)的三维数据,作为时间卷积网络的输入变量;
[0059]
模型训练单元,用于将目标气井所属类别的聚类中心的数据作为训练集,对时间卷积网络进行训练;
[0060]
模型预测单元,用于利用训练好的时间卷积网络对目标气井的未来产气量进行预测,得到预测时长确定模块所输入预测天数的产气量结果。
[0061]
采用上述技术方案所产生的有益效果在于:针对开发周期相对较短的碳酸盐岩气井的未来产气量预测,提出了一种新的面向碳酸盐岩气井的短周期产气量预测方法及系统,构建了基于机器学习的气井产量预测模型。首先采用近邻传播算法对碳酸盐岩气井进行无监督聚类,获取气井的典型生产规律并得到不同井群的聚类中心;接着利用极大似然估计法对目标气井的类别进行判别,找出其最相似的井群;最后利用气井所属类别的聚类中心训练卷积神经网络,预测碳酸盐岩气井的未来短期内的产气量,有效解决了短周期碳酸盐岩气井无法构建高精度时间序列模型这一问题。通过对碳酸盐岩气井的无监督聚类,可以实现模型自主训练获取井群类别,能够更好获取气井的生产规律,提高预测精度。同时采用时间卷积网络对模型进行训练,能够更好解决传统时间序列模型中的长距离依赖问题,有效避免类rnn模型所普遍存在的梯度消失或者梯度爆炸问题,在减少数据遗漏的同时提高了模型预测的准确率。
附图说明
[0062]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0063]
图1为本发明一种面向碳酸盐岩气井的短周期产气量预测方法实施例的方法流程图。
[0064]
图2为本发明一种面向碳酸盐岩气井的短周期产气量预测系统实施例的结构示意图。
具体实施方式
[0065]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0066]
本发明的目的是提供一种面向碳酸盐岩气井的短周期产气量预测方法及系统,提高生产周期相对较短的碳酸盐岩气井的未来日产气量的预测准确率。
[0067]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0068]
参考图1,为本发明一种面向碳酸盐岩气井的短周期产气量预测方法实施例的方法流程图,所述方法包括以下步骤:
[0069]
步骤s101,对天然气生产数据进行预处理,具体步骤包括:
[0070]
对原始数据进行初步筛选与清洗,最终选择日产气量、日产水量、累计产气量、累计产水量、最高油压、最低油压、平均油压、最高套压、最低套压、平均套压、关井油压、关井套压、输压共13个生产指标作为输入变量;
[0071]
根据每口气井的日产气量数据计算单一气井日产气量的绝对波动率:
[0072][0073]
式中:t为生产天数,x
t
为第t天的产气量,x
t+1
为第t+1天的产气量,同样根据其日产气量数据计算单一气井日产气量的相对波动率:
[0074][0075]
对所有生产指标进行归一化处理,将所有数据映射到0~1的范围内。
[0076]
步骤s102,对所有碳酸盐岩气井进行近邻传播聚类,并得到每个井群类别的聚类中心,具体步骤包括:
[0077]
将所有碳酸盐岩气井的绝对波动率和相对波动率{x1,x2,...,xn}作为聚类算法的输入变量(总共n口气井),通过欧氏距离s(i,k)=-||x
i-xk||2计算任意气井i与气井j之间
的相似度s(i,k),得到所有气井间的相似度,组成n
×
n的相似度矩阵;
[0078]
分别计算任意两口气井间的吸引度和归属度,其中吸引度信息r(i,k)代表气井k作为气井i的聚类中心的合适程度,归属度信息a(i,k)代表气井i选择气井k作为聚类中心的合适程度,得到所有气井之间的吸引度矩阵和归属度矩阵:
[0079]
r(i,k)
←
s(i,k)-max
k's.t.k'≠k
{a(i,k')+s(i,k')}
[0080][0081]
式中:i,i’,k,k’分别代表气井数据点;
[0082]
迭代更新每个气井的吸引度信息和归属度信息,当出现r(k,k)+a(k,k)>0时将气井k视为一个聚类中心,将吸引度信息和归属度信息之和最大的气井作为某个井群类别的聚类中心,直到所有聚类中心不再发生改变或是迭代次数达到设定阈值,视为聚类收敛;
[0083]
收敛后根据剩余气井与聚类中心的相似度,将剩余的气井分配到其对应的类别中,得到最终聚类后的m个井群类别。
[0084]
步骤s103,利用极大似然法判别待预测气井的所属类别,具体步骤包括:
[0085]
将n口碳酸盐岩气井以及目标气井的绝对波动率和相对波动率作为极大似然估计的输入变量,假定聚类后得到的每个类别中的样本数据都服从高斯正态分布,则对于每个类别都构建其对应的概率密度函数:
[0086][0087]
式中:μ是均值,∑是协方差矩阵,|∑|是∑的行列式,∑-1
是∑的逆矩阵,d是数据维度;
[0088]
假设任意某类别的样本数据在从高斯分布n(μ*,σ*)时产生的概率最大,得到其对应似然函数为:
[0089]
l(μ,σ)=f
μ,σ
(x1)f
μ,σ
(x2)f
μ,σ
(x3)......f
μ,σ
(xn)
[0090]
对上式取对数可得:
[0091][0092]
对上式求导,得到方程组:
[0093][0094]
对上式联合求解得到:
[0095][0096]
对于每个类别都求解其概率密度函数的最优均值和协方差矩阵组合(uj*,∑j*),j∈(1,2,...,m),使每个类别在其对应最优参数组合下产生的概率最大;
[0097]
对于一口待预测的目标气井x,代入所有类别的最优参数组合计算其对应类别的概率密度得到其概率密度值最大的类别:则判定目标气井x属于第d类井群。
[0098]
步骤s104,采用时间卷积网络对目标气井的未来短期内产气量进行预测,具体步骤包括:
[0099]
通过一维卷积对生产数据进行处理,将13个生产指标进行横向的扩充,再将此训练数据重塑为(样本数目
×
时间步长
×
特征数目)的三维数据,作为时间卷积网络的输入变量;
[0100]
将目标气井所属类别的聚类中心,也就是第d类井群的聚类中心的生产数据作为训练集,对时间卷积网络进行训练;
[0101]
将目标气井的生产数据作为测试集,将反复调试后训练好的时间卷积网络对目标气井的未来短期内产气量进行预测。
[0102]
参考图2,为本发明一种面向碳酸盐岩气井的短周期产气量预测系统实施例的结构示意图,所述系统包括以下模块:
[0103]
预测时长确定模块201,用于输入想要得到的预测天数;
[0104]
数据处理模块202,用于对天然气生产数据进行预处理,具体包括:
[0105]
数据筛选单元,用于对原始数据进行初步筛选与清洗,最终选择日产气量、日产水量、累计产气量、累计产水量、最高油压、最低油压、平均油压、最高套压、最低套压、平均套压、关井油压、关井套压、输压共13个生产指标作为输入变量;
[0106]
波动率计算单元,用于根据每口气井的日产气量数据计算单一气井日产气量的绝对波动率:
[0107][0108]
式中:t为生产天数,x
t
为第t天的产气量,x
t+1
为第t+1天的产气量,同样根据其日产气量数据计算单一气井日产气量的相对波动率:
[0109][0110]
归一化处理单元,用于对所有生产指标进行归一化处理,将所有数据映射到0~1的范围内。
[0111]
井群划分模块203,用于对所有气井进行近邻传播聚类,并得到每个井群类别的聚
类中心,具体包括:
[0112]
相似度计算单元,用于将所有碳酸盐岩气井的绝对波动率和相对波动率{x1,x2,...,xn}作为聚类算法的输入变量(总共n口气井),通过欧氏距离s(i,k)=-||x
i-xk||2计算任意气井i与气井j之间的相似度s(i,k),得到所有气井间的相似度,组成n
×
n的相似度矩阵;
[0113]
吸引度和归属度计算单元,用于分别计算任意两口气井间的吸引度和归属度,其中吸引度信息r(i,k)代表气井k作为气井i的聚类中心的合适程度,归属度信息a(i,k)代表气井i选择气井k作为聚类中心的合适程度,得到所有气井之间的吸引度矩阵和归属度矩阵:
[0114]
r(i,k)
←
s(i,k)-max
k's.t.k'≠k
{a(i,k')+s(i,k')}
[0115][0116]
式中:i,i’,k,k’分别代表气井数据点;
[0117]
迭代更新单元,用于迭代更新每个气井的吸引度信息和归属度信息,当出现r(k,k)+a(k,k)>0时将气井k视为一个聚类中心,将吸引度信息和归属度信息之和最大的气井作为某个井群类别的聚类中心,直到所有聚类中心不再发生改变或是迭代次数达到设定阈值,视为聚类收敛;
[0118]
聚类分配单元,用于收敛后根据剩余气井与聚类中心的相似度,将剩余的气井分配到其对应的类别中,得到最终聚类后的m个井群类别。
[0119]
气井匹配模块204,用于利用极大似然法判别目标气井的所属类别,具体包括:
[0120]
概率密度函数构建单元,用于将n口碳酸盐岩气井以及目标气井的绝对波动率和相对波动率作为极大似然估计的输入变量,假定聚类后得到的每个类别中的样本数据都服从高斯正态分布,对于每个类别都构建其对应的概率密度函数:
[0121][0122]
式中:μ是均值,∑是协方差矩阵,|∑|是∑的行列式,∑-1
是∑的逆矩阵,d是数据维度;
[0123]
最优参数组合求解单元,用于假设任意某类别的样本数据在从高斯分布n(μ*,σ*)时产生的概率最大,得到其对应似然函数为:
[0124]
l(μ,σ)=f
μ,σ
(x1)f
μ,σ
(x2)f
μ,σ
(x3)......f
μ,σ
(xn)
[0125]
对上式取对数可得:
[0126][0127]
对上式求导,得到方程组:
[0128][0129]
对上式联合求解得到:
[0130][0131]
对于每个类别都求解其概率密度函数的最优均值和协方差矩阵组合(uj*,∑j*),j∈(1,2,...,m),使每个类别在其对应最优参数组合下产生的概率最大;
[0132]
井群类别判定单元,用于将一口待预测的目标气井x,代入所有类别的最优参数组合计算其对应类别的概率密度得到其概率密度值最大的类别:则判定目标气井x属于第d类井群。
[0133]
产气量预测模块205,用于采用时间卷积网络对目标气井的未来短期内产气量进行预测,具体包括:
[0134]
输入处理单元,用于通过一维卷积对生产数据进行处理,将13个生产指标进行横向的扩充,再将此训练数据重塑为(样本数目
×
时间步长
×
特征数目)的三维数据,作为时间卷积网络的输入变量;
[0135]
模型训练单元,用于将目标气井所属类别的聚类中心,也就是第d类井群的聚类中心的生产数据作为训练集,对时间卷积网络进行训练;
[0136]
模型预测单元,用于将目标气井的生产数据作为测试集,将反复调试后训练好的时间卷积网络对目标气井的未来产气量进行预测,得到预测时长确定模块所输入预测天数的产气量结果。
[0137]
进一步的,为了更加清楚的说明本发明提供的技术方案的优点,下面以具体的实施为例进行说明:
[0138]
以四川盆地某碳酸盐岩气井为分析对象,选取其中生产周期较长(2020年10月至2021年5月)的64口气井作为本模型的训练样本,生产周期较短(2021年4月至2021年7月)的10口气井作为预测的测试样本。聚类后得到三个井群类别,每个井群的聚类中心以及目标气井匹配结果如表1所示:
[0139]
表1
[0140]
井群类别聚类中心(井号)目标气井(井号)第一类mx008-h3mx008-6-x1、mx16c1、mx201第二类mx022-x11mx022-h30、mx022-h26、mx022-h23第三类mx17mx12、mx022-x17、mx022-x6、mx008-x2
[0141]
根据每个井群聚类中心的生产数据分别训练产气量预测模型,对10口目标气井2021年7月的日产气量进行预测,进一步的,参考表2:
[0142]
表2
[0143][0144]
表格中展示了利用本专利技术方案所得到的各井群类别下所有目标气井未来短期内日产气量真实值与预测值的平均绝对百分误差(mape)。用此误差来评价本专利模型的预测精度,其值越小,说明预测值与真实值之间的误差越小,模型的拟合程度越好,预测结果越可靠。可以看出,本专利模型最终得到所有目标气井的平均mape值为5.53%,并且每个井群类别下的平均mape都小于10%,说明该模型对生产周期相对较短的碳酸盐岩气井的日产气量有着较好的预测效果。
[0145]
进一步的,对待预测的10口目标气井的生产数据进行划分,利用长短期记忆网络(lstm)和门控循环网络(gru)模型对(2021年4月到5月)两个月的生产数据进行训练,将(2021年6月)的生产数据作为测试集,对同样2021年7月的日产气量进行预测,参考表3:
[0146]
表3
[0147]
模型平均mape/%本专利模型5.53%lstm模型8.98%gru模型9.06%
[0148]
表格中展示了10口目标气井分别在本专利模型和两种经典时间序列模型训练下的预测结果误差对比,可以看出,本专利模型的平均mape最小,相较于经典的时间序列模型,准确率有明显的提升,预测结果更优秀,验证了本发明的可行性。
[0149]
综上所述,与现有技术相比,本发明公开的一种面向碳酸盐岩气井的短周期产气量预测方法及系统,具有以下有益效果:(1)本发明所建立的日产气量预测模型,能够对碳酸盐岩气井进行无监督聚类,对于不同的目标气井能准确找出其所属井群类别,从而获取气井的生产规律,为准确预测其未来产量奠定了基础;(2)所提出的方法能够实现自主训练获取类别,操作简便易行,具有广泛的适用性;(3)经过利用油气藏现场生产数据验证表明:本发明所构建的动态产气量预测模型在针对生产周期较短的碳酸盐岩气井的未来阶段产量预测的问题上有着较好的性能,预测精度较高。
[0150]
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0151]
文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本
发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。