基于随机森林的致密砂岩气储层质量主控因素定量评价方法

文档序号:26499155发布日期:2021-09-04 01:35阅读:82来源:国知局
基于随机森林的致密砂岩气储层质量主控因素定量评价方法

1.本发明涉及非常规油气藏开发技术领域,特别涉及一种基于随机森林的致密砂岩气储层质量主控因素定量评价方法。


背景技术:

2.现阶段全球已进入常规油气稳定上产、非常规油气快速发展阶段,致密砂岩气已成为非常规天然气发展的重点方向。大量开发实践表明,对致密砂岩气储层质量主控因素进行有效评价是实现该类气藏规模化、效益化开发的关键基础问题。
3.当前有关储层质量主控因素评价的方法包括以下几类:一是利用沉积学和测井岩石物理进行储层的致密砂岩质量评价;二是利用岩心观察、薄片鉴定及物性分析等方式对储层质量进行研究与区分;三是充分结合测井、录井、岩心观察、分析化验、试油试采等资料,建立储层评价指标体系,综合剖析储层质量影响因素;四是基于储层特征,结合测井数据,采用数值模拟的方式,建立储层评价方法与准则。
4.上述方法主要基于人为经验约束的单因素定性或半定量评价,然而,开发证实致密砂岩储层质量受沉积、成岩和构造等多重因素共同控制。当前方法主要聚焦于单一因素参数的定性或半定量分析,其评价结果存在主观性、非普适性等问题,进而使得致密砂岩气储层质量界定不清、识别不准,影响开发方案设计和井位部署,特别是在非均质性严重的储层中,渗透率并不能通过孔隙结构和孔喉半径进行精度较高的计算。因此,亟需提出一种多因素联动的定量评价方法。


技术实现要素:

5.针对上述问题,本发明旨在提供一种基于随机森林的致密砂岩气储层质量主控因素定量评价方法,以储层质量的表征参数为研究基础,结合随机森林,定量评价影响致密砂岩气储层质量的主控因素。
6.本发明的技术方案如下:
7.一种基于随机森林的致密砂岩气储层质量主控因素定量评价方法,包括以下步骤:
8.s1:收集研究区影响储层质量的相关影响因素,并根据所述影响因素的参数类型进行参数处理:
9.若所述影响因素为数据类参数,则检查所述数据类参数是否有缺失,若某一数据类参数有缺失,则去除同一批次的所有影响因素;若无缺失,则保留;
10.若所述影响因素为文本类参数,则对所述文本类参数进行赋值处理;
11.s2:将处理后的参数保存为逗号分隔值文件;
12.s3:以储层质量的表征参数作为储层质量分析的因变量,以所述影响因素作为储层质量分析的自变量;
13.s4:根据所述因变量和所述自变量,利用随机森林算法,采用有放回的随机抽样方
式抽取训练数据,构建决策树和随机森林;
14.s5:针对各影响因素,计算所述决策树的袋外数据误差,根据所述袋外数据误差优选出主控影响因素。
15.作为优选,步骤s1中,所述相关影响因素包括沉积类影响因素、成岩类影响因素、以及构造类影响因素。
16.作为优选,所述沉积类影响因素包括粒度岩性类型、矿物岩性类型、分选性、磨圆度、各类粒度参数、不同类型矿物颗粒含量、杂基含量、原生孔含量;所述成岩类影响因素包括胶结作用类型、不同类型胶结物含量、不同类型溶孔含量、不同类型交代矿物含量、压实强度;所述构造类影响因素包括裂缝类型、不同类型裂缝含量。
17.作为优选,步骤s3中,所述储层质量的表征参数采用流动单元指数。
18.作为优选,步骤s4具体包括以下子步骤:
19.s41:利用随机森林算法,将处理后的数据集作为输入样本数据集,采用有放回的方式,从中随机抽取多次构成一个子集数据,抽样次数与样本数量保持一致,抽样获得的子集数据用于构建一棵决策树;
20.s42:在子数据集中随机抽取部分影响因素构成候选分割集,按照节点不纯度最小原则从候选分割集中选取一个影响因素作为决策树的分割点,采用该原则继续分裂,直到该节点的所有样本都达到叶子节点,结束分裂;
21.s43:重复步骤s41和步骤s42建立多棵决策树,由所述多棵决策树构成所述随机森林。
22.作为优选,步骤s5具体包括以下子步骤:
23.s51:将袋外数据中的各影响因素放入构建的随机森林中,针对某一决策树,通过所述随机森林计算得到各袋外数据的预测值;
24.s52:计算各袋外数据的预测值与真实值间的均方误差一;
25.s53:在所述袋外数据中,选择某一影响因素,对其随机加入噪声后再放入所述随机森林中,计算得到加入噪声后的预测值;计算该影响因素有噪声的预测值与真实值间的均方误差二;
26.s54:根据该影响因素的均方误差一和均方误差二的大小判断该影响因素的重要性:
27.若加入随机噪声后,所述均方误差二大于所述均方误差一,且两者之间的差值大于阈值,则该影响因素重要,反之则不重要;
28.s55:重复步骤s53和步骤s54,对袋外数据中剩下的所有影响因素进行判断;
29.s56:针对随机森林中剩下的每棵决策树,重复步骤s51和步骤s55,计算每个影响因素的袋外数据误差,并取其平均值作为每个影响因素的重要性值,按平均值的大小降序排列,排序靠前的影响因素即为影响储层质量的主控因素。
30.作为优选,还包括以下步骤:
31.s6:根据所述袋外数据误差优选出的主控影响因素,重新构建决策树和随机森林;
32.s7:计算各优选的主控影响因素的袋外数据误差,并取各主控影响因素袋外数据误差的平均值作为每个主控影响因素的重要性值;
33.s8:计算各个优选的主控影响因素的重要性值占所有优选的主控因素重要性值的
百分比,以其定量表征各主控影响因素对储层质量的影响程度。
34.本发明的有益效果是:
35.本发明通过随机森林算法对反映储层质量的表征参数进行相关影响因素的定量评价,实现了对控制储层质量关键因素的提取,确定储层的沉积和成岩作用,有效判断致密砂岩优质储层的形成与分布。传统方法主要依靠人为经验、数值模拟、扫描电镜分析和岩心测试分析等方法进行主控因素确定,不能对各影响因素的重要性进行定量评价。与传统方法相比,本发明将随机森林算法应用于致密砂岩气储层质量主控因素评价研究中,不仅可以自动筛选出主控因素,并且还可以对主控因素进行定量评价。采用该方法获得的结果具有普遍性、客观性、准确性等优势,可为下一步气藏描述、油田开发效果改善提供可参考的地质依据。
附图说明
36.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
37.图1为本发明致密砂岩气储层质量主控因素定量评价方法的流程示意图;
38.图2为本发明数据处理的流程示意图;
39.图3为本发明因变量和自变量选取的流程示意图;
40.图4为本发明决策树和随机森林构建的流程示意图;
41.图5为本发明定量评价储层主控因素的流程示意图。
具体实施方式
42.下面结合附图和实施例对本发明进一步说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的技术特征可以相互结合。需要指出的是,除非另有指明,本申请使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。本发明公开使用的“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
43.如图1

5所示,本发明提供一种基于随机森林的致密砂岩气储层质量主控因素定量评价方法,包括以下步骤:
44.s1:收集研究区影响储层质量的相关影响因素,所述相关影响因素包括沉积类影响因素、成岩类影响因素、以及构造类影响因素。
45.在一个具体的实施例中,所述沉积类影响因素包括粒度岩性类型、矿物岩性类型、分选性、磨圆度、各类粒度参数、不同类型矿物颗粒含量、杂基含量、原生孔含量;所述成岩类影响因素包括胶结作用类型、不同类型胶结物含量、不同类型溶孔含量、不同类型交代矿物含量、压实强度;所述构造类影响因素包括裂缝类型、不同类型裂缝含量。需要说明的是,不同的研究区相关影响因素可能有所不同,在别的研究区内,上述各影响因素可能有的并不适用,也可能除了上述影响因素外还有其他影响因素。
46.s2:根据所述影响因素的参数类型进行参数处理,将处理后的参数保存为适合r语
言读取的逗号分隔值文件(.csv);处理的具体方法为:
47.若所述影响因素为数据类参数,则检查所述数据类参数是否有缺失,若某一数据类参数有缺失,则去除同一批次的所有影响因素(例如影响因素有x个,通过y批次测试获得xy个影响因素数据,若第i批次测试仅获得x

j(j≥1)个影响因素的数据,则去除第i批次的所有影响因素数据,即最终获得x(y

1)个影响因素数据);若无缺失,则保留;如此能够保证数据的完整性,提高后续步骤的计算精度。
48.若所述影响因素为文本类参数,则对所述文本类参数进行赋值处理;例如对分选性中的“差”、“中”和“好”分别赋值为0、1、2,将支撑类型的颗粒和杂基赋值为0、1,如此能够便于模型对文本类参数进行处理,需要说明的是,文本类参数赋值的大小对结果并无影响。
49.s3:以储层质量的表征参数作为储层质量分析的因变量,以所述影响因素作为储层质量分析的自变量;所述储层质量的表征参数通过以下步骤进行确定:
50.(1)收集整理生产测试数据,所述生产测试数据包括产油量、产气量、产水量、产液量;
51.(2)收集整理(或计算)反映储层质量的参数数据,包括孔隙度、渗透率、流动单元指数(fzi)、孔喉结构;所述流动单元指数(fzi)通过下式进行计算:
[0052][0053][0054][0055]
式中:fzi为流动单元指数,无量纲;rqi为储层质量指数,无量纲;k为渗透率,d;为孔隙度,%;为孔隙体积和颗粒体积的比值。
[0056]
(3)以生产测试数据作为评价储层质量好坏的标准,分析其与孔隙度、渗透率、流动单元指数(fzi)、孔喉结构参数的关联,将其中最能够反映储层质量的参数定为储层质量的表征参数。
[0057]
在一个具体的实施例中,采用上述方法确定所述储层质量的表征参数,最后优选出流动单元指数作为所述储层质量的表征参数。
[0058]
s4:根据所述因变量和所述自变量,利用随机森林算法,采用有放回的随机抽样方式抽取训练数据,构建决策树和随机森林;具体包括以下子步骤:
[0059]
s41:利用随机森林算法,将处理后的数据集作为输入样本数据集,采用有放回的方式,从中随机抽取多次构成一个子集数据,抽样次数与样本数量保持一致,抽样获得的子集数据用于构建一棵决策树。
[0060]
s42:在子数据集中随机抽取部分影响因素构成候选分割集,按照节点不纯度最小原则从候选分割集中选取一个影响因素作为决策树的分割点,采用该原则继续分裂,直到该节点的所有样本都达到叶子节点,结束分裂。
[0061]
所述节点不纯度最小原则即基尼系数最小原则,可通过计算分割点的基尼系数进行表征,选择基尼系数最小的节点作为分割节点,可实现分割后节点不纯度最小。
[0062]
决策树的形成过程中,每个节点都按照该方式进行分裂。例如,在任意一个子集数
据中,若随机抽取的影响因素包括原生粒间孔、粒间溶孔、主要粒径、铸模孔,计算基尼系数,选取原生粒间孔作为分割节点,直到该节点所有的样本都达到叶子节点时,结束分裂。
[0063]
s43:重复步骤s41和步骤s42建立多棵决策树,由所述多棵决策树构成所述随机森林。
[0064]
s5:针对各影响因素,计算所述决策树的袋外数据误差,根据所述袋外数据误差优选出主控影响因素。
[0065]
在决策树的构建过程中,由于采用的是有放回的随机抽样方式,总会有部分样本数据未被抽中,将其称为袋外数据;所述袋外数据在决策树中的预测值与其真实值之间的误差即为所述袋外数据误差。步骤s5具体包括以下子步骤:
[0066]
s51:将袋外数据中的各影响因素放入构建的随机森林中,针对某一决策树,通过所述随机森林计算得到各袋外数据的预测值;
[0067]
s52:计算各袋外数据的预测值与真实值间的均方误差一;
[0068]
s53:在所述袋外数据中,选择某一影响因素,对其随机加入噪声后再放入所述随机森林中,计算得到加入噪声后的预测值;计算该影响因素有噪声的预测值与真实值间的均方误差二;
[0069]
s54:根据该影响因素的均方误差一和均方误差二的大小判断该影响因素的重要性:
[0070]
若加入随机噪声后,所述均方误差二大于所述均方误差一,且两者之间的差值大于阈值,则该影响因素重要,反之则不重要;
[0071]
s55:重复步骤s53和步骤s54,对袋外数据中剩下的所有影响因素进行判断;
[0072]
s56:针对随机森林中剩下的每棵决策树,重复步骤s51和步骤s55,计算每个影响因素的袋外数据误差,并取其平均值作为每个影响因素的重要性值,按平均值的大小降序排列,排序靠前的影响因素即为影响储层质量的主控因素。
[0073]
在一个具体的实施例中,所述储层质量主控因素定量评价方法还包括以下步骤:
[0074]
s6:根据所述袋外数据误差优选出的主控影响因素,重新构建决策树和随机森林;
[0075]
s7:计算各优选的主控影响因素的袋外数据误差,并取各主控影响因素袋外数据误差的平均值作为每个主控影响因素的重要性值;
[0076]
s8:计算各个优选的主控影响因素的重要性值占所有优选的主控因素重要性值的百分比,以其定量表征各主控影响因素对储层质量的影响程度。
[0077]
在一个具体的实施例中,以某致密砂岩气储层的研究区为例,该研究区位于东海盆地西湖凹陷黄岩构造,目的层为渐新统花港组下段,构造位置位于东海陆架盆地西湖凹陷中央反转构造带中南部,为ne

sw向背斜构造,地层较平缓,黄岩1

1主要发育背斜圈闭,黄岩2

2主要发育次级挤压带上的低幅度背斜、断背斜构造群。花港组是在始新世断

坳陷转变阶段沉积充填的产物,主要发育陆相背景下的浅水湖泊

三角洲沉积体系,沉积厚度在1000

2000m之间,花下段总体厚度要小于花上段厚度,主要岩性为:次长石砂岩,次岩屑砂岩,长石岩屑砂岩以及岩屑长石砂岩,其孔隙度介于2.1%

12.5%,主要集中在8%

10%,渗透率介于0.02

22.72md,除一处裂缝位置渗透率较高,其它均低于2md,主要集中在0.1md

0.4md之间,属于典型的低孔低渗致密砂岩储层。早期开发实践表明,该研究区砂体虽垂向厚度大、横向连续分布,但储层非均质性极强,同一开发井不同层段、相邻不同开发
井之间,产能差异悬殊,有的层段产气量达数十万方,有的则仅几千方甚至无产能,造成这一生产问题的关键是储层质量的差异性。因此,认识储层质量的主控因素是破解该研究区致密砂岩气藏高效开发的核心基础问题。
[0078]
该研究区的储层质量主控因素定量评价方法包括以下步骤:
[0079]
第一步:收集控制地质储层质量的沉积、成岩、构造参数。
[0080]
(1)收集岩心描述和实验分析资料,包括粒度岩性类型、矿物岩性类型、分选性、磨圆度、不同类型矿物颗粒含量、杂基含量、各类粒度参数(平均值、标准偏差、偏度、峰度)、不同类型矿物百分含量、原生孔含量等沉积类参数数据合计636条,胶结作用类型、不同类型胶结物含量(硅质胶结物含量、钙质胶结物含量、泥质胶结物含量、铁矿含量)、不同类型溶孔含量(包括粒间溶孔含量、粒内溶孔含量、铸膜孔含量)、不同类型粘土矿物含量、不同类型交代矿物含量、压实强度等成岩类参数数据合计345条,裂缝类型、不同类型裂缝含量等构造类参数数据640条;
[0081]
(2)针对文本型参数数据,将其中的文本数据进行分类赋值,例如对分选性中的“差”、“中”和“好”分别赋值为0、1、2,将支撑类型的颗粒和杂基赋值为0、1;
[0082]
(3)采用上述步骤,去掉参数缺失较多的样本,获得340条样本数据,将该数据集合用q表示,保存为逗号分隔值文件(.csv),适用于r语言的读取。
[0083]
第二步:确定评价储层质量的表征参数。
[0084]
(1)收集整理生产测试数据包括产油、产气、产水、产液量;
[0085]
(2)收集整理(或计算)反映储层质量的参数数据包括孔隙度、渗透率、流动单元指数(fzi)、孔喉结构;
[0086]
(3)以生产数据为储层质量好坏标准,分析其与孔隙度、渗透率、流动单元指数(fzi)、孔喉结构等参数的关联关系,优选出流动单元指数(fzi)是最能够反映储层质量的参数,将其定为储层质量表征参数;
[0087]
(4)将上述流动单元指数(fzi)作为控制致密砂岩气储层质量的因变量,与储层质量的其他相关影响因素,如粒间溶孔含量、主要粒径、铸模孔含量、原生粒间孔含量等参数作为自变量。
[0088]
第三步:构建决策树和随机森林。
[0089]
(1)利用随机森林算法,将已处理好的340条样本数据集q作为输入样本数据集,采用有放回的方式,从中随机抽取340次构成一个子集数据m,该子集数据用于构建一棵决策树。
[0090]
(2)m中的每个样本包含原生粒间孔含量、粒间溶孔含量、泥质杂基含量、石英含量等34个特征值,即34个影响因素。从m中随机抽取1/3的影响因素构成决策树的候选分割点集合,用c1表示。例如随机抽取的影响因素为钾长石含量、斜长石含量、石英含量、磨圆度、分选性、支撑类型、原生粒间孔含量、粒间溶孔含量等11个影响因素构成c1。计算c1中每个影响因素的基尼系数,选择基尼系数最小的影响因素粒间溶孔作为决策树的分割点,将m分为左右两个集合,分别表示为m
l
和m
r

[0091]
基尼系数的计算方法如下:随机森林采用的是cart决策树,在cart算法中,由于是二叉树分类,因此假如样本子集m根据特征a是否取某一可能值b被分割为m
l
和m
r
,则在特征a的条件下,集合m的基尼系数为:
[0092][0093]
式中:gini(m)表示集合m的不确定性;gini(m,a)表示经过a=b分割后集合m的不确定性;基尼系数越大,表示样本的不确定性越大,分割后节点不纯度越大。
[0094]
(3)针对集合m
l
,采用上述方法,随机抽取11个影响因素构成决策树的候选分割点集合c2,例如,随机抽取到泥质含量、铁矿含量、磨圆度、石英含量等影响因素,计算c2中每个影响因素的基尼系数,选取基尼系数最小的影响因素铁矿作为分割节点,进一步将m
l
分为左右两个分类集合;重复该过程,直到m
l
集合中的每个样本都到达叶子节点时,结束分裂。
[0095]
(4)m
r
采用与m
l
相同的处理方式,直到m
r
中所的有样本都到达叶子节点时,结束分裂;至此,完成子集数据m的决策树构建。
[0096]
(5)重复步骤(1)~(4)多次,建立多棵决策树,由多棵决策树构成随机森林。
[0097]
第四步:确定影响储层质量的主控因素,并进行定量化表达。
[0098]
(1)设决策树t1对应的袋外数据为o1;将o1放入构建的随机森林中进行计算,得到其预测值e1;计算袋外数据的预测值e1与真实值e间的均方误差,记为error1:
[0099]
error1=mean(e

e1)2ꢀꢀ
(5)
[0100]
(2)在袋外数据o1中,对每个样本,选择粒间溶孔(用x1表示)这一特征加入随机噪声,其它特征值保持不变,加入噪声后的袋外数据记为o2,将其代入随机森林中进行计算,得到的预测值记为e2,计算真实值e与预测值e2间的均方误差,记为error2:
[0101]
error2=mean(e

e2)2ꢀꢀ
(6)
[0102]
(3)针对粒间溶孔(x1)计算两次均方误差的差值,记为s
x1

[0103]
s
x1
=error2‑
error1ꢀꢀ
(7)
[0104]
(4)重复上述步骤,对袋外数据中剩余的33个特征,如泥质含量、原生粒间孔含量、铸模孔含量等,分别计算其均方误差,分别记为s
xi
(i=2,
……
,34);
[0105]
(5)针对随机森林中的每棵决策树,重复上述(1)~(4)步,计算每个影响因素的袋外数据误差,并取其平均值作为每个影响因素的重要性值,记为w
xi
(i=1,2,
……
,34):
[0106][0107]
式中:k表示随机森林中决策树的数量。
[0108]
(6)对w
xi
按降序排列,剔除排序靠后的影响因素,如去掉斜长石含量、硅质胶结物含量、钾长石含量、分选性、石英含量、粒内溶孔含量等20个影响因素,初步选出粒间溶孔含量、铸模孔含量、图解法粒度平均值、原生粒间孔含量、主要粒径等14个因素作为影响储层质量的主控因素。
[0109]
(7)基于初步选取的主控影响因素,采用前述步骤重新构建决策树和随机森林,计算袋外数据误差,重复多次实验,取其平均值作为各影响因素的重要性值,并将其转化为百分比形式,其结果如表1所示:
[0110]
表1储层质量主控因素定量化评价结果
[0111]
序号影响因素平均均方误差重要性百分比1粒间溶孔含量23.7872649844.56%
2铸模孔含量5.97833738711.20%3图解法粒度平均值5.91600638711.08%4原生粒间孔含量3.4951464256.55%5高岭石含量3.2563916896.10%6主要粒径2.9808347055.58%7钙质胶结物含量(方解石,白云石)2.2464142294.21%8伊利石含量1.4201606492.66%9泥质含量1.3408176222.51%10最大粒径1.338849332.51%11x.s0.6169369671.16%12伊.蒙混层含量0.5082651710.95%13粒度岩性0.4060219030.76%14胶结类型0.0970175160.18%
[0112]
表1中的各影响因素重要性的百分比可用于刻画描述各影响因素对储层质量的影响程度,实现致密砂岩气储层质量主控因素的定量评价。在本实例中,粒间溶孔含量对致密砂岩的储层影响最为重要,量化后其重要性可达44.56%,其次是铸模孔含量、图解法粒度平均值、原生粒间孔含量等,胶结类型、粒度岩性、伊蒙混层含量的影响最小,不到1%。由此可见,较原生沉积作用(粒度平均值、原生粒间孔、主要粒径等)和胶结作用(高岭石胶结、钙质胶结、伊利石胶结等),粒间溶孔和铸模孔对储层质量的累计影响程度达55.8%,即溶蚀作用是控制储层质量的关键因素,决定了致密砂岩优质储层的形成与分布。
[0113]
本发明能够定量评价影响储层质量的主控因素,与现有技术依靠人为经验、数值模拟、扫描电镜分析和岩心测试分析等方法相比具有显著的进步。
[0114]
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1