本发明涉及储层地球物理勘探技术领域,尤其涉及一种储层评价分类方法及装置。
背景技术:
储层评价分类研究的主要目的,是在获得详实的数据如弹性、物性信息的基础上,对储层的优劣进行基本评价,旨在遴选优质储层、油气甜区,降低勘探风险。
储层研究的最终目的就是对储层做出符合地质实际的评价分类。国内外储层评价分类方法主要有地质经验法、权重分析法、层次分析法、模糊数学法、人工神经网络法、分形几何法、变差函数法、聚类分析法、灰色关联法、各种测井方法和地震方法等。以上方法对目的层孔隙度、渗透率、饱和度或者其它研究过程中被认定与油气成藏密切的关键物性参数、弹性参数、脆性参数、温度场、压力场等等,通过提取相互之间乃至与储量、产量之间的关联特性,综合得到不同类型储层与油气分布的关系,从而实现指导油气勘探开发的目的。
聚类是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程,是研究数据间逻辑上或物理上的相互关系的技术,是数据挖掘技术中的重要组成部分。聚类分析的基本思想是,依据实验数据本身所具有的定性或定量的特征来对大量数据进行分组归类,以便了解数据集的内在结构,并且对每一个数据集进行描述的过程。其主要依据是用数学的方法研究和处理给定对象的分类,把一个没有类别标记的样本按照某种准则划分子类,使相似的样本尽可能归为一类。
在诸多储层评价分类方法中,聚类方法是一种较为直观、容易理解的方法。在油气勘探领域,最简单的思路是通过产油产气井的实测数据标定,对各项弹性、物性、岩性等参数指标进行阈值划分分类,取交集最终实现储层评价分类,该思路在碎屑岩储层、低渗透储层、页岩气储层、碳酸盐储层、火成岩储层等类型均有应用。
聚类方法应用效果的优劣对数据特征具有明显的选择性,而我们熟知的储层预测中各种成果数据,比如弹性参数、物性参数、脆性参数等,由于地球物理问题的多解性客观存在,往往具有相关联数据分布过于分散、收敛性差的问题。这对基于无监督思想的常规聚类而言,是一个极大的挑战。
由于多元勘探地球物理数据的复杂性和多解性,直接使用常规自动聚类方法所得结果可靠性较差,而人工干预过多又会造成结果具有主观性、随意性以及分辨率低等副作用,造成多元勘探成果数据条件下的储层评价分类评价效果不理想的问题。
技术实现要素:
本发明实施例提供一种储层评价分类方法,用以解决多元勘探成果数据条件下的储层评价分类评价效果不理想的问题,该方法包括:
对储层的多元勘探数据进行主成分分析,获得第一主成分数据和第二主成分数据;
根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类;
根据分类结果,确定储层分类。
本发明实施例还提供一种储层评价分类装置,包括:
主成分分析模块,用于对储层的多元勘探数据进行主成分分析,获得第一主成分数据和第二主成分数据;
主成分数据分类模块,用于根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类;
储层分类模块,用于根据分类结果,确定储层分类。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现一种储层评价分类方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现一种储层评价分类方法的计算机程序。
本发明实施例提供的一种储层评价分类方法及装置,采用根据样本点空间分布密度和样本点间累计距离进行分类的方法,实现对储层多元勘探数据的分类,思路简洁,分类效果优于常规聚类算法,且未见本聚类方法在石油物探领域获得应用,本发明对复杂的多元勘探数据有较好的适应性,分类效果具有较高分辨率、可靠、稳健、效果理想,在油气勘探领域具有较高应用价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例一种储层评价分类方法的示意图;
图2为本发明实施例一种储层评价分类方法的峰值密度-距离聚类方法原理图;
图3为本发明实施例一种储层评价分类方法的峰值密度-距离聚类方法的步骤示意图;
图4为本发明提供一实例的与储层甜点密切相关的勘探成果数据图;
图5为本发明提供一实例的经过数据预处理的目的层勘探成果数据图;
图6为本发明提供一实例的对预处理后的数据进行第一、第二主成分提取的结果图;
图7为本发明提供一实例的第一、第二主成分的空间交会结果图;
图8为本发明提供一实例的第一、第二主成分进行聚类的结果图;
图9为本发明提供一实例的图8分类结果在目的层空间的投影;
图10为本发明实施例一种储层评价分类装置的示意图;
图11为本发明实施例一种储层评价分类装置中主成分数据分类模块的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本发明实施例提供一种储层评价分类评价方法,用以解决多元勘探成果数据条件下的储层评价分类评价效果不理想的问题,如图1所示,该方法包括:
步骤101,对储层的多元勘探数据进行主成分分析,获得第一主成分数据和第二主成分数据;
步骤102,根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类;
步骤103,根据分类结果,确定储层分类。
上述主成分分析是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析,也是数学上处理降维的一种方法。主成分分析是设法将原来众多具有一定相关性(比如p个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。最经典的做法就是用f1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即va(rf1)越大,表示f1包含的信息越多。因此在所有的线性组合中选取的f1应该是方差最大的,故称f1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取f2即选第二个线性组合,为了有效地反映原来信息,f1已有的信息就不需要再出现再f2中,用数学语言表达就是要求cov(f1,f2)=0,则称f2为第二主成分。
一个实施例中,根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类包括多种方法,本实施例采用的是峰值密度-距离聚类方法。
上述提到的峰值密度-距离聚类方法为举例说明,本领域技术人员可以理解,实施时还可以根据使用其他方法,根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类,这些变化例均应落入本发明的保护范围。
峰值密度-距离聚类方法是alex和alessandro于2014年提出一种聚类方法,如图2所示的峰值密度-距离聚类方法原理图,该分类方法基本思想简单,但聚类效果却兼具了谱聚类和k-means的特点,该聚类方法利用样本点空间分布密度和样本点间累计距离为依据实现样本分类。
该聚类方法的的核心思想主要是基于两个基本点:
(1)聚类中心的密度高于其临近的样本点的密度;
(2)聚类中心与比其密度还高的聚类中心的距离相对较大。
基于这个思想,聚类过程中的聚类中心数目可以很直观的选取,且无需设置初始质心点,离群点也能被自动检测出来并排除在聚类分析外。
一个实施例中,采用峰值密度-距离聚类方法,对第一主成分数据和第二主成分数据进行分类,如图3本发明实施例一种储层评价分类方法的峰值密度-距离聚类方法的步骤示意图所示,在一个实施例中,采用峰值密度-距离聚类方法,对第一主成分数据和第二主成分数据进行分类,包括,对第一主成分数据和第二主成分数据作如下处理:
读入第一主成分数据和第二主成分数据对应数值;
将第一主成分数据和第二主成分数据对应数值分别作为待分析样本点的横纵坐标,确定样本点平面位置;
申请样本点的距离矩阵空间;
根据申请的距离矩阵空间,计算样本点的距离矩阵;
根据样本点的距离矩阵,确认样本点的搜索半径;
根据样本点的搜索半径,计算每个样本点的局部密度;
计算样本点的聚类种类;
根据每个样本点的局部密度和聚类种类,确定样本点聚类种类的中心位置;
根据样本点聚类种类的中心位置,确定聚类种类中心;
过滤远离聚类种类中心的样本点,获得聚类的光晕,根据聚类种类中心和聚类的光晕确定第一主成分数据和第二主成分数据的分类;
将第一主成分数据和第二主成分数据的分类结果映射到地震线道空间内,以平面图的形式展示最终分类结果。
一个实施例中,采用峰值密度-距离聚类方法,对第一主成分数据和第二主成分数据进行分类,还包括,按如下公式初始化峰值密度-距离聚类的参数:
其中,χ(x)为样本点的平均近邻数目占整个样本点集规模的比例参数;x为样本点。
在峰值密度-距离聚类方法实施时,若搜索半径dc太大会导致每个数据点的密度值近似相等,类簇划分困难;若搜索半径dc太小,则会导致每个类簇包含的样本点太少,同一类簇被分割。因此,采用了“样本点的平均近邻数目占整个数据集规模的比例”这样一个参数χ(x),用于保证搜索半径dc能够逼近合理性。
前述提到的参数χ(x)表达式为举例说明,本领域技术人员可以理解,在实施时还可以根据需要对上述公式进行一定形式的变形和添加其它的参数或数据,或者提供其它的具体公式,这些变化例均应落入本发明的保护范围。
一个实施例中,读入第一主成分数据和第二主成分数据对应数值,包括:
将读入第一主成分数据和第二主成分数据对应数值输入到如下数据集:
s={xi|xi∈rn,i=1,...,n};
其中,s为数据集;xi为样本点;rn为实数集;n为自然数集。
前述提到的数集s的表达式为举例说明,本领域技术人员可以理解,在实施时还可以根据需要对上述公式进行一定形式的变形和添加其它的参数或数据,或者提供其它的具体公式,这些变化例均应落入本发明的保护范围。
一个实施例中,按如下公式计算每个样本点的局部密度:
其中,ρi为样本点xi的局部密度;χ(x)为样本点的平均近邻数目占整个样本点集规模的比例参数;n为自然数集;dc为搜索半径;dij为样本点xi和样本点xj之间的距离。
前述提到的局部密度ρi的表达式为举例说明,本领域技术人员可以理解,在实施时还可以根据需要对上述公式进行一定形式的变形和添加其它的参数或数据,或者提供其它的具体公式,这些变化例均应落入本发明的保护范围。
一个实施例中,按如下公式计算样本点的聚类种类:
其中,δi为样本点xi的聚类种类,是距离参数;ρi为样本点xi的局部密度;ρj为样本点xj的局部密度;dij为样本点xi和样本点xj之间的距离。
前述提到的距离密度更高的样本点的聚类δi的表达式为举例说明,本领域技术人员可以理解,在实施时还可以根据需要对上述公式进行一定形式的变形和添加其它的参数或数据,或者提供其它的具体公式,这些变化例均应落入本发明的保护范围。
一个实施例中,根据每个样本点的局部密度和聚类种类,确定样本点聚类种类的中心位置,包括:
在第一主成分数据和第二主成分数据的样本点中,将局部密度值和聚类种类值最大的样本点,确定为聚类种类的中心位置。
一个实施例中,对第一主成分数据和第二主成分数据进行分类之后,还包括:
根据分类结果的空间展布规律以及储层的已知测井信息,迭代选择分类参数;
根据分类参数从分类结果中选择最佳分类结果;
根据分类结果,确定储层分类,包括:根据最佳分类结果,确定储层分类。
本发明实施例采用峰值密度-距离聚类方法,利用样本点空间分布密度和样本点间累计距离为基本依据实现样本分类,思路简洁,分类效果优于常规聚类算法,且未见其在石油物探领域获得应用。
一个实施例中,对储层的多元勘探数据进行主成分分析之前,还包括:对储层的多元勘探数据进行预处理;
对储层的多元勘探数据进行主成分分析,包括:对预处理后的多元勘探数据进行主成分分析;
所述预处理包括:滤波和/或针对参数物理意义的数据标准化。
一个实施例中,所述滤波包括中值滤波和/或均值滤波。
常规思路采用纯粹数学方法,如极化标准化,对各个参数采用无差别对待的方式,所得结果已经不具备物理意义
因此,采用常规思路处理地震数据、测井数据等方式结果比较机械,只为消除野值、随机噪音,寻求低频粗化模型等目的,但是对于多元勘探数据而言,由于各元数据可能属于不同的物理概念范畴,其有效值域量级或者能量分布,都可能存在巨大差异,这对后续的分类是极为不利的。在本发明实施例中,采用中值滤波与均值滤波叠合使用思路:中值滤波消除属性野值、随机噪音,均值滤波使该属性值域始终围绕其统计均值分布,保证了数据的稳定性,并且较大限度的保持了主能量。针对参数物理意义的数据标准化思路,本发明的做法是以已知井的有效储层信息为基准,针对不同的勘探数据类型与储层的基本关系,根据参数物理意义的不同,根据参数值域有效区间,对勘探数据因地制宜的设置标准化方法,例如可以采用极差变换法、最优值变换法、最优区间变换法、标准样本变换法、向量归一化法、线性比例变换法的一种或多种方法的组合,这样得到的结果,往往与储层特征保持着较好关联度,具有显著的物理意义。因此经过本发明实施例对储层的多元勘探数据预处理后,能够得到能量彼此均衡、数值分布合理的基础数据。本发明实施例克服了直接使用常规自动聚类方法所得结果可靠性较差,以及人工干预过多又会造成结果具有分辨率低、主观性和随意性等副作用,使得预处理后的多元勘探数据能够更好的便于后续分类
一个实施例中,储层的多元勘探数据包括:储层的脆性、泥质含量、含水饱和度和孔隙度。
具体实施时,可以通过叠前反演、岩石物理分析等方法获得的与储层甜点密切相关的多元勘探成果数据。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现一种储层评价分类方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现一种储层评价分类方法的计算机程序。
下面提供一具体实例,说明应用本发明实施例的一种储层评价分类方法进行储层评价分类的效果,具体如下:
图4是通过叠前反演、岩石物理分析等获得的与储层甜点密切相关的勘探成果数据,它们分别是脆性、泥质含量、含水饱和度、孔隙度。
图5是经过数据预处理的目的层勘探成果数据。预处理消除了大量野值、随机噪声,并且尽可能的消除了能量不均衡。通常意义上,脆性好,泥质含量低,含水饱和度低,高孔隙度的区域往往是储层预测的甜区。因此,这里的数据标准化基本上也依据前述常识进行处理,脆性、孔隙度按照正向标准化,含水饱和度与泥质含量按照负向标准化。这为后面提取稳定的主成分提供稳定且数值意义与物理意义较为一致的数据基础,为获得较为稳定的聚类效果奠定了基础。
图6是对预处理后的数据进行第一、第二主成分提取的结果。从图中可以看到,第一、第二主成分与预处理后的成果数据,相似度较低,这就证实了前面预处理方案的有效性。
图7是第一、第二主成分的空间交会结果。为了获得分辨率较高的聚类效果,势必就要增加样本点的密度和数量,这样才能够保证统计规律和储层甜区识别能力。但是,由于样本点数量较大,常规的线性拟合或者解释人员根据经验进行分类的方式难以奏效。这也是聚类分析在此能够有用武之地的重要原因。
图8是第一、第二主成分进行聚类的结果。从图中可以看到,该区储层类型可以分为5类,从交会的分布情况看,类型之间相互渗透的情况比较少,分类结果基本合理。从样本点聚类统计结果看,各类型样本点百分比含量为:第i类22.08%,第ii类31.00%,第iii类5.15%,第iv类12.39%,第v类29.38%。
图9是图7分类结果在目的层空间的投影。已知该区储层区域内有5口气井,其中a井位高产气井,b、c、d、e仅天然气显示,但不具备开采价值。对前面脆性、泥质含量、含水饱和度、孔隙度四个重要储层指标的聚类结果显示,a井所处储层区域类型不同于其它4口井,而b、c、d、e所处区域类型较为一致,从这个意义上来说,本方法提供的储层评价分类方法是成功的,且分类的成功率较高。
本发明实施例中还提供了一种储层评价分类装置,如下面的实施例所述。由于该装置解决问题的原理与一种储层评价分类方法相似,因此该装置的实施可以参见一种储层评价分类方法的实施,重复之处不再赘述。
图10是本发明实施例一种储层评价分类装置的示意图,如图10所示,该装置可以包括:
主成分分析模块1001,用于对储层的多元勘探数据进行主成分分析,获得第一主成分数据和第二主成分数据;
主成分数据分类模块1002,用于根据第一主成分数据和第二主成分数据中样本点空间分布密度和样本点间累计距离,对第一主成分数据和第二主成分数据进行分类;
储层分类模块1003,用于根据分类结果,确定储层分类。
如图11所示,在一个实施例中,主成分数据分类模块1002包含峰值密度-距离聚类模块1004,用于对第一主成分数据和第二主成分数据进行分类。
一个实施例中,峰值密度-距离聚类模块进一步用于,对第一主成分数据和第二主成分数据作如下处理:
读入第一主成分数据和第二主成分数据对应数值;
将第一主成分数据和第二主成分数据对应数值分别作为待分析样本点的横纵坐标,确定样本点平面位置;
申请样本点的距离矩阵空间;
根据申请的距离矩阵空间,计算样本点的距离矩阵;
根据样本点的距离矩阵,确认样本点的搜索半径;
根据样本点的搜索半径,计算每个样本点的局部密度;
计算样本点的聚类种类;
根据每个样本点的局部密度和聚类种类,确定样本点聚类种类的中心位置;
根据样本点聚类种类的中心位置,确定聚类种类中心;
过滤远离聚类种类中心的样本点,获得聚类的光晕,根据聚类种类中心和聚类的光晕确定第一主成分数据和第二主成分数据的分类;
将第一主成分数据和第二主成分数据的分类结果映射到地震线道空间内,以平面图的形式展示最终分类结果。
综上,本发明实施例提供一种储层评价分类方法及装置。通过对多元勘探数据进行数据预处理,包括中值滤波、均值滤波和数据标准化,以此获得能量彼此均衡、数值分布合理的基础数据;然后,采用主成分分析对多元数据进行降维处理,获得第一、第二主成分;通过采用峰值密度-距离聚类方法,对第一、第二主成分数据进行分类;最后,根据分类结果的空间展布规律,选择最佳分类效果,从而实现对多元勘探成果数据进行综合分类。本发明实施例对复杂的多元勘探数据有较好的适应性,分类效果具有较高分辨率、可靠、稳健、效果理想,在油气勘探领域具有较高应用价值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。