本发明涉及地质工程储层参数预测技术领域,具体涉及一种火山岩油藏储层参数智能预测方法及系统。
背景技术:
目前,在油藏勘探开发技术中,储层参数(也可称作储层物性,包括孔隙度、渗透率、饱和度、孔隙结构等)分布规律研究是油藏描述的核心,同时储层参数也是油藏评价研究中的重要参数和依据,因此储层参数预测在油藏勘探开发中具有重要意义。但是在当前的油藏勘探开发技术中,现有的各种储层参数预测方法都有一定的局限性,普遍存在精度低、误差大的问题。若以数学的观点来看,储层参数的横向预测与储层识别的主要问题是解决映射和分类问题。同时,储层测井信息在油藏勘探开发中被比喻成人的眼睛,储层测井资料所携带的地质信息是确定地层含油储量和制订开采规划的重要依据。为了提高储层参数预测方法的精度,研究者们开始利用各种机器学习算法尝试储层参数预测,也开始重视对储层测井信息的处理。
尤其针对于火山岩油藏勘探开发过程,许多研究者在研究火山岩油藏储层参数(相当于为火山岩岩石骨架参数)时会选用双矿物或多矿物模型,预测或计算储层参数时多选用孔隙——裂缝双孔隙介质模型。比如,潘保芝等在对松辽盆地火山岩解释中,基于qapm矿物模型和孔隙——裂缝双孔隙介质模型计算孔隙度和饱和度两种储层参数,取得了较好的效果;赵杰等利用ecs测井资料得到了计算火山岩油藏储层参数(岩石变骨架参数)的模型,在此基础上结合密度与核磁测井计算孔隙度和饱和度;张丽华等利用ecs测井得到随测井深度连续变化的储层参数(骨架参数)后,求取孔隙度,并建立了采用阿尔奇公式法得到的含油饱和度的三孔隙模型。
高美娟提出了一个基于自适应遗传算法的径向基函数神经网络的结构优化算法,该算法保留用可行域约束的最优的自适应遗传算法网络参数,避免了盲目指定样本类别数的缺陷,较好地解决了分类数、隐节点中心参数和宽度参数的取值问题,适合于储层参数预测的研究。
夏宏泉(1995年)利用bp神经网络法预测孔隙度;董少群(2013年)提出,与bp神经网络法相比,核岭回归法对红岗油田致密储层的孔隙度解释效果最好;而后袁伟(2015年)利用支持向量机技术在储层分类基础上建立不同流动单元内的渗透率模型,明显提高了模型精度。
总的来说目前火山岩油藏储层参数预测方法可分为常规方法和数学方法两大类:其中,常规方法有:
(1)(一元或多元)线性回归方法:
孔隙度计算模型:①通过岩心孔隙度与测井资料的关系得出孔隙度计算模型;
渗透率模型:①单参数回归孔隙度与渗透率的关系;②用孔隙度、粒度中值多元统计回归渗透率;③基于储层分类建立不同流动单元内的渗透率模型;
(2)应用核磁测井资料计算孔隙度;
(3)压汞法:建立油柱高度和毛管压力的关系,求取含油饱和度;
(4)阿尔奇公式法(可变m值):求取孔隙度,建立采用阿尔奇公式法得到的含油饱和度模型;
数学方法有:
(1)“数据挖掘”法:包括多元逐步回归法、核岭回归、决策树、随机森林、梯度提升树、支持向量机、最近邻方法等;
(2)“深度学习”法:bp神经网络法等。
综上所述,现有的火山岩油藏储层参数预测技术和方法仍然面临关键问题:技术方法应用单一,没有形成一套完整的、综合的、火山岩油藏适用的储层参数预测方法,没有对储层测井信息进行合理处理的方法,预测结果精确度仍然较低。
技术实现要素:
本发明针对现有火山岩油藏储层参数预测技术中没有形成一套完整的、综合的、火山岩油藏适用的储层参数预测方法,没有对已知测井信息进行合理处理的方法,预测结果精确度仍然较低等缺陷提供了一种火山岩油藏储层参数智能预测方法,该方法合理有效地对测井信息合理进行特征分析及特征优选的数据预处理,并基于若干回归算法并结合机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型,创新性地引入了人工智能、机器学习等技术原理,大大提高了火山岩油藏储层参数预测的速度和提升了预测结果的精确度,快速高效、可靠实用。本发明还提供了一种火山岩油藏储层参数智能预测系统。
本发明的技术方案如下:
一种火山岩油藏储层参数智能预测方法,首先对火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理,从数据预处理结果中提取与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据形成训练集数据,同时数据预处理结果中与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据形成测试集数据,基于所述训练集数据利用若干回归算法并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型,同时基于所述若干回归算法对回归估算模型进行模型参量自动优化,然后利用所述测试集数据检验评估优化后的回归估算模型,检验评估不合格的模型再次基于所述若干回归算法进行模型参量自动优化直至回归估算模型检验评估合格,最终根据火山岩油藏的测井曲线特征利用检验评估合格的回归估算模型进行未知储层参数的智能预测。
优选地,自动建立回归估算模型是基于所述若干回归算法分别建立每种算法下各自对应的回归估算模型。
优选地,自动建立回归估算模型是基于所述若干回归算法自动随机匹配任意不同回归算法后建立对应的回归估算模型。
优选地,若干回归算法包括但不限于多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法、非线性回归svr算法。
优选地,所述测井曲线特征包括但不限于补偿密度、自然伽马、自然电位、井径、电阻率、声波时差、密度、补偿中子;
和/或,所述测井曲线特征还采用特征组合扩展形式,所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
优选地,对回归估算模型进行模型参量自动优化是采用网格搜索法对模型进行自动交叉验证,通过调节各模型参量跟踪所述回归估算模型检验评估结果,自动搜索不同回归算法对应的最优模型参量组合,并将最优模型参量自动传递到回归估算模型的参量设置中。
一种火山岩油藏储层参数智能预测系统,包括依次连接的测井信息录入单元、数据预处理单元、训练集单元、回归算法建模和优化单元、模型检验评估单元、智能预测单元,所述模型检验评估单元还接收测试集单元传递来的测试集数据且所述模型检验评估单元与回归算法建模和优化单元为双向连接,所述数据预处理单元对测井信息录入单元提供的火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理,所述训练集单元从数据预处理结果中提取与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据形成训练集数据同时数据预处理结果中与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据形成测试集数据存入所述测试集单元,所述回归算法建模和优化单元基于所述训练集数据利用若干回归算法并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型同时基于所述若干回归算法对回归估算模型进行模型参量自动优化,所述模型检验评估单元检验评估回归估算模型是否合格,所述智能预测单元根据火山岩油藏的测井曲线特征利用检验评估合格的回归估算模型进行未知储层参数的智能预测。
优选地,所述回归算法建模和优化单元基于所述若干回归算法分别建立每种算法下各自对应的回归估算模型;
或,所述回归算法建模和优化单元基于所述若干回归算法自动随机匹配任意不同回归算法后建立对应的回归估算模型。
优选地,所述若干回归算法包括但不限于多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法、非线性回归svr算法。
优选地,所述测井曲线特征包括但不限于补偿密度、自然伽马、自然电位、井径、电阻率、声波时差、密度、补偿中子;
和/或,所述测井曲线特征还采用特征组合扩展形式,所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
本发明的技术效果如下:
本发明涉及了一种火山岩油藏储层参数智能预测方法,该方法在构建训练集数据和测试集数据后,基于若干回归算法利用大数据下的机器学习算法在大量数据学习后自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型同时基于多种回归算法对回归估算模型进行模型参量自动优化,最终利用优化后且检验评估合格的回归估算模型根据火山岩油藏的测井曲线特征进行未知储层参数的智能预测,得到的火山岩油藏储层参数预测结果的精度高、误差小,并充分引入多种回归算法,有效解决了技术方法应用单一的问题,适用范围更为广泛,并且针对于火山岩油藏储层较为复杂的情况下依然能够快速高效地实现储层参数智能预测,大大节省了人工工作量、降低了工作成本。
本发明还涉及了一种火山岩油藏储层参数智能预测系统,该系统基于多种回归算法并利用大数据机器学习算法并自动建模后最终依据模型得到火山岩油藏储层参数智能预测结果,工作效率高,预测结果精确度高、误差小且实用性强。
附图说明
图1:为本发明一种火山岩油藏储层参数智能预测方法的流程示意图。
图2:为通过计算机软件实现本发明一种火山岩油藏储层参数智能预测方法的火山岩油藏储层参数预测软件总体设计图。
图3:为基于图2方法进行关于岩性孔隙度储层参数与补偿密度和声波时差测井曲线特征相关性的特征分析结果。
图4:对图3特征分析结果根据补偿密度和声波时差测井曲线特征进行特征优选的数据预处理结果。
图5-图12:为若干算法下建立的回归估算模型中模型检验评估结果评分数与该模型需要优化的参量的关系曲线图。
图13:为基于图2具体实施方式的最终储层参数智能预测结果。
图14:为本发明一种火山岩油藏储层参数智能预测系统的结构示意图。
具体实施方式
下面结合附图对本发明进行详细说明。
本发明涉及了一种火山岩油藏储层参数智能预测方法,如图1所示的流程示意图,流程开始时,首先对火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理,从数据预处理结果中提取与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据形成训练集数据,同时数据预处理结果中与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据形成测试集数据,基于训练集数据利用若干回归算法并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型,同时基于若干回归算法对回归估算模型进行模型参量自动优化,再利用测试集数据检验评估优化后的回归估算模型,检验评估不合格的模型再次基于若干回归算法进行模型参量自动优化直至回归估算模型检验评估合格,最终根据火山岩油藏的测井曲线特征利用检验评估合格的回归估算模型进行未知储层参数的智能预测,也就是检验评估合格的模型可以直接应用于对未知储层参数的智能预测,检验评估不合格的模型必须再次进行模型参量自动优化,最终根据火山岩油藏的测井曲线特征利用所有检验评估合格的模型得到火山岩油藏储层参数智能预测结果,该方法合理有效地、创新性地引入了人工智能、机器学习等技术原理,得到的火山岩油藏储层参数预测结果的精度高、误差小,并充分引入多种回归算法,从数学角度上解决了映射和分类的问题,有效解决了技术方法应用单一的问题,适用范围更为广泛,并且针对于火山岩油藏储层较为复杂的情况下依然能够根据已知测井曲线数据快速高效地实现储层参数智能预测,大大节省了人工工作量、降低了工作成本,快速高效、可靠实用。
优选地,图2为通过计算机软件实现本发明一种火山岩油藏储层参数智能预测方法的火山岩油藏储层参数预测软件总体设计图,也即利用计算机软件进行本方法操作时,分为创建回归估算模型和使用评估检验合格的模型进行智能预测两大步骤,更具体地,创建回归估算模型步骤中,首先向计算机软件内录入火山岩油藏已知测井信息并对火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理,从数据预处理结果中提取与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据(也可以理解为与火山岩油藏储层参数相关性好的测井曲线)形成训练集数据,再基于训练集数据输入到若干回归算法计算过程下并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型,优选地自动建立输出回归估算模型是基于若干回归算法分别建立每种算法下各自对应的回归估算模型,同时优选地所述若干回归算法包括但不限于多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法、非线性回归svr算法,结合图2来看,基于训练集数据输入到多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法等每种算法的计算过程中分别独立进行运算后再分别结合大数据机器学习算法自动建立并输出火山岩油藏储层参数与测井曲线特征之间的回归估算模型,同时基于若干回归算法对回归估算模型进行模型参量自动优化,然后进入使用评估检验合格的模型进行智能预测步骤,在此步骤中,首先利用上一步骤的数据预处理结果中与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据(也可以理解为为与火山岩油藏储层参数相关性不好的测井曲线)形成测试集数据,再基于测试集数据对于输出的优化后的回归估算模型进行检验评估,检验评估不合格的模型必须再次进行模型参量自动优化,检验评估合格的模型可以直接应用于对未知储层参数的智能预测,根据火山岩油藏的测井曲线特征通过将未知储层参数的已知测井信息数据输入到优化后且检验评估合格的回归估算模型中进行智能预测,最终获得火山岩油藏储层参数智能预测结果。
优选地,图2所示的基于训练集数据输入到若干回归算法计算过程下并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型还可以是基于若干回归算法自动随机匹配任意不同回归算法后建立对应的回归估算模型,也就是基于训练集数据输入到多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法中的任意两种或者两种以上算法组合后的计算过程中进行运算后再结合大数据机器学习算法自动建立并输出火山岩油藏储层参数与测井曲线特征之间的综合的回归估算模型,充分考虑到了现有常规算法以及算法的多样化因素,使得大数据机器学习算法的学习基础更广泛、可靠性更强。
优选地,本发明中涉及的火山岩油藏储层参数包括岩性孔隙度(渗透率)、油藏含油饱和度、孔隙结构等,同时优选地,对火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理过程中涉及的测井曲线特征包括但不限于补偿密度rhob、自然伽马gr、自然电位sp、井径cal、电阻率ri、声波时差dt/ac、密度den、补偿中子cnl,和/或,测井曲线特征还采用特征组合扩展形式且特征组合扩展形式包括但不限于特征加和、特征作差的方式,也即根据补偿密度rhob、自然伽马gr、自然电位sp、井径cal、电阻率ri、声波时差dt/ac、密度den、补偿中子cnl等测井曲线特征中的一种特征或多种特征加和/作差的方式对已知测井信息(通常直接简称为测井曲线)进行特征分析和特征优选,本实施方式具体采用对与岩性孔隙度(渗透率)corepor这一项火山岩油藏储层参数相关的补偿密度rhob、和声波时差dt/ac进行特征分析和特征优选的数据预处理过程,将技术中已知岩心数据与已知测井信息进行匹配,做出各个单个测井曲线特征对应的曲线与岩性孔隙度(渗透率)corepor相关性的散点图如图3基于图2方法进行关于岩性孔隙度储层参数(如图简写为孔隙度)与补偿密度和声波时差测井曲线特征甚至还有自然伽马、自然电位、井径、感应电导率、浅侧向电阻率、中子等测井曲线特征相关性的特征分析结果所示,然后在图3中根据补偿密度rhob和声波时差dt/ac测井曲线特征加和方式分析优选出与岩性孔隙度(渗透率)corepor相关性较好的测井曲线,得到图4所示的对图3特征分析结果根据补偿密度和声波时差测井曲线特征进行特征优选的特征优选结果,所述特征分析结果和所述特征优选结果统称为数据预处理结果,从该数据预处理结果中提取与岩性孔隙度(渗透率)corepor相关性较好的测井曲线数据(也即与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据)形成训练集数据作为输入特征和大数据机器学习算法学习的基础参与回归估算模型的建立,同时数据预处理结果中余下的与岩性孔隙度(渗透率)corepor相关不好的测井曲线数据(也即与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据形成测试集数据)形成测试集数据。
进一步优选地,在对回归估算模型进行模型自动参量优化的过程中,优选采用网格搜索法对模型进行自动交叉验证,通过调节各模型参量跟踪所述回归估算模型检验评估结果(可以设置为评分方式评价模型好坏,具体优选采用正判率来评价模型好坏),自动搜索不同回归算法对应的最优模型参量组合,并将最优模型参量自动传递到回归估算模型的参量设置中,最终使用多种模型训练学习和优化,直至选择出最优的回归估算模型,结合图2所示的若干回归算法包括多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法等的计算过程,往往不同算法的计算过程中需要优化的参量也会有所不同,具体以几种算法下建立的回归估算模型中需要优化的参量进行说明:
1)多元线性回归算法具体采用线性回归svr算法下建立的回归估算模型中,主要需要优化c参量,c表示一个浮点数/罚项系数;
2)岭回归算法具体采用ridge回归算法下建立的回归估算模型中,主要需要优化α参量,并建立评分数(正判率)与α参量的关系曲线图以观察参量优化结果,如图5中分别基于训练集数据和测试集数据的评分数(正判率)的变化结果所示;
3)核岭回归算法下建立的回归估算模型中,主要需要优化α参量;
4)lasso回归算法下建立的回归估算模型中,主要需要优化α参量,并建立评分数(正判率)与α参量的关系曲线图以观察参量优化结果,如图6中分别基于训练集数据和测试集数据的评分数(正判率)的变化结果所示;
5)决策树回归算法下建立的回归估算模型中,主要需要优化splitter、max_depth两个参量,并建立训练状态下和测试状态下的评分数(正判率)与max_depth参量的关系曲线图以观察参量优化结果,如图7中分别基于训练集数据和测试集数据的评分数(正判率)的变化结果所示,其中,splitter为用于指定切分原则的一个字符串且可以指定的切分原则包括best最有切分原则和random随机切分原则两种,max_depth用于指定树的最大深度且可以为一个整数或者none;
6)随机森林回归算法下建立的回归估算模型中,主要需要优化max_depth、、max_features、n_estimators、三个参量,并分别建立评分数与三个参量的关系曲线图以观察参量优化结果,如图8a-8c中针对三个参量分别基于训练集数据和测试集数据的评分数(正判率)的变化结果所示,其中,max_depth用于指定树的最大深度且可以为一个整数或者none,max_features用于指定树的最大特征参量且可以为一个整数或者浮点数或者字符串,n_estimators为指定了随机森林中树的数量的一个整数,可以直接理解为学习器个数;
7)adaboost回归算法下建立的回归估算模型中,主要需要优化base_estimator、learning_rate、loss三个参量,并分别建立评分数(正判率)与三个参量的关系曲线图以观察参量优化结果,如图9a-9c所示,其中,base_estimator表示一个基础回归器对象,可以理解为基学习器个数,learning_rate表示学习率;
8)梯度提升树回归算法下建立的回归估算模型中,主要需要优化learning_rate、n_estimators、max_features、max_depth、estimatornum、subsample六个参量,并分别建立评分数(正判率)与六个参量的关系曲线图以观察参量优化结果,如图10a-10f所示,其中learning_rate、n_estimators、max_features、max_depth、estimatornum、subsample分别表示学习率、学习器个数、最大特征、最大深度、二次学习器个数,且图10b为基于损失函数huber建立的;
9)k近邻回归算法具体采用knn回归算法下建立的回归估算模型中,主要需要优化weights、n_neighbors、p三个参量,其中weights为用于指定投票权重类型的一字符串或者可调用对象,n_neighbors为用于指定k值的一个整数,p为用于指定在minkowski度量上的指数的一个整数值,然后建立评分数(正判率)与k值的关系曲线图以观察参量优化结果,如图11a-11b所示,其中uniform表示本节点的所有邻居节点的投票权重都相等,distance表示本节点的所有邻居节点的投票权重与距离成反比,即越近的节点,其投票权重也越大;
10)非线性回归svr算法下建立的回归估算模型中,分两种情况,第一种情况主要需要优化gamma、coef0两个参量,其中,gamma是表示核函数的系数的一个浮点数,coef0是用于指定核函数中自由项的一个浮点数;
第二种情况主要需要优化gamma参量,并建立评分数(正判率)与gamma参量的关系曲线图以观察参量优化结果,如图12所示。
优选地,为了更好地检验评估回归估算模型的好坏和稳定性,还可以引入通过与比较每种算法下r2、mae(平均绝对误差)、mse(平均相对误差)的方法对模型进行评检验评估,并生成图形或者自动输出比较表格,最后自动判定r2值最大、mae值和mse值较小的回归估算模型为检验评估最优的回归估算模型,最终根据火山岩油藏的测井曲线特征利用该模型得到火山岩油藏储层参数智能预测结果。
优选地,全部算法下最终得到的火山岩油藏储层参数智能预测结果以图像形式展示出来,基于图2所示本发明方法的具体实施方式,基于训练集数据输入到多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法等每种算法的计算过程中分别独立进行运算后再分别结合大数据机器学习算法自动建立并输出火山岩油藏储层参数与测井曲线特征之间的回归估算模型,同时基于若干回归算法对回归估算模型进行模型参量自动优化,然后进入使用评估检验合格的模型进行智能预测步骤,基于测试集数据对于输出的优化后的回归估算模型进行检验评估,检验评估不合格的模型必须再次进行模型参量自动优化,检验评估合格的模型可以直接应用于对未知储层参数的智能预测,然后根据火山岩油藏的测井曲线特征通过将未知储层参数的已知测井信息数据输入到优化后且检验评估合格的回归估算模型中进行智能预测,最终获得火山岩油藏储层参数智能预测结果,以图像形式展示出来,如图13所示,根据图13能够充分清楚、完整、快速地得出该火山岩油藏位置未知的储层参数且精度非常高。
本发明还涉及了一种火山岩油藏储层参数智能预测系统,该系统与上述火山岩油藏储层参数智能预测方法相对应,可理解为是实现所述火山岩油藏储层参数智能预测方法的系统。如图14的结构示意图所示,该火山岩油藏储层参数智能预测系统具体包括依次连接的测井信息录入单元、数据预处理单元、训练集单元、回归算法建模和优化单元、模型检验评估单元、智能预测单元,其中,模型检验评估单元还接收测试集单元传递来的测试集数据且模型检验评估单元与回归算法建模和优化单元为双向连接,数据预处理单元对测井信息录入单元提供的火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选的数据预处理,训练集单元从数据预处理结果中提取与火山岩油藏储层参数相关性达到一定阈值的测井曲线数据(也即与火山岩油藏储层参数相关性好的测井曲线数据)形成训练集数据同时数据预处理结果中与火山岩油藏储层参数相关性未达到一定阈值的测井曲线数据(也即与火山岩油藏储层参数相关性不好的测井曲线数据)形成测试集数据存入测试集单元,回归算法建模和优化单元基于训练集数据利用若干回归算法并结合大数据机器学习算法自动建立火山岩油藏储层参数与测井曲线特征之间的回归估算模型同时基于所述若干回归算法对回归估算模型进行模型参量自动优化,模型检验评估单元检验评估回归估算模型是否合格,智能预测单元根据火山岩油藏的测井曲线特征利用检验评估合格的回归估算模型进行未知储层参数的智能预测,本系统创新性地引入了多种回归算法,并应用了人工智能、机器学习等技术原理,工作效率高,预测结果精确度高、误差小且实用性强。
优选地,本系统中建立回归估算模型时,回归算法建模和优化单元基于所述若干回归算法分别建立每种算法下各自对应的回归估算模型;或,回归算法建模和优化单元基于所述若干回归算法自动随机匹配任意不同回归算法后建立对应的回归估算模型,充分随意组合其中的任意两种或者两种以上算法后综合进行运算,更能够彻底打破现有技术中对未知储层参数预测过程存在的算法/方法太过单一的问题,提高预测结果的精确度。
优选地,若干回归算法包括但不限于多元线性回归算法、岭回归算法、核岭回归算法、lasso回归算法、决策树回归算法、随机森林回归算法、adaboost回归算法、梯度提升树回归算法、支持向量机回归算法、k近邻回归算法、hurber回归算法、ardr回归算法、贝叶斯回归算法、非线性回归svr算法,充分考虑到了现有常规算法以及算法的多样化因素,使得大数据机器学习算法的学习基础更广泛、可靠性更强。
优选地,所述测井曲线特征包括但不限于补偿密度、自然伽马、自然电位、井径、电阻率、声波时差、密度、补偿中子;和/或,所述测井曲线特征还采用特征组合扩展形式,所述特征组合扩展形式包括但不限于特征加和、特征作差的方式,也就是本系统数据预处理单元在对测井信息录入单元提供的火山岩油藏已知测井信息根据测井曲线特征进行包括特征分析和特征优选时,所根据的测井曲线特征可能是补偿密度rhob、自然伽马gr、自然电位sp、井径cal、电阻率ri、声波时差dt/ac、密度den、补偿中子cnl中的一个特征或任意几个特征组合,所使得依据更为多样化且可以随意选取想要获得的该项火山岩油藏储层参数最相关的特征作为数据预处理依据使得后续的结果导向更为准确、智能预测结果更为精确。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。