用rimlier数据对井孔事件建模的系统、方法和计算机程序产品的制作方法
【技术领域】
[0001] 本发明总体涉及数据挖掘和分析,并且更具体地,涉及分析异常井孔数据的一个 或多个集群或"rimlier"以对井下事件进行建模的系统。
【背景技术】
[0002] 在过去,已经提出数据挖掘来预测井孔事件。传统上,在数据提取后,异常数据被 除去以使数据齐次,因为为了执行对数据进行建模所必要的计算,系统隐含假定数据是齐 次的并且质量良好。因此,如果异常数据未被除去,则传统的时序模型,诸如Arima、支持向 量机等,将在钻孔领域中失败,因为他们不能处理异常数据,该异常数据可以被看作偏离统 计结果的不期望的噪声。一旦异常数据已被除去,则清理过的数据集然后被用于基于图案 或趋势预测事件。
[0003] 然而,传统的方法具有缺点。首先,除去的异常数据可以给予对过去、现在或将来 的井下事件的更深入了解,诸如,例如,钻头故障、由于振动的工具故障等。除去的异常数据 实际上可表示较低频率的微事件,而非表示噪声。这样,通过除去异常数据,给予对井下事 件了解的关键数据可被忽视。
[0004] 因此,在现有技术中需要利用异常数据检测和预测井孔事件,从而利用井下数据 的所有可用数据的系统。
【附图说明】
[0005] 图1示出根据本发明的示例性实施例的rimlier数据分析系统的方框图;
[0006] 图2A是根据本发明的示例性方法通过rimlier数据分析系统执行的方法的流程 图;
[0007] 图2B示出沿时序绘制的示例性低密度rimlier ;
[0008] 图2C示出沿时序绘制的示例性高密度rimlier ;
[0009] 图2D示出根据本发明的示例性实施例的正常数据、低密度异常和rimlier的数据 分布;
[0010] 图2E示出根据本发明的示例性实施例的正常和异常高密度rimlier的数据分 布;
[0011] 图2F示出根据本发明的示例性实施例的沿时序绘制的头-rimlier-尾分布;以及
[0012] 图3示出根据本发明的示例性实施例的随钻测量变量和它们相对于时间的影响。
【具体实施方式】
[0013] 本发明的说明性实施例和相关方法在下面描述为他们可以在系统中采用以使用 rimlier数据对井下事件进行建模。如本文所使用的,对井下事件进行"建模"是指检测和 /或预测井下事件。为了清楚起见,实际实施或方法的非全部特征在本说明书中进行了描 述。当然应当理解,在任何这种实际实施例的发展中,必须做出许多实施特定的决策,以实 现开发者的特定目标,诸如符合将从一个实施到另一个实施改变的系统相关和商业相关的 限制。此外,应当理解,这种发展成果可能是复杂和费时的,但仍然是对于具有本公开的益 处的本领域技术人员承担的例行任务。考虑下面的描述和附图,本发明的各种实施例和相 关方法的进一步的方面和优点将变得显而易见。
[0014] 图1示出根据本发明的示例性实施例的rimlier数据分析系统100的方框图。如 将在本文中所描述的,rimlier数据分析系统100分析显示异常行为的一组异常数据,在 此也称为集群,在本文中称为"rimlier"。一旦被识别,rimlier数据分析系统100分析 rimlier以确定指示井下事件的发生的rimlier内的那些数据变量。然后,基于该分析, rimlier数据分析系统100对(即,检测和/或预测)井下事件进行建模,诸如,例如,通常 特征在于瞬时不规律行为的那些事件,诸如由工具振动、在牙轮钻头的情况下的轴承故障、 钻头或扩孔器齿故障、增加的岩肩床、井底组件的旋转等引起的行为。
[0015] 通过rimlier数据分析系统100分析的数据可以是实时数据或存储在本地/远程 数据库中。该数据库可以包括例如一般井和作业信息、作业级概要数据、栗送进度表单个阶 段数据,或通常在日常操作报告中捕获的指示操作进度和井的整体状态的其他数据。这种 数据可以包括例如最终套管柱部件和其设定深度、进行中的钻柱、井底钻孔组件和用于钻 孔的钻头和其尺寸等。本发明的示例性实施例访问数据库以提取一个或多个所希望的数据 集。然后,该系统为指示图案或趋势的变量分析数据集,并且因此确定正常数据点和偏离正 常数据点的也称为异常的那些数据点。
[0016] 之后,rimlier数据分析系统100使用已知的统计挖掘技术对异常分组,并且将其 隔离成低密度异常集群和高密度异常集群。如本文所用,聚类不仅指传统的聚类技术,诸 如,例如,核K均值聚类,还指其他分组技术,诸如,例如,人工视觉识别和更先进的计算技 术,如具有本公开的益处的本领域技术人员将理解的。低密度异常集群是具有低数量的数 据点的那些集群,而高密度异常集群是具有较高数量的数据点的那些集群。具有本公开的 益处的本领域技术人员认识到,其中哪个集群被认为是高密度和低密度的确定依在给定的 异常数据集中的数据点的总数量而定。例如,在一些情况下,100个数据点的异常集群可以 不反映实际的井下问题;但是可以替代地反映电信号尖峰。在另一示例中,10个数据点的 异常集群可反映实际的井下问题,并且因此被认为是高密度集群。然而,如将在本文中所描 述的,rimlier数据分析系统100然后分析高密度异常集群或rimlier以对井下事件进行 建模。
[0017] 参照图1,rimlier数据分析系统100包括至少一个处理器102、非临时性计算机 可读存储设备104、收发器/网络通信模块105、可选I/O设备106,以及可选显示器108 (例 如,用户界面),它们全部经由系统总线109互连。由处理器102可执行的软件指令可被存 储在存储设备104或一些其他计算机可读介质中,该软件指令用于根据本文描述的示例性 实施例实施存储在rimlier分析引擎110内的软件指令。
[0018] 虽然没有在图1中明确示出,但应当认识到,rimlier数据分析系统100可以经由 一个或多个适当的网络连接而连接到一个或多个公共和/或专用网络。还应当认识到,包 括rimlier分析引擎110的软件指令还可以从CD-ROM或其他适当的存储介质经由有线或 无线通信方法被加载到存储设备104。
[0019] 此外,本领域技术人员将理解,本发明可以用各种计算机系统配置实践,包括手持 式设备、多处理器系统、基于微处理器的或可编程的消费者电子产品、小型计算机、大型计 算机等。任何数量的计算机系统和计算机网络都可以接受用于与本发明一起使用。本发 明可以在分布式计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。在 分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质 中。本发明可以因此关于计算机系统或其他处理系统中的各种硬件、软件或它们的组合来 实施。
[0020] 仍参照图1,在某些示例性实施例中,rimlier分析引擎110包括数据挖掘模块112 和数据分析模块114。Rimlier分析引擎110提供集成各种系统部件的技术工作流平台,使 得一个部件的输出变成下部件的输入。在示例性实施例中,数据挖掘和分析引擎110可以 是例如通过得克萨斯州休斯敦的哈里伯顿能源服务公司商购的AssetConnet?软件平台。 如由具有本公开的益处的本领域技术人员所理解的,数据库挖掘和分析引擎110提供了集 成的多用户生产工程环境,以促进简化的工作流实践、音响工程和快速决策。在这样做时, rimlier分析引擎110简化了多域工作流的创建,并允许任何种类的应用到整合单一的工 作流中。这些相同的本领域技术人员也将认识到,其他类似的工作流平台可以与本发明一 起利用。
[0021] 作为rimlier分析引擎110的数据库部件,数据挖掘模块112由处理器102用于从 服务器数据库(未示出)或从实时井下数据捕获用于计算的良好相关的数据集。在某些示 例性实施例中,服务器数据库可以是例如本地或远程SQL服务器,其包括与井作业细节、井 孔几何数据、每个阶段的栗送进度表、后作业的概要、井底信息等相关的数据