测井数据的数据体积优化方法、装置、设备和存储介质

文档序号:32053143发布日期:2022-11-04 19:33阅读:51来源:国知局
测井数据的数据体积优化方法、装置、设备和存储介质

1.本发明涉及测井曲线预处理技术领域,具体而言,涉及一种测井数据的数据体积优化方法、装置、设备和存储介质。


背景技术:

2.测井(logging)是利用岩层的电化学特性、导电特性、声学特性、放射性等地球物理特性,利用电、声、放射性等方法测量地球物理参数的方法。测井曲线是指测量后得到的数据绘制成的曲线。
3.测井曲线预处理技术是指对las(las)格式测井文件进行初步数据分析,为储层裂缝分析、地质建模、油气资源评价等工作提供可靠的数据资源。预处理技术通过数据格式转换、异常数据剔除和测井曲线归一化处理等方法,分析、清洗las格式文件中的声波时差(ac)、自然电位(sp)、侵入带电阻率(rs)、自然伽马(gr)等多类测井曲线数据。
4.但是,现有的测井数据体积普遍较大,使得测井数据的传输和拷贝很不方便。有鉴于此,申请人在研究了现有的技术后特提出本技术。


技术实现要素:

5.本发明提供了一种测井数据的数据体积优化方法、装置、设备和存储介质,以改善上述技术问题中的至少一个。
6.第一方面、
7.本发明提供了一种测井数据的数据体积优化方法,其包含步骤s1至步骤s4。
8.s1、获取初始数据。其中,初始数据包括las格式的多个初始测井文件,测井文件包含文件头信息和测井数据。文件头信息包含用以标识测井数据中所记录曲线类型的初始曲线标识合集。
9.s2、分别判断各个初始测井文件的初始曲线标识合集中是否包含目标曲线。
10.s3、对于包含目标曲线的初始测井文件:根据初始曲线标识合集,获取目标曲线的位置,并根据位置从测井数据中提取目标曲线的目标曲线数据。以及,根据目标曲线,更新文件头信息,并将更新后的文件头信息和目标曲线数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
11.s4、根据目标测井文件,获取初始数据对应的目标数据。其中,目标数据包括多个目标测井文件。
12.在一个可选的实施例中,步骤s3包括步骤s31至步骤s34。对包含目标曲线的初始测井文件执行步骤s31至步骤s34,以获取其对应的目标测井文件。
13.s31、根据初始曲线标识合集,获取目标曲线的列坐标。
14.s32、根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据,以获取目标测井数据。
15.s33、根据目标曲线,删除深度和目标曲线以外的曲线标识,以更新文件头信息。
16.s34、将更新后的文件头信息和目标测井数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
17.在一个可选的实施例中,步骤s32包括步骤s321至步骤s323。
18.s321、获取预先加载的标准模板库。
19.s322、根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据
20.s321、将目标曲线数据和深度数据,存储于标准模板库的向量集中,以获取目标测井数据。
21.在一个可选的实施例中,步骤s34包括步骤s341至步骤s342。
22.s341、更新后的文件头信息和目标测井数据,按照las标准格式合并。
23.s342、获取目标测井件的命名规则,并根据命名规则,将合并后的数据保存至外部存储。
24.在一个可选的实施例中,目标曲线为声波时差。
25.第二方面、
26.本发明提供了一种测井数据的数据体积优化装置,其包含:
27.解析模块,用于获取初始数据。其中,初始数据包括las格式的多个初始测井文件,测井文件包含文件头信息和测井数据。文件头信息包含用以标识测井数据中所记录曲线类型的初始曲线标识合集。
28.判断模块,用于分别判断各个初始测井文件的初始曲线标识合集中是否包含目标曲线。
29.提取模块,用于对于包含目标曲线的初始测井文件:根据初始曲线标识合集,获取目标曲线的位置,并根据位置从测井数据中提取目标曲线的目标曲线数据。以及,根据目标曲线,更新文件头信息,并将更新后的文件头信息和目标曲线数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
30.目标数据模块,用于根据目标测井文件,获取初始数据对应的目标数据。其中,目标数据包括多个目标测井文件。
31.在一个可选的实施例中,提取模块包括:
32.坐标获取单元,用于根据初始曲线标识合集,获取目标曲线的列坐标。
33.数据提取单元,用于根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据,以获取目标测井数据。
34.头信息更新单元,用于根据目标曲线,删除深度和目标曲线以外的曲线标识,以更新文件头信息。
35.合并单元,用于将更新后的文件头信息和目标测井数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
36.在一个可选的实施例中,数据提取单元包括:
37.模板库子单元,用于获取预先加载的标准模板库。
38.数据提取子单元,用于根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据
39.内部数据存储子单元,用于将目标曲线数据和深度数据,存储于标准模板库的向
量集中,以获取目标测井数据。
40.在一个可选的实施例中,合并单元包括:
41.合并子单元,用于更新后的文件头信息和目标测井数据,按照las标准格式合并。
42.外部存储子单元,用于获取目标测井件的命名规则,并根据命名规则,将合并后的数据保存至外部存储。
43.第三方面、
44.本发明提供了一种测井数据的数据体积优化设备,其包括处理器、存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行,以实现如第一方面任意一段所说的测井数据的数据体积优化方法。
45.第四方面、
46.本发明提供了一种计算机可读存储介质。计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如第一方面任意一段所说的测井数据的数据体积优化方法。
47.通过采用上述技术方案,本发明可以取得以下技术效果:
48.本发明实施例,能够自动定位、筛选出目标曲线相关有效信息,剔除冗余无关的测井曲线种类,按照标准文件格式将其存储备份,并实现文件大批量处理。同现有预处理方法相比,可以显著降低内存存储空间,提高声波时差数据实时存取与分析效率。
49.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
50.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
51.图1是本发明第一实施例提供的数据体积优化方法的流程示意图。
52.图2是本发明第一实施例提供的数据体积优化方法的逻辑图。
53.图3是初始测井文件的示例。
54.图4是目标测井文件的示例。
55.图5是本发明第二实施例提供的数据体积优化装置的结构示意图。
具体实施方式
56.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
57.为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
58.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制
本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
59.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
60.取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
61.实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些内容以外的顺序实施。
62.下面结合附图与具体实施方式对本发明作进一步详细描述:
63.实施例一:
64.请参阅图1至图4,本发明第一实施例提供一种测井数据的数据体积优化方法,其可由测井数据的数据体积优化设备(以下简称:优化设备)来执行。特别地,由优化设备中的一个或多个处理器来执行,以实现步骤s1至步骤s4。
65.s1、获取初始数据。其中,初始数据包括las格式的多个初始测井文件,测井文件包含文件头信息和测井数据。文件头信息包含用以标识测井数据中所记录曲线类型的初始曲线标识合集。
66.获取初始文件,具体为:根据las格式的编码规则对初始数据进行解析,以获得能够直接被识别读取、搜索的内存数据。此外,在步骤s1还包括:数据库整理,统计文件名称规律,排除声波时差曲线标识歧义性。
67.可以理解的是,所述优化设备可以是便携笔记本计算机、台式机计算机、服务器、智能手机或者平板电脑等具有计算性能的电子设备。具体的,为了实现本发明实施例,发明人通过解析las格式测井文件,并在vs2008平台上利用c++编程语言研发了声波时差曲线批量高效处理系统。
68.如图3所示,las文件格式解析为:las格式测井文件的首行为~version information,后面的井信息数据块记录版本、数据存储信息。~well information block是井信息数据段。从“~curve information”作为曲线种类记录开始,包括多类测井曲线的ascii段数据。其中ac为声波时差数据记录标识。以“~a”为标识,~a前面为文件头部分,后面每行即为不同深度层位记录的测井数据。
69.通过解析测井文件数据格式,可以读取las格式的文件中的数据(包含:测井数据),为后续并定位、提取声波时差曲线等操作奠定了基础。
70.s2、分别判断各个初始测井文件的初始曲线标识合集中是否包含目标曲线。
71.在本实施例中,目标曲线默认为声波时差。声波时差曲线会在裂缝发育段发生明显变化,并容易产生周波跳跃现象,故常被用来识别水平裂缝或网状裂缝,使用频率相对较高。
72.在其它实施例中,在步骤s2之前还可以包括:获取目标曲线。此时目标曲线为用户自己选择的测井曲线中的任意一种。可以理解的是,目标曲线可以是一个也可以是多个。将目标曲线的标识符存入集合中,生成目标曲线标识集合用于检索。
73.具体的,通过判断初始测井文件信息中是否包含初始曲线标识合集中的标识来判断目标曲线的存在状况;若不为空,则在此基础上判断每一类目标曲线的存在情况;否则,当前初始测井文件的目标曲线提取结束,退出。
74.s3、对于包含目标曲线的初始测井文件:根据初始曲线标识合集,获取目标曲线的位置,并根据位置从测井数据中提取目标曲线的目标曲线数据。以及,根据目标曲线,更新文件头信息,并将更新后的文件头信息和目标曲线数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
75.具体的,从文件库循环读取初始测井文件数据。在判断到初始测井文件数据中包含目标曲线时,将目标曲线对应的目标曲线数据提取出来。从而减少文件的数据量,提出无用的曲线。
76.在上述实施例的基础上,本发明的一个可选地实施例中,步骤s3包括步骤s31至步骤s34。对包含目标曲线的初始测井文件执行步骤s31至步骤s34,以获取其对应的目标测井文件。
77.s31、根据初始曲线标识合集,获取目标曲线的列坐标。
78.具体的,当判断到初始测井文件中包含目标曲线时(即:初始曲线标识合集中包含目标曲线的标识时)进行目标定位;否则,继续对下一个输入下一个初始测井文件进行识别。
79.如图3所示,在测井数据中,测井曲线的数据时按照初始曲线标识合集中的标识的顺序按照“列”排序来进行存储的。具体的,初始曲线标识合集中的第一个标识,其对应的数据为测井数据中第一列的数据。在本实施例中,在文件头中,利用ac标识(声波时差标识)与depth标识(深度标识),识别声波时差曲线在数据域的对应列坐标。
80.s32、根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据,以获取目标测井数据。
81.优选地,步骤s32包括步骤s321至步骤s323。s321、获取预先加载的标准模板库。s322、根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据s321、将目标曲线数据和深度数据,存储于标准模板库的向量集中,以获取目标测井数据。
82.具体的,对数据域部分进行数据抽取,排除空格、换行符的干扰,获取目标列所有曲线数据。在内存开辟存储空间,将数据存储在由标准模板库提供的向量集中。
83.s33、根据目标曲线,删除深度和目标曲线以外的曲线标识,以更新文件头信息。
84.具体的,如图3和图4所述,提取后的文件中,只包含目标曲线,因此需要将初始曲线标识合集中的非目标曲线的标识删除,以保证初始曲线标识合集和测井数据一一对应。
85.s34、将更新后的文件头信息和目标测井数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
86.优选地,步骤s34包括步骤s341至步骤s342。s341、更新后的文件头信息和目标测井数据,按照las标准格式合并。s342、获取目标测井件的命名规则,并根据命名规则,将合并后的数据保存至外部存储。
87.具体的,las文件头信息与数据域信息按标准格式合并,并按照文件名规则,将数据输出到外存存储。
88.s4、根据目标测井文件,获取初始数据对应的目标数据。其中,目标数据包括多个目标测井文件。
89.可以理解的是,在本实施例中,分别对每个初始测井文件进行处理。并将包含目标曲线的初始测井文件转换为目标测井文件。在将所有包含目标曲线的初始测井文件全部转换为目标测井文件即得到了目标数据。
90.本发明实施例,能够自动定位、筛选出目标曲线相关有效信息,剔除冗余无关的测井曲线种类,按照标准文件格式将其存储备份,并实现文件大批量处理。同现有预处理方法相比,可以显著降低内存存储空间,提高声波时差数据实时存取与分析效率。
91.需要说明的是,本发明实施例的测井数据的数据体积优化方法能够显著降低存储空间,便于移动或远程备份存储。现有测井数据预处理技术虽然可以剔除异常数据、减小观测误差,但是无法有效解决海量测井曲线数据的存储、管理问题。
92.以长庆油田为例,有些储层区域的测井数据达到gb数量级,不便于测井文件的移动备份存储与数据读取分析。例如:某油田60口井的las文件数据高达960m,使用本专利方法处理后,声波时差测井曲线文件仅为46m。
93.现有测井数据预处理技术无法显著提升声波时差数据的存取速率与分析效率。在进行储层裂缝评估时,声波时差常被用来识别水平或网状裂缝,为获取声波时差数据,每次需将las格式文件中所有类型的测井曲线加载到软件平台中再选取声波时差曲线,在这一过程中,绝大部分测井曲线数据使用不到,且有些las文件的测井曲线数量高达数百条,这大大降低了实时读取与分析声波时差数据的效率。
94.实施例二:
95.请参阅图5,本发明第一实施例提供一种测井数据的数据体积优化装置,其包含:
96.解析模块1,用于获取初始数据。其中,初始数据包括las格式的多个初始测井文件,测井文件包含文件头信息和测井数据。文件头信息包含用以标识测井数据中所记录曲线类型的初始曲线标识合集。
97.判断模块2,用于分别判断各个初始测井文件的初始曲线标识合集中是否包含目标曲线。
98.提取模块3,用于对于包含目标曲线的初始测井文件:根据初始曲线标识合集,获取目标曲线的位置,并根据位置从测井数据中提取目标曲线的目标曲线数据。以及,根据目标曲线,更新文件头信息,并将更新后的文件头信息和目标曲线数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
99.目标数据模块4,用于根据目标测井文件,获取初始数据对应的目标数据。其中,目标数据包括多个目标测井文件。
100.在一个可选的实施例中,提取模块3,包括:
101.坐标获取单元,用于根据初始曲线标识合集,获取目标曲线的列坐标。
102.数据提取单元,用于根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据,以获取目标测井数据。
103.头信息更新单元,用于根据目标曲线,删除深度和目标曲线以外的曲线标识,以更
新文件头信息。
104.合并单元,用于将更新后的文件头信息和目标测井数据合并,以获取包含目标曲线的初始测井文件对应的目标测井文件。
105.在一个可选的实施例中,数据提取单元包括:
106.模板库子单元,用于获取预先加载的标准模板库。
107.数据提取子单元,用于根据列坐标从测井数据中提取目标曲线的目标曲线数据,以及测井数据的深度数据
108.内部数据存储子单元,用于将目标曲线数据和深度数据,存储于标准模板库的向量集中,以获取目标测井数据。
109.在一个可选的实施例中,合并单元包括:
110.合并子单元,用于更新后的文件头信息和目标测井数据,按照las标准格式合并。
111.外部存储子单元,用于获取目标测井件的命名规则,并根据命名规则,将合并后的数据保存至外部存储。
112.实施例三:
113.本发明第一实施例提供一种测井数据的数据体积优化设备,其包括处理器、存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行,以实现如实施例一第一方面任意一段所说的测井数据的数据体积优化方法。
114.实施例四:
115.本发明第一实施例提供一种计算机可读存储介质。计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如实施例一任意一段所说的测井数据的数据体积优化方法。
116.在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
117.另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
118.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存
取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
119.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1