基于深度自编码器的地震数据特征提取及聚类方法及装置与流程

文档序号:24184124发布日期:2021-03-09 13:08阅读:180来源:国知局
基于深度自编码器的地震数据特征提取及聚类方法及装置与流程

1.本发明涉及地震信号处理及解释技术,尤指一种基于深度自编码器的地震数据特征提取及聚类方法及装置。


背景技术:

2.传统上在进行波形聚类时,一般是在时间域沿层选取一个时窗,取出一段数据用于波形聚类,或对其进行傅里叶变换在频率域做聚类分析。然而选取时窗取出的数据波形可能不具代表性,往往不是目的层的真实表示;同时,取出的单道波形数据特征点过多,存在严重的数据冗余,增加了波形聚类算法的不稳定性和复杂性;频谱方法容易受到噪声干扰,对信噪比低的数据存在较大影响。


技术实现要素:

3.本发明目的在于提供一种基于深度自编码器的地震数据特征提取及聚类方法及装置,实现地震相分析重要依据的地震数据压缩与特征提取,并提高波形聚类效果。
4.为达上述目的,本发明所提供的一种基于深度自编码器的地震数据特征提取及聚类方法,具体包含:获取地震资料数据,根据所述地震资料数据和目标层级信息提取目标层间的层间数据;将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型;通过所述特征模型于所述地震资料数据中提取获得特征数据;对所述特征数据进行聚类分析获得特征点,将所述特征点还原为原二维平面获得波形聚类结果。
5.在上述基于深度自编码器的地震数据特征提取及聚类方法中,根据所述地震资料数据和目标层级信息提取目标层间的层间数据包含:根据所述地震资料数据和目标层级提取顶层数据和底层数据;根据所述顶层数据和底层数据于所述地震资料数据获得顶层数据和底层数据在地震数据中的坐标数据;根据所述顶层数据、所述底层数据及对应的坐标数据于所述地震资料数据获得目标层间的层间数据。
6.在上述基于深度自编码器的地震数据特征提取及聚类方法中,优选的,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:以所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据为界限,于所述地震资料数据中获得整块数据;将所述整块数据的每一道数据中顶层以上及底层以下的数据置零,获得目标层间的层间数据。
7.在上述基于深度自编码器的地震数据特征提取及聚类方法中,优选的,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最小层间距;以所述最小层间距作为自适应池化输出值对所述顶层数据与所述底层数据之间每一道数据进行自适应池化处理,获得目标层间的层间数据。
8.在上述基于深度自编码器的地震数据特征提取及聚类方法中,优选的,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:根据所述
顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最大层间距;对所述顶层数据与所述底层数据之间每一道数据进行插值/重采样处理获得多个输出数据;将所述输出数据与所述最大层间距比较,当比较结果为大小一致时,根据所述输出数据获得目标层间的层间数据。
9.在上述基于深度自编码器的地震数据特征提取及聚类方法中,优选的,将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型包含:将所述层间数据带入卷积自编码器或全连接自编码器中进行无监督训练获得特征模型。
10.本发明还提供一种基于深度自编码器的地震数据特征提取及聚类装置,所述装置包含数据提取模块、模型训练模块、特征提取模块和聚类模块;所述数据提取模块用于获取地震资料数据,根据所述地震资料数据和目标层级信息提取目标层间的层间数据;所述模型训练模块用于将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型;所述特征提取模块用于通过所述特征模型于所述地震资料数据中提取获得特征数据;所述聚类模块用于对所述特征数据进行聚类分析获得特征点,将所述特征点还原为原二维平面获得波形聚类结果。
11.在上述基于深度自编码器的地震数据特征提取及聚类装置中,优选的,所述数据提取模块包含层间数据提取单元,所述层间数据提取单元用于根据所述地震资料数据和目标层级提取顶层数据和底层数据;根据所述顶层数据和底层数据于所述地震资料数据获得顶层数据和底层数据在地震数据中的坐标数据;根据所述顶层数据、所述底层数据及对应的坐标数据于所述地震资料数据获得目标层间的层间数据。
12.在上述基于深度自编码器的地震数据特征提取及聚类装置中,优选的,所述层间数据提取单元用于以所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据为界限,于所述地震资料数据中获得整块数据;将所述整块数据的每一道数据中顶层以上及底层以下的数据置零,获得目标层间的层间数据。
13.在上述基于深度自编码器的地震数据特征提取及聚类装置中,优选的,所述层间数据提取单元用于根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最小层间距;以所述最小层间距作为自适应池化输出值对所述顶层数据与所述底层数据之间每一道数据进行自适应池化处理,获得目标层间的层间数据。
14.在上述基于深度自编码器的地震数据特征提取及聚类装置中,优选的,所述层间数据提取单元用于根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最大层间距;对所述顶层数据与所述底层数据之间每一道数据进行插值/重采样处理获得多个输出数据;将所述输出数据与所述最大层间距比较,当比较结果为大小一致时,根据所述输出数据获得目标层间的层间数据。
15.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
16.本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
17.本发明的有益技术效果在于:基于无监督的深度神经网络,利用自编码器网络,对地震数据进行压缩和特征提取,降低数据维度,去除数据冗余,提取出层位特征,尤其可以
针对层间不等厚的地震数据进行压缩和特征提取;将提取的特征数据进行聚类分析类,为后续地震相分析等提供可靠支撑。
附图说明
18.此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
19.图1为本发明一实施例所提供的基于深度自编码器的地震数据特征提取及聚类方法的流程示意图;
20.图2为本发明一实施例所提供的层间数据获取的流程示意图;
21.图3为本发明一实施例所提供的补零法获取层间数据的流程示意图;
22.图4为本发明一实施例所提供的自适应池化法获取层间数据的流程示意图;
23.图5为本发明一实施例所提供的插值/重采样法获取层间数据的流程示意图;
24.图6为本发明一实施例所提供的基于深度自编码器的地震数据特征提取及聚类方法的应用流程示意图;
25.图7为本发明一实施例所提供的编码器的结构示意图;
26.图8为本发明一实施例所提供的特征点压缩结果的示意图;
27.图9为本发明一实施例所提供的特征点聚类结果的示意图;
28.图10为本发明一实施例所提供的波形聚类结果的示意图;
29.图11为本发明一实施例所提供的基于深度自编码器的地震数据特征提取及聚类装置的结构示意图;
30.图12为本发明一实施例所提供的电子设备的结构示意图;
31.图13为本发明一实施例所提供的网络结构示意图;
32.图14为本发明一实施例所提供的波形聚类结果示意图。
具体实施方式
33.以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
34.另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
35.请参考图1所示,本发明所提供的一种基于深度自编码器的地震数据特征提取及聚类方法,具体包含:
36.s101获取地震资料数据,根据所述地震资料数据和目标层级信息提取目标层间的层间数据;
37.s102将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型;
38.s103通过所述特征模型于所述地震资料数据中提取获得特征数据;
39.s104对所述特征数据进行聚类分析获得特征点,将所述特征点还原为原二维平面
获得波形聚类结果。
40.进一步的,请参考图2所示,在上述实施例中,根据所述地震资料数据和目标层级信息提取目标层间的层间数据包含:
41.s201根据所述地震资料数据和目标层级提取顶层数据和底层数据;
42.s202根据所述顶层数据和底层数据于所述地震资料数据获得顶层数据和底层数据在地震数据中的坐标数据;
43.s203根据所述顶层数据、所述底层数据及对应的坐标数据于所述地震资料数据获得目标层间的层间数据。
44.在实际工作中,本发明所提供的基于深度自编码器的地震数据特征提取及聚类方法主要可分为以下三部分,整体流程如图6所示:
45.1、层间数据提取:
46.为了进行波形聚类,首先需要从地震数据中提取出目的层间每一道的波形,不同于传统的开时窗取出地震道波形的方法,本发明在一实施例中主要提供以下三种方式予以提取层间数据:
47.请参考图3所示,在本发明一实施例中,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:
48.s301以所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据为界限,于所述地震资料数据中获得整块数据;
49.s302将所述整块数据的每一道数据中顶层以上及底层以下的数据置零,获得目标层间的层间数据。
50.具体的,上述实施例为补零法,即在给定两层位之后采用补零法提取给定层位间的数据;首先读取目标区域顶层和底层的数据及对应矩阵中的坐标。以顶层最小坐标和底层最大坐标为界限取出整块数据;对取出的数据在每一道对顶层以上及底层以下的数据置零即可得到所需的层间数据。
51.请参考图4所示,在本发明一实施例中,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:
52.s401根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最小层间距;
53.s502以所述最小层间距作为自适应池化输出值对所述顶层数据与所述底层数据之间每一道数据进行自适应池化处理,获得目标层间的层间数据。
54.具体的,上述实施例为自适应池化法,即在给定两层位之后使用自适应池化处理给定层位间的数据;首先获取顶底层间最小距离作(或更小)为自适应池化输出的大小,将顶底层间每一道通过自适应池化得到同样的大小,即可得到顶底层间数据。自适应池化可以将不同大小的张量池化成相同大小,其原理为:
55.kernel_size=(input_size+2*padding)-(output_size-1)*stride;
56.其中kernel_size为池化的窗口大小,stride为窗口移动的步长,padding为输入每一条变补充0的层数,input_size为输入张量的大小,output_size为输出张量的大小。
57.请参考图5所示,在本发明一实施例中,根据所述顶层数据、所述底层数据及对应的坐标数据计算获得目标层间的层间数据包含:
58.s501根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最大层间距;
59.s502对所述顶层数据与所述底层数据之间每一道数据进行插值/重采样处理获得多个输出数据;
60.s503将所述输出数据与所述最大层间距比较,当比较结果为大小一致时,根据所述输出数据获得目标层间的层间数据。
61.具体的,上述实施例为插值/重采样法,即在给定两层位之后使用插值/重采样方法处理给定层间数据;首先获取顶底间最大(或更大)距离作为输出大小,将顶底间每一道通过插值/重采样处理得到输出大小一致的数据,即为所需层间数据;插值/重采样可以使用多种方法,在此就不再一一详述。
62.2、数据压缩与特征提取:
63.利用深度自编码器(auto encoder)网络构建特征模型即将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型包含:将所述层间数据带入卷积自编码器或全连接自编码器中进行无监督训练获得特征模型;在实际工作中,自编码器包含编码(encoder)和解码(decoder)两部分,上述卷积自编码器和全连接自编码器,均具有较好的结果;其中全连接自编码器,(如图7所示)由全连接层,激活层组成,卷积自编码器由卷积层,池化层,激活层,全连接层等组成。
64.接着,将上述计算获得的层间数据放入自编码器中进行无监督训练,设置编码器的输出为指定大小获得压缩后的数据(如图8所示),压缩后的数据包含了原始数据中的特征,同时去除了数据冗余;其中,网络训练稳定后编码部分的输出即为压缩过后的地震数据,包含提取出的原始数据的特征数据。
65.3、聚类分析:
66.将压缩后的特征数据用聚类方法(k-means,mean shift等)进行聚类分析(如图9所示),并将结果投影回原二维平面,即可得到波形聚类结果(如图10所示)。
67.为了进一步提高聚类的效果,我们引入了一种自适应高斯混合模型(adaptive gaussian mixture model)层对数据进行聚类分析。自适应高斯混合模型可以自动确定聚类的类别个数,并能够与2中的自编码器结构组合,形成一个新的网络(如图13所示),动态调整自编码器和聚类层的可训练参数,从而提高波形聚类的准确度(如图14所示)。
68.自适应高斯混合模型可由如下公式定义:
[0069][0070][0071]
其中q
ij
(x|θ
i
)是衡量相似度的核,m是平均值向量,∑
j
是协方差矩阵,l
c
是聚类层的损失函数,kl代表kl散度。
[0072]
为更清楚的说明上述实施例的结合应用方式,请再参考图6所示,本发明所提供的
基于深度自编码器的地震数据特征提取及聚类方法具体实施流程可如下:
[0073]
1、获取顶层h1和底层h2的数据以及其在地震数据中的坐标;
[0074]
2、获取层间数据。以顶层最小坐标和底层最大坐标为界限取出整块数据,对取出的数据在每一道对顶层以上及底层以下的数据置零即可得到所需的层位间数据;或获取顶底层间最小距离作(或更小)为自适应池化输出的大小,将顶底层间每一道通过自适应池化得到同样的大小;或获取顶底间最大(或更大)距离作为输出大小,将顶底间每一道通过插值/重采样处理得到输出大小一致的数据;
[0075]
3、将层间数据放入自编码器网络中进行训练;
[0076]
4、用训练好的自编码网络模型输出编码器的结果,输入聚类层,通过循环迭代训练动态调整编码结果和聚类结果;
[0077]
5、进行聚类分析;
[0078]
6、将聚类后的点还原为原二维平面即得到波形聚类结果。
[0079]
请参考图11所示,本发明还提供一种基于深度自编码器的地震数据特征提取及聚类装置,所述装置包含数据提取模块、模型训练模块、特征提取模块和聚类模块;所述数据提取模块用于获取地震资料数据,根据所述地震资料数据和目标层级信息提取目标层间的层间数据;所述模型训练模块用于将所述层间数据带入深度自编码器网络中进行无监督训练获得特征模型;所述特征提取模块用于通过所述特征模型于所述地震资料数据中提取获得特征数据;所述聚类模块用于对所述特征数据进行聚类分析获得特征点,将所述特征点还原为原二维平面获得波形聚类结果。
[0080]
在上述实施例中,所述数据提取模块包含层间数据提取单元,所述层间数据提取单元用于根据所述地震资料数据和目标层级提取顶层数据和底层数据;根据所述顶层数据和底层数据于所述地震资料数据获得顶层数据和底层数据在地震数据中的坐标数据;根据所述顶层数据、所述底层数据及对应的坐标数据于所述地震资料数据获得目标层间的层间数据。其中,所述层间数据提取单元用于以所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据为界限,于所述地震资料数据中获得整块数据;将所述整块数据的每一道数据中顶层以上及底层以下的数据置零,获得目标层间的层间数据。或,根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最小层间距;以所述最小层间距作为自适应池化输出值对所述顶层数据与所述底层数据之间每一道数据进行自适应池化处理,获得目标层间的层间数据。或,根据所述顶层数据对应的坐标数据和所述底层数据对应的坐标数据获得所述顶层数据与所述底层数据之间最大层间距;对所述顶层数据与所述底层数据之间每一道数据进行插值/重采样处理获得多个输出数据;将所述输出数据与所述最大层间距比较,当比较结果为大小一致时,根据所述输出数据获得目标层间的层间数据。
[0081]
本发明的有益技术效果在于:基于无监督的深度神经网络,利用自编码器网络,对地震数据进行压缩和特征提取,降低数据维度,去除数据冗余,提取出层位特征,尤其可以针对层间不等厚的地震数据进行压缩和特征提取;将提取的特征数据进行聚类分析类,为后续地震相分析等提供可靠支撑。
[0082]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
[0083]
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
[0084]
如图12所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图12中所示的所有部件;此外,电子设备600还可以包括图12中没有示出的部件,可以参考现有技术。
[0085]
如图12所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
[0086]
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
[0087]
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
[0088]
该存储器140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
[0089]
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
[0090]
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
[0091]
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
[0092]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0093]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0094]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0095]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0096]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1