一种叠前地震资料随机噪音压制方法及系统与流程

文档序号:30087743发布日期:2022-05-18 06:34阅读:76来源:国知局
一种叠前地震资料随机噪音压制方法及系统与流程

1.本发明属于地球物理勘探技术以及深度学习领域,具体涉及一种叠前地震资料随机噪音压制方法及系统,应用于石油地球物理勘探中去噪处理中的随机噪音去除处理。


背景技术:

2.地震资料噪音的存在严重影响了地震资料的成像质量,如何有效的进行地震资料去噪处理是地震资料处理中提升地震资料信噪比的关键步骤。地震资料噪音主要分为规则噪音和随机噪音,其中规则噪音具有确定性特征,可根据噪音形成机理进行有效压制,而随机噪音仅存在统计特性,无确定性分布形态,噪音压制难度相对较大。目前常见的随机噪音压制方法主要包括时空域去噪方法和变换域去噪方法,其中时空域去噪算法直接基于时空域数据进行处理,代表性方法主要有基于冗余结构假设的非局部均值的去噪算法,该方法主要通过对地震数据中的局部结构相似的区域分组进行噪音压制,可以在不降低有效信号分辨率的同时对随机噪音进行有效压制,但计算复杂度相对较高,处理效率较低。基于变换域的去噪方法通过对拟处理数据进行数据域变换以增强噪音和有效信号的差异来对噪音进行压制,目前的代表性方法有f-k域滤波、小波变换去噪以及曲波变换去噪等,该类方法在实际生产中虽然取得了一定的应用效果,但在去噪性能或去噪效率方面仍然存在一些不足。
3.总的来说,目前针对随机噪音的压制已经发展了多种算法,并取得了较为广泛的实际应用,但目前的大多方法都依赖于人工干预并在很大程度上受到了处理人员的能力的影响,去噪过程可能需要大量的人工调参,在很大程度上影响了去噪效率。
4.近年来,随着基于人工智能的自动化快速图像处理技术的飞速发展,卷积神经网络算法的出现推动了深度学习在各个领域的应用,使得基于人工智能的地震数据处理具备了广阔应用的前景。由此基于深度神经网络的地震资料噪音去除技术也得到了较快的发展和应用并取得了一定的效果。但目前存在的智能化去噪方法主要基于常规的卷积网络,技术的发展和实际推广应用在很大程度上受限于可用的标签数据集的大小以及可设计的神经网络的规模的大小。u-net网络发表于2015年,最初用于医学细胞分割,是一种经拓展和优化的全卷积网络,网络由一个降采样路径以及一个对称的上采样路径组成。可支持少量的数据训练模型,相比其他全连接以及常规卷积网络具有更高的分辨率。开发基于u-net网络的地震资料随机噪音压制技术可有效提升噪音压制精度。
5.基于上述问题,开发了基于u-net网络的地震资料随机噪音压制技术,此外,考虑到在智能化处理的过程中,模型的训练占用最长的时间,常规基于cpu的训练以及单gpu的训练未能充分利用计算资源而影响了网络训练的效率,由此本发明基于tensorflow实现了多gpu的数据并行的模型训练并提供了高精度高效的智能化去噪流程,实现了噪音压制的智能化处理,避免了去噪过程的人工干预。形成的技术可更好的服务于地震资料处理,并为地震资料随机噪音压制技术的生产应用推广奠定基础,该方法未见相应的研究文献资料。


技术实现要素:

6.本发明的目的在于解决上述现有技术中存在的难题,提供一种叠前地震资料随机噪音压制方法及系统,实现多gpu并行的模型训练,进一步增强模型训练的效率,并建立一套泛化能力强、去噪精度高的智能化去噪网络,减少人工干预,提升去噪效率,为地震资料处理提供高信噪比的数据,并为今后的高精度地震资料去噪技术提供新的技术思路并为实际生产应用提供强有力的技术支撑。
7.本发明是通过以下技术方案实现的:
8.本发明的第一个方面,提供了一种叠前地震资料随机噪音压制方法,所述方法利用实际地震数据和叠前炮集正演模拟数据以及gpu并行模式获得智能化随机噪音压制网络,并利用所述智能化随机噪音压制网络对实际叠前地震数据进行处理,获得随机噪音压制后的叠前地震资料。
9.本发明的进一步改进在于,所述方法包括:
10.(1)利用实际地震数据和叠前炮集正演模拟数据制备数据集,并将数据集分成训练数据集和验证数据集;
11.(2)设计网络,并利用gpu和训练数据集对网络进行并行训练得到训练好的网络;
12.(3)采用验证数据集对训练好的网络进行验证得到验证后的智能化随机噪音压制网络;
13.(4)采集叠前地震数据,并将叠前地震数据输入到所述验证后的智能化随机噪音压制网络中,得到随机噪音压制后的叠前地震资料。
14.本发明的进一步改进在于,所述步骤(1)中的实际地震数据是从典型探区的去噪地震资料中选取的具有高质量去噪效果的实际地震数据;
15.所述步骤(1)中的叠前炮集正演模拟数据是对叠前炮集进行正演模拟后得到的模拟数据。
16.本发明的进一步改进在于,所述实际地震数据占40%,所述模拟数据占60%。
17.本发明的进一步改进在于,所述步骤(1)中的利用实际地震数据和叠前炮集正演模拟数据制备数据集的操作包括:
18.将所述模拟数据作为标签数据;
19.将实际地震数据中提取到的噪音数据与模拟数据进行随机数据匹配后求和得到含噪数据,或者在模拟数据中添加高斯随机噪音得到含噪数据。
20.含噪数据和标签数据构成所述数据集。
21.所述步骤(1)的操作进一步包括:以mnist数据集的存储格式将所述数据集写入到压制文件中。
22.本发明的进一步改进在于,所述步骤(2)设计的网络为u-net网络;
23.在u-net网络的上采样部分中采用最近邻插值算法进行图像上采样。
24.本发明的进一步改进在于,所述步骤(2)中的利用gpu和训练数据集对网络进行并行训练得到训练好的网络的操作包括:
25.cpu将训练数据集分发给各个gpu;
26.每个gpu利用训练数据集对所述u-net网络进行训练,并根据训练后的结果得到梯度值,然后将梯度值发送给cpu;
27.cpu对所有gpu发送来的梯度值进行规约求均值得到梯度均值,并将梯度均值应用于损失函数和优化器中,得到更新后的模型;
28.经过多次更新后得到训练好的网络。
29.本发明的进一步改进在于,所述损失函数采用l2范数;
30.所述优化器采用adam优化器。
31.本发明的第二个方面,提供了一种叠前地震资料随机噪音压制系统,所述系统包括:
32.数据集制备单元,用于利用实际地震数据和叠前炮集正演模拟数据制备数据集,并将数据集分成训练数据集和验证数据集;
33.网络设计训练单元,与所述数据集制备单元连接,用于设计网络,并利用gpu和训练数据集对网络进行并行训练得到训练好的网络;
34.验证单元,与所述网络设计训练单元连接,用于采用验证数据集对训练好的网络进行验证得到验证后的智能化随机噪音压制网络;
35.噪音压制单元,与所述验证单元连接,用于采集叠前地震数据,并将叠前地震数据输入到所述验证后的智能化随机噪音压制网络中,得到随机噪音压制后的叠前地震资料。
36.与现有技术相比,本发明的有益效果是:
37.本发明将u-net网络应用于地震资料去噪中,有效避免了常规卷积网络对训练数据量以及神经网络规模的高要求,并实现了多gpu数据并行的网络训练,提升了训练效率,实现了叠前资料随机噪音的有效压制。
附图说明
38.图1为本发明采用的u-net网络结构示意图。
39.图2为本发明实现多gpu数据并行原理示意图。
40.图3为本发明进行网络训练时多gpu并行时的gpu卡实时运行状态示意图。
41.图4为本次验证数据的无噪单炮数据。
42.图5为本次验证数据的加噪后的单炮数据。
43.图6为本次验证数据的无噪标签数据和加噪数据的单道结果对比。
44.图7为本次验证数据的经过训练好的网络压制恢复后的单炮数据。
45.图8为本次验证数据的无噪标签数据和去噪数据的单道结果对比。
46.图9为本次验证数据的实际含噪地震数据。
47.图10为本次验证数据的实际数据噪音压制后的数据;
48.图11本发明方法的步骤框图;
49.图12本发明系统的组成结构图。
具体实施方式
50.下面结合附图对本发明作进一步详细描述:
51.本发明面向叠前地震资料随机噪音压制问题,基于tensorflow建立u-net网络对制备的数据集进行多gpu数据并行训练,发展了一种计算高效的智能化去噪流程,并通过验证数据验证了所生成算法流程的去噪效果。
52.本发明采用的u-net网络的结构如图1所示,整个网络为全卷积神经网络,分为下采样和上采样两个部分,并在网络的上采样路径中依然保持有大量的通道,保证了网格的高分辨率。其中,下采样部分的基本结构单元为两个卷积层(通道数相同,卷积核大小3x3)接一个最大池化层(2x2,步长为2x2),共三组,卷积层通道数由最初的64上升为256,每组通道数为上一组的2倍,并在池化层的作用下完成图像的下采样,图像横纵向采样点数变为上一组的一半。在上采样部分中采用了最近邻插值算法(nearest_neighbor)进行图像上采样,进一步采用了裁剪和复制的方法与左边下采样部分中分辨率比较高的图片拼接起来,保证了上采样过程中的信息的丰富度和分辨率。上采样卷积过程通道数不断减少并保持与下采样路径的对称,最后经过一个1x1的卷积得到最后的输出结果。
53.u-net网络区别于其他深度学习网络的一个重要结构就是:在每上采样一次,就要和下采样部分对应通道数相同的网络层做一次融合,即当两组图像大小不一致时,需要将下采样过程中的对应图像做一次裁剪以保证和上采样过程的图像大小相同,进一步将两组图像数组在通道数所在的维度做一次融合即复制拼接,如图1所示。而当上下采样过程中图像大小一致时,该过程可以简化为单纯的复制拼接,省略裁剪过程。
54.本发明采用的深度学习网络结构是在现有的u-net网络(最初应用于图像分割)基础上,网格结构基本保持一致(为全卷积神经网络,分为下采样和上采样两个部分),进而根据本发明自身需求以及数据特点,针对性地缩减了整体网络的层数以及各个卷积层的通道数,并修改了上采样算法等算法以整体适应于本发明的图像处理需求。
55.本发明u-net网络的输入输出图像尺寸大小保持一致,保证了端对端的训练过程。为保证去噪前后的数据能量和振幅相对关系保持不变,采用的损失函数为l2范数(采用现有的l2范数公式即可),并采用adam优化器(采用现有的adam优化器)进行迭代更新。
56.此外,为了提升训练效率,本发明实现了基于gpu数据并行的网络训练,实现过程如图2所示,其中cpu负责数据分发、梯度规约(数据分发后在各个gpu卡中进行梯度更新,然后将各个更新量在cpu中求平均值作为当前的梯度更新量)以及模型更新,gpu负责模型训练。
57.具体的,cpu分发的是训练样本数据(对于本发明来说就是去噪前的数据以及对应的去噪后的标签数据),cpu每次所取的训练数据大小为batch_size*gpu卡数目,然后cpu将这些数据平均分发到每块gpu卡上,每块卡数据量为batch_size。cpu将每次所取的训练数据平均分发到每块gpu卡上,每块gpu卡的数据量为batch_size。
58.本发明采用的并行方式是数据并行,即每个并行单元(每块gpu卡)采用同样的网络模型进行训练,并将训练后的结果(即梯度更新量)进行梯度计算(每个gpu卡中进行训练的过程就是常规的深度学习网络训练过程,通过给定对应的损失函数以及优化迭代器,在网络训练过程中只需调用深度学习网络优化迭代器的梯度计算api即可得到当前的梯度),并将梯度值传到cpu进行规约求均值,cpu负责将所求梯度应用于优化器中,进行模型更新(深度学习中的网络模型更新指的各个网络层权重参数(这里具体指卷积核参数)的更新,本发明采用的是adam算法,主要思想是通过不断求解梯度迭代的更新神经网络权重,最终使得目标泛函最小)。
59.图2中的损失量loss是指基于当前网络权重系数求得的目标函数的值,即当前的输入数据输入到网络中求得的输出结果与期望结果(标签结果)差的l2范数。基于深度学习
tensorflow框架中现有的adam优化迭代器可以求得此刻的梯度。
60.本发明方法的实施例如下:
61.【实施例一】
62.如图11所示,基于u-net网络的叠前地震资料随机噪音压制方法包括以下步骤:
63.(1)利用实际地震数据和叠前炮集正演模拟数据制备数据集:深度学习处理的一个关键步骤就是标签数据集的制作,为保证训练网络的泛化能力,对于智能化噪音压制技术高品质标签数据来源可由两部分组成:1,典型探区的高品质去噪地震资料进行数据分析和提取:实际数据标签是提高深度网络泛化能力的重要组成部分,因此数据选择应该涵盖多种实际典型探区,并从中选取高质量去噪效果的数据,提升数据集的鲁棒性;2,叠前炮集正演模拟数据:实际数据去噪效果在很大程度上受到去噪算法和数据本身资料质量的影响,而正演模拟数据对应的去噪后结果是明确已知的,由此可以提升网络的去噪效果。其中实际地震数据占40%,叠前炮集正演的模拟数据占60%。
64.本发明通过正演模拟可以得到大量的无噪的叠前炮集数据(即无噪单炮数据)作为去噪后的期望输出的标签数据,而对应的去噪前数据制备主要通过两种方式实现:1,从选取的实际资料中只提取噪音数据(去噪前后数据作差)与制备的正演模拟数据进行随机数据匹配后求和得到含噪数据;2,对无噪的模拟数据添加高斯随机噪音作为含噪数据。含噪数据和标签数据即构成了数据集。
65.以上两种方式得到的数据各占模型数据的50%。最终以mnist数据集的存储格式对以上数据按照幻数(magic-4字节)、图像数量(4字节),单个图像行数(4字节)、单个图像列数(4字节)、数据的规则写入压制文件进行数据集的制备;将数据集分成训练数据集和验证数据集,两者的比例可以根据实际需要进行设置。
66.(2)设计网络,并利用gpu和训练数据集对网络进行并行训练得到训练好的网络:基于本发明设计的网络结构、损失函数、迭代优化器以及gpu并行训练算法进行网络训练:训练过程中将训练数据集中的无噪单炮数据作为标签数据,并在每个batch(每个gpu训练一个batch)训练过程中都按照既定的信噪比对标签数据随机地进行随机噪音添加以进行训练数据增强,并将两组数据(两组数据就是添加随机噪音前后的含噪数据,含噪数据作为数据输入,无噪数据做为期望输出)输入到网络进行训练,最终得到一套智能化随机噪音压制网络(整个训练过程就是深度学习网络不断更新的过程,在此过程中网络参数不断优化,当达到预期的训练精度后网络停止训练,此时对应的网络权重参数即为最终的智能化噪音压制网络),并将训练好的网络保存;
67.(3)采用验证数据对训练好的网络进行验证得到验证后的智能化随机噪音压制网络:重载已保存的网络,输入验证数据集中的拟去噪的实际地震数据进行数据去噪处理,验证训练网络的效果,得到验证后的智能化随机噪音压制网络;
68.(4)采集叠前地震数据,并将叠前地震数据输入到所述验证后的智能化随机噪音压制网络中,得到随机噪音压制后的叠前地震资料。
69.本发明还提供了一种叠前地震资料随机噪音压制系统,本发明系统的实施例如下:
70.【实施例二】
71.如图12所示,所述系统包括:
72.数据集制备单元10,用于利用实际地震数据和叠前炮集正演模拟数据制备数据集,并将数据集分成训练数据集和验证数据集;
73.网络设计训练单元20,与所述数据集制备单元10连接,用于设计网络,并利用gpu和训练数据集对网络进行并行训练得到训练好的网络;
74.验证单元30,与所述网络设计训练单元20连接,用于采用验证数据集对训练好的网络进行验证得到验证后的智能化随机噪音压制网络;
75.噪音压制单元40,与所述验证单元30连接,用于采集叠前地震数据,并将叠前地震数据输入到所述验证后的智能化随机噪音压制网络中,得到随机噪音压制后的叠前地震资料。
76.本发明应用的实施例如下:
77.【实施例三】
78.本次训练输入数据大小为128x1000,其中,共制备了包含10万个单炮结果的数据集。建立上述的u-net网络,并设定学习率为0.001,训练过程中为进一步提升网络的泛化能力,进一步添加5%的高斯噪音进行数据增强,另外batch_size设定为20,学习轮数设定为15轮。此外本次测试所用集群gpu为rtx 2080ti显存大小为11g,训练所用gpu卡数为七块卡,模型训练过程中gpu卡的运行状态如图3所示,由图可知,7块gpu卡都具有较高的利用率,有效提升了网络训练的效率。
79.基于上述参数进行网络训练,并将训练好的模型保存。在测试过程中首先采用了模型数据进行测试,对正演数据通过加8%的噪音进行测试,输入的无噪单炮数据如图4所示,添加8%噪音的单炮数据如图5所示,提取图4和图5的第20道单道数据对比如图6所示,对比加噪前后的数据,可以明显看出,此时加噪后的数据噪音已经很大程度上淹没了有效信号,常规去噪具有很大的难度。此时采用上述训练好的网络对该加噪数据进行去噪处理,得到的去噪后的数据如图7所示,由图7可以看出,此时的噪音基本得到压制,有效信号得到了恢复,为了验证网络的去噪效果,提取无噪数据和去噪后数据的第20道单道数据进行对比,如图8所示,由图8可得,去噪后数据与标签无噪的数据误差极小,有效轴的位置的能量和形态都得到了很好的恢复,验证了所建立网络的去噪效果。
80.为了进一步验证本发明网络的去噪效果,进一步选取以实际资料进行测试,输入的含噪数据如图9所示,由图可以看出,该实际数据信噪比低,噪音发育严重,很大程度上淹没了有效信号。利用本发明得到的网络对该数据进行处理,得到的数据如图10所示,由图10可以看出,随机噪音得到了很好的压制,信噪比得到了较大的提升,进一步验证了本发明得到的智能化去噪网络的处理效果。
81.最后应说明的是,上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1