光学遥感影像的云检测方法、存储介质及系统与流程

文档序号:23581918发布日期:2021-01-08 14:11阅读:116来源:国知局
光学遥感影像的云检测方法、存储介质及系统与流程

本发明涉及图像处理技术领域,具体地,涉及一种光学遥感影像的云检测方法、存储介质及系统。



背景技术:

地球上空覆盖着大量云,而云覆盖会导致光学遥感影像的信息变化或丢失,对后续影像的使用造成诸多不便,因此光学遥感影像的云检测工作十分重要,快速高效的云检测技术能够判别或剔除云覆盖量较大的影像,减轻处理系统存储空间、数据传输和产品处理的压力,还可以为后续的影像选择提供参考。

现有光学遥感影像的云检测方法通常需要根据云与大多数地面目标的可见光波段反射率、红外谱段亮温以及其它归一化指数的不同,分析确定出最适合于分离云与地物的阈值。此过程中阈值的设定需要较多的人为参与,主观性较强,而且阈值会随着光学遥感影像的季节和地理位置的变化而不同,导致检测结果的精确性较差。此外,由于不同遥感传感器的波段范围与光谱响应函数存在差异,现有的云检测方法通常只能针对某些特定的产品进行检测,并不能推广到大多数传感器。



技术实现要素:

本发明旨在提供一种光学遥感影像的云检测方法、存储介质及系统,以解决现有检测方法存在准确性低和应用场景受限的技术问题。

为此,本发明一部分实施例提供一种光学遥感影像的云检测方法,包括如下步骤:

图像预处理:将光学遥感影像上的数字量化值转换为大气层顶反射率得到预处理图像;

特征提取:从可见光与近红外波段提取所述预处理图像中适用于分离云和地物下垫面的特征;

训练样本集建立:从已有影像数据集中选择用于代表不同种类云和地物的样本点组成训练样本集;

随机森林模型构建:通过所述训练样本集构建随机森林云检测模型;

影像云检测:利用所述随机森林云检测模型对待检测光学遥感影像进行云检测,并利用引导滤波进行精细化处理得到云掩模图像。

可选地,上述的光学遥感影像的云检测方法,在所述图像预处理步骤中,通过如下方法将数字量化值转换为大气层顶反射率:

lλ=gain*dn+bias;

其中,dn为数字量化值,lλ为星上辐射亮度;gain为定标斜率;bias为定标截距;ρtoa为大气层顶反射率;d为日地天文单位距离;esun为大气层顶太阳辐照度;θ为太阳天顶角。

可选地,上述的光学遥感影像的云检测方法,在所述特征提取步骤中:

基于云与地物下垫面之间不同的反射特性和纹理特性,从所述预处理图像中提取出的所述特征包括:

反射光谱特征:依据所述云在光学遥感影像上呈现高亮度且连续覆盖的特点,将可见光与近红外波段的光谱信息作为特征将云与地物下垫面区分开;

ihs空间特征:将所述预处理图像的rgb空间转换为ihs空间后,依据云在亮度通道i中的像素值高于地物下垫面,在饱和度s通道中像素值低于地物下垫面的特点将云与地物下垫面区分开;其中,i表示亮度,h表示色度,s表示饱和度;

暗通道特征:所述预处理图像经过暗通道处理后,依据地物下垫面像素值下降量大于云区像素值下降量的特点将云与地物下垫面区分开;

白色指数特征:依据云像素计算得到的白色指数小于地物下垫面白色指数的特点将云与地物下垫面区分开;

gabor变换特征:通过不同尺度/不同方向的滤波器对所述预处理图像进行纹理特征提取,选择其中分离度最大的特征参数作为所述特征。

可选地,上述的光学遥感影像的云检测方法,,所述ihs空间特征中还包括基底图特征,通过如下步骤构建所述基底图特征j':

通过如下方式计算亮度和饱和度:

通过如下方法得到基底图特征j':

其中,i'表示归一化后的亮度值;s'表示归一化后的饱和度值;τ为缓冲系数,取值在0到1之间;

所述暗通道特征的提取过程为band(x)表示图像的rgb分量;

所述白色指数特征w通过如下方式得到:

其中,m为rgb三个波段的像素值均值,b1、b2、b3分别为rgb三个波段的像素值。

可选地,上述的光学遥感影像的云检测方法,在所述训练样本集建立步骤中:

所述已有影像数据集中中包括一定区域范围内不同地点、不同季节的landsat8影像,其中涵盖植被、城区、湖泊、戈壁、雪域、沙漠以及海洋地物下垫面类型,还包括不同形态和不同密度的云类型。

可选地,上述的光学遥感影像的云检测方法,所述随机森林模型构建步骤中,通过所述训练样本集构建随机森林云检测模型具体为:定义随机森林的参数ntree和mtry,其中ntree代表决策树的数量,mtry代表决策树的最大特征数;对所述训练样本集进行有放回重采样,得到ntree个样本子集;针对每一样本子集,通过随机选择特征构建与该样本子集对应的决策树;每个决策树基于基尼系数最小准则选择最佳属性进行分裂,对决策树进行剪枝处理得到的ntree个决策树共同构成一个随机森林;

在所述影像云检测步骤中,由所有决策树的输出结果投票决定得到待检测光学遥感影像的初始云检测结果。

可选地,上述的光学遥感影像的云检测方法,对所述训练样本集进行有放回重采样的过程,一定比例的未被抽中的练样本作为袋外数据;

将每个决策树对应的袋外数据作为测试数据,所述测试数据用于计算对应决策树的袋外误差;

所有决策树的袋外误差的均值作为随机森林的泛化误差。

可选地,上述的基于可见光与近红外波段的光学遥感影像云检测方法,所述影像云检测步骤中包括:

将待检测光学遥感影像放入所述随机森林云检测模型中得到初始云检测结果;

利用引导滤波对所述初始云检测结果进行精细化处理得到云掩模图像;其中,引导滤波表示为:

其中,y为引导图像,r为输入图像,q为输出图像,i和j为像素标签,wij为滤波核函数,其定义为:

其中,ωk为第k个核函数窗口,|ω|为该窗口内的像素个数,μλ和σλ2分别为引导滤波的均值和方差,ε为正则化参数,ε在0到1之间取值。

本发明还提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行以上任一项所述的光学遥感影像的云检测方法。

本发明还提供一种光学遥感影像的云检测系统,包括至少一个处理器和至少一个存储器,至少一个所述存储器中存储有程序信息,至少一个所述处理器读取所述程序信息后执行以上任一项所述的光学遥感影像的云检测方法。

与现有技术相比,本发明实施例提供的上述技术方案至少具有以下有益效果:本发明基于光学遥感传感器中最常见的可见光与近红外波段,提取和选择出适合于云检测的多种光谱、纹理特征,弥补单一特征分类的不足,同时为算法的普适性奠定基础;采用机器学习分类的方式,避免传统阈值法中需要人工大量统计确定阈值的难题;利用随机森林模型参数较少、泛化能力较强及其在高维数据和小样本集分类上的优势,通过丰富的样本训练得到有效的模型来进行云检测,在保证准确性的同时进一步为算法的普适性奠定基础;利用引导滤波对检测结果进行精细化处理,有效保持了云边界,提高了云检测精度。

附图说明

图1为本发明一个实施例所述光学遥感影像的云检测方法的流程图;

图2为本发明一个实施例所述云检测过程示意图;

图3a为本发明一个实施例所述特征提取得到的可见光波段影像;

图3b为本发明一个实施例所述特征提取得到的近红外波段影像;

图3c为本发明一个实施例所述特征提取得到的亮度通道图;

图3d为本发明一个实施例所述特征提取得到的饱和度通道图;

图3e为本发明一个实施例所述特征提取得到的基底图;

图3f为本发明一个实施例所述特征提取得到的白色指数图;

图3g为本发明一个实施例所述特征提取得到的暗通道图;

图3h为本发明一个实施例所述特征提取得到的gabor滤波结果图;

图4a为本发明一个实施例所述特征提取得到的随机森林模型的决策树数量与袋外误差的关系图;

图4b为本发明一个实施例所述特征提取得到的随机森林模型的决策树的最大特征数与袋外误差的关系图;

图5a为本发明应用的landsat8影像的可见光影像图;

图5b为图5a中可见光影像的随机森林云检测结果;

图6a为本发明应用的高分一号影像的可见光影像图;

图6b为图6a中可见光影像的随机森林云检测结果;

图7a为本发明应用的哨兵二号影像的可见光影像图;

图7b为图7a中可见光影像的随机森林云检测结果。

具体实施方式

下面将结合附图进一步说明本发明实施例。在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明的简化描述,而不是指示或暗示所指的装置或组件必需具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。其中,术语“第一位置”和“第二位置”为两个不同的位置。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个组件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

本申请中提供的以下实施例中的各个技术方案,除非彼此之间相互矛盾,否则不同技术方案之间可以相互组合,其中的技术特征可以相互替换。

本实施例提供一种光学遥感影像的云检测方法,如图1所示,包括如下步骤:

s1:图像预处理:将光学遥感影像上的数字量化值转换为大气层顶反射率得到预处理图像;大多数光学遥感影像数据中只包含数字量化值(digitalnumber,dn)信息,不包含反射率数据。为了消除传感器本身产生的误差,确定传感器入瞳处的辐射值,需要通过辐射定标将影像原始波段的dn值转换为大气层顶反射率,这一过程提供了一景图像中各部分数据及不同景数据之间的归一化基础。具体实现时,可通过如下方法将数字量化值转换为大气层顶反射率:

lλ=gain*dn+bias;

其中,dn为数字量化值,lλ为星上辐射亮度;gain为定标斜率;bias为定标截距;ρtoa为大气层顶反射率;d为日地天文单位距离;esun为大气层顶太阳辐照度,即大气层顶的太阳平均光谱辐射;θ为太阳天顶角,上述参数通常包含在影像头文件中。

s2:特征提取:从可见光与近红外波段提取所述预处理图像中适用于分离云和地物下垫面的特征;光谱特征是遥感影像上最直观的特征,通过该特征能够对影像上地物进行判读和分析。具体地,基于云与下垫面之间反射特性、纹理特性的不同,从可见光和近红外四个波段提取出一系列新的特征对云和地物下垫面进行区分,增加数据维数,在一定程度上提高分类的准确率。

s3:训练样本集建立:从已有影像数据集中选择用于代表不同种类云和地物的样本点组成训练样本集。丰富的训练样本是保证随机森林分类性能的前提,因此训练样本集的建立是方法中重要的一步。所述已有影像数据集中包括一定区域范围内不同地点、不同季节的landsat8影像,其中涵盖植被、城区、湖泊、戈壁、雪域、沙漠以及海洋地物下垫面类型,还包括不同形态和不同密度的云类型。例如选择我国范围内30幅不同季节的landsat8影像,从landsat8影像中选择能够典型代表不同种类云和地物的样本点时,为了让模型取得最佳的分类效果,每个种类的样本点数按面积比例分配,即占据大面积的种类需要比占小面积的种类对应更多的样本。

s4:随机森林模型构建:通过所述训练样本集构建随机森林云检测模型;随机森林(randomforest)是一种机器学习算法,它结合了集成学习思想和随机子空间方法,是一种以决策树为基础的集成分类器。随机森林可通过对少量样本的训练来构建分类模型,能有效抑制过拟合,具有分类性能高、人工干预少和运算速度快等优势,并且对噪声数据有很好的鲁棒性。

s5:影像云检测:利用所述随机森林云检测模型对待检测光学遥感影像进行云检测,并利用引导滤波进行精细化处理得到云掩模图像。

参见图2,云检测过程主要包括训练阶段和测试阶段两部分。其中训练阶段包括上述步骤s1-s4,测试阶段即检测阶段为步骤s5,具体包括:

s11:对测试影像进行预处理;

s12:提取相应特征;以上两个步骤对测试影像进行处理的方法同步骤s1和步骤s2中所采用的方法。

步骤s13:将处理后的测试影像输入至步骤s4得到的检测模型中。

s14:利用所述云检测模型对测试影像进行云检测,得到初始云检测结果。

s15:利用引导滤波进行精细化处理得到精细化云检测掩模图像。

优选地,以上方案中,在步骤s2中,如图3a-图3h所示,基于云与地物下垫面之间不同的反射特性和纹理特性,从所述预处理图像中提取出的所述特征包括:

反射光谱特征:依据所述云在光学遥感影像上呈现高亮度且连续覆盖的特点,将可见光与近红外波段的光谱信息作为特征将云与地物下垫面区分开;在遥感图像解译过程中,通常认为每类地物在各个波段范围内都有与其对应的光谱特征曲线,因此可将地物在各个波段表现出的反射特性作为地物判读的主要依据。由于云特有的反射特性,其在光学遥感影像上往往呈现高亮度且连续覆盖的特点,因此将可见光与近红外波段的光谱信息作为特征,可以把云与地物区分开来。

ihs空间特征:将所述预处理图像的rgb空间转换为ihs空间后,依据云在亮度通道i中的像素值高于地物下垫面,在饱和度s通道中像素值低于地物下垫面的特点将云与地物下垫面区分开;其中,i表示亮度,h表示色度,s表示饱和度。在rgb空间中,厚云与下垫面间的区别较大,但由于薄云通常较暗且包含一定的下垫面信息,其检测效果往往差强人意。在ihs空间中,无论是厚云还是薄云,都能表现出显著的特征。云在rgb空间中偏白色,各波段的反射率较大且相近,将色彩空间转换为ihs空间后,云在亮度通道i中的像素值会明显大于下垫面,而在饱和度通道s中的像素值会明显小于下垫面,基于此特点可以把云与地物区分开来。进一步地,所述ihs空间特征中还包括基底图特征,通过如下步骤构建所述基底图特征j':

通过如下方式计算亮度和饱和度:

通过如下方法得到基底图特征j':

其中,i'表示归一化后的亮度值;s'表示归一化后的饱和度值;τ为缓冲系数,取值在0到1之间,用来防止j'值过大,本实施例可将其设置为0.05;将计算得到的j'拉伸到对应的灰度级,即得到基底图。

暗通道特征:所述预处理图像经过暗通道处理后,依据地物下垫面像素值下降量大于云区像素值下降量的特点将云与地物下垫面区分开;遥感图像在经过暗通道处理后,一些带有单一颜色的地物区域像素值下降很多,甚至有位置趋于0,而云区经过处理后像素值仍能维持在很高的水平,改变不大,基于此特点可以把云与地物区分开来。其中,所述暗通道特征的提取过程为band(x)表示图像的rgb分量;

所述白色指数特征w通过如下方式得到:

其中,m为rgb三个波段的像素值均值,b1、b2、b3分别为rgb三个波段的像素值。

白色指数特征:依据云像素计算得到的白色指数小于地物下垫面白色指数的特点将云与地物下垫面区分开;由于云在可见光波段反射率较为平坦且通常显示为白色,因此可使用不同波段之间差值之和与整体亮度之比来表示云的属性,将白色指数应用于landsat影像云检测中,有效排除了大量的非云像素,云区像素计算得到的白色指数值一般值较小,而地物的颜色比较丰富,各波段反射率变化较大,对应的白色指数值更大,基于此特点可以把云与地物区分开来。

gabor变换特征:通过不同尺度/不同方向的滤波器对所述预处理图像进行纹理特征提取,选择其中分离度最大的特征参数作为所述特征。gabor变换是一种局部fourier变换,它将信号划分为多个区间,在每个区间内单独做fourier变换,得到信号的局部特征。二维gabor滤波器与人类视觉细胞的视觉刺激响应类似,它对于边缘敏感,对光照变化不敏感,能够很好地提取目标的局部空间和频率域信息,十分适合纹理分析。gabor变换提供了良好的方向和尺度选择特性,但云区并没有明显的方向性,采用不同尺度、方向的滤波器进行特征提取,得到的结果相互之间冗余性较大,因此可以通过特征之间的对比分析,仅选择一个分离性较大的特征,以简化特征冗余度。

优选地,上述方案中,步骤s3中,通过所述训练样本集构建随机森林云检测模型具体为:定义随机森林的参数ntree和mtry,其中ntree代表决策树的数量,mtry代表决策树的最大特征数;对所述训练样本集进行有放回重采样,得到ntree个样本子集;针对每一样本子集,通过随机选择特征构建与该样本子集对应的决策树;每个决策树基于基尼系数最小准则选择最佳属性进行分裂,对决策树进行剪枝处理得到的ntree个决策树共同构成一个随机森林;步骤s5中,由所有决策树的输出结果投票决定得到待检测光学遥感影像的初始云检测结果。在随机森林构建过程中,通常只需要定义决策树的数量ntree和决策树的最大特征数mtry这两个参数。随着ntree值的增大,随机森林的分类性能和泛化能力逐步提高,但同时计算复杂度也大大提高;mtry值越大,单个决策树的信息量越多,越容易过拟合,mtry值越小,单个决策树的随机性越强,预测精度下降。在遥感应用中,最常见的是将ntree设置为500,将mtry设置为输入特征数量的平方根。本实施例中为了找到最佳的ntree和mtry值,以随机森林的袋外误差作为评价标准,分析了两参数对算法性能的影响。随机森林模型的袋外误差与ntree之间的关系如图4a所示(图中袋外误差以oob(outofbag)表示),这里控制ntree的取值范围为常用的1~500。从图中可以看出,当决策树数量在100~500之间时,oob误差值基本趋于稳定,没有明显的变化,这说明此时随机森林模型算法的性能趋于稳定。同理,将决策树数量设置为100,调整模型决策树最大特征数的大小进行实验,得到oob误差与最大特征数之间的关系。如图4b所示,当决策树的最大特征数量为4时,oob误差值最小,这也基本符合将mtry设置为输入特征数量平方根的结论。综合考虑两个参数,最终选定随机森林模型最优参数组合为ntree=100,mtry=4。

以上方案中,每个决策树基于基尼系数最小准则选择最佳属性进行分裂,能有效降低决策树之间的相关性,增强单个决策树的预测能力,提高整个随机森林的泛化能力和分类精度。

进一步地,上述方案中,对所述训练样本集进行有放回重采样的过程,一定比例(30%左右)的未被抽中的练样本作为袋外数据;将每个决策树对应的袋外数据作为测试数据,所述测试数据用于计算对应决策树的袋外误差即oob误差;所有决策树的袋外误差的均值作为随机森林的泛化误差。随机森林无需用一个独立的测试集来获得误差的无偏估计,相反,它可以在生成过程中对误差建立一个无偏估计,即在随机森林构建过程中计算得出oob误差,不同于其他模式识别方法所需的交叉验证,该验证方法运行效率高,占用资源少,且结果近似于交叉验证结果。本发明后续实验中同样采用oob误差作为随机森林算法的评价指标,oob误差越小,说明算法的性能越好。

优选地,上述方案中,所述步骤s5中影像云检测步骤中包括:将待检测光学遥感影像放入所述随机森林云检测模型中得到初始云检测结果;利用引导滤波对所述初始云检测结果进行精细化处理得到云掩模图像;其中,引导滤波表示为:其中,y为引导图像,r为输入图像,q为输出图像,i和j为像素标签,wij为滤波核函数,其定义为:

其中,ωk为第k个核函数窗口,|ω|为该窗口内的像素个数,μλ和σλ2分别为引导滤波的均值和方差,ε为正则化参数,ε在0到1之间取值,防止分母过小。

上述方案中,通过在rgb空间中选择最小值得到的暗通道特征中包含了云和下垫面的边界信息,为了使输出图像中能够保持这些边界信息,将随机森林云检测结果作为输入图像,暗通道特征作为引导图像,通过引导滤波计算得到输出图像,在滤波实现过程中,将窗口半径设置为30,ε设置为0.09。引导滤波的输出图像并不是二值图像,因此需要对图像设定一个阈值来得到二值化的云检测结果,这里将阈值设置为80。引导滤波能够有效去除大部分的误判区域,并在云边缘处增加一些半透明云像元,在一定程度上减少了误检和漏检。此外,一些面积较小的云缝隙中虽然存在晴空像元,但通常不具备完整的场景,通过引导滤波处理也可以将该类缝隙纳入云范围之内。在遥感图像中云通常呈现为连续覆盖,而不是以孤立云像素点的形式出现,但由于受到光照等因素的影响,上述模型得到的检测结果中会在云区域内部出现少量孔洞,或者在非云区域零散地出现一些误判点。使用引导滤波对检测结果进行后处理能够有效去除孤立的噪声点,进一步提高云检测算法的精度,保证云区域的完整性。

为了验证本发明的可行性和有效性,利用本发明的上述方案对多景光学遥感影像进行云检测。参考图5a和图5b中的landsat8影像及其云检测结果,在检测结果图中,云为白色,地表为黑色,从具体检测效果来看,本方法能够检测出厚云、薄云以及零散的碎云,对于一些易混淆的水体、复杂纹理的雪等也能进行有效的排除,本发明的上述方案在landsat8影像云检测中能取得较理想的结果。图6a和图6b所示为高分一号及其云检测结果,高分一号携带有两种光学观测相机,分别是2台高分辨率pms相机和4台中分辨率wfv相机,本实施例中选择其中空间分辨率为8m的pms数据进行实验,从图中可以看出,本方案在高分一号云检测应用中得到的云检测结果目视效果整体较好,未出现大面积漏判误判的现象。图7a和图7b为哨兵二号影像及其云检测结果,在检测结果图中,随机森林的方法能够得到较好的检测效果,影像中大部分的厚云、薄云、碎云都被检测出来,没有明显的漏判和误判。由此可以证明,本发明提供的上述方法能够在landsat8、高分一号和哨兵二号影像的云检测中取得较理想的效果。

在本发明的一些实施例中还提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行以上任一项所述的基于可见光与近红外波段的光学遥感影像云检测方法。

在本发明的一些实施例中还提供一种基于可见光与近红外波段的光学遥感影像云检测系统,包括至少一个处理器和至少一个存储器,至少一个所述存储器中存储有程序信息,至少一个所述处理器读取所述程序信息后执行以上任一项所述的基于可见光与近红外波段的光学遥感影像云检测方法。

本发明以上实施例中的方案,基于光学遥感传感器中最常见的可见光与近红外波段进行云检测,为算法的普适性奠定基础;从原始波段中提取和选择出多种适合于云检测的光谱、纹理特征,从而弥补单一特征分类的不足,提高检测精度;以随机森林作为分类器,引入机器学习分类思想,避免传统阈值法中需要人工大量统计确定阈值的难题;随机森林模型参数较少,且能够对不同分类特征的重要性进行评价,具有一定的可解释性;利用随机森林泛化能力较强及其在高维数据和小样本集分类上的优势,通过丰富的样本训练得到有效的模型来进行云检测,在保证准确性的同时进一步为加强算法的普适性性奠定基础;在精细化处理环节,根据引导滤波图像边缘保持的特性对检测结果进行处理,能够有效保持云边界,提高云检测精度。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1