本发明属于图像处理领域,特别是遥感图像的清晰化处理。
背景技术:
landsat提供了长时间的中等空间分辨率时间序列图像(landsat5/7/8:1984-),已被广泛用于区域和全球陆地表面制图等。然而,在landsat图像应用中一个严重障碍是频繁的云污染,平均而言,在地球表面每时每刻大约35%的面积都会被云层所覆盖,从而导致landsat等光学遥感影像数据受到污染。云层覆盖是光学遥感图像缺失信息的主要来源,成为后续影像解译的难题。因而云的去除提高了光学遥感图像在不同应用和分析中的潜力,去云相关算法一直是光学遥感领域的研究热点,人们开发了大量的方法来去除光学图像中的云。
在现有的大多数厚云去除方法中,重建一个云区域的缺失值需要使用云区域附近的无云像素提供必要的辅助信息。例如,基于空间的去云方法主要是通过空间插值从邻近的无云像素中估计云像素的值。一般来说,基于空间的方法不适用于大云或者非均匀的云污染区域。最近,越来越多的方法使用在其他日期获取的一张或几张无云图像(称为“参考图像”)来辅助云图像中的云去除。这些基于多时间的方法原理大多是利用云图像中的无云像素来量化云图像和参考图像之间的反射率变化。从逻辑理论上讲,如果使用云图像中的无云像素,这些像素的质量将很大程度上影响云去除的性能。换句话说,即去云的前提是首先识别云污染像素,包括云和云阴影,才能满足后续去除厚云的要求。
目前,landsat反射率产品中包含质量评估波段(qa),其中标记了云和云阴影像素。美国地质调查局(usgs)基于fmask(functionofmask)算法(3.3版)生成了landsats4-8的qa波段。通过详细的比较和验证表明了fmask在陆地卫星图像中云和云阴影检测方面的优越性。由于每景图像都提供了qa波段,利用现有的厚云去除方法恢复landsat云图像中的云似乎是一项简单的任务。然而在的实践中,发现在模拟云图像上的去云性能通常很好(例如,假设无云图像中的某些区域被云覆盖),但在一些真实云图像上发现去云效果较差。在这里给出一个示例来清楚地说明这个问题,对于2019年8月1日获取的华北平原landsat云污染图像(图1a),采用了改进邻域相似像素插值方法(mnspi)进行恢复云区域,发现去云图像的视觉效果较差(见图1b中的“白色”和“黑色”块)。然后,将该云污染图像上的云覆盖在2019年8月17日获取的无云图像上,生成了一幅模拟云图像(图1c)。将mnspi应用于模拟云图像去云中,取得了更好的去云性能(图1d)。由于在模拟云图像上的除云效果较好,因而可知在真实的landsat云图像上,云去除性能差的原因并不是云的形状或景观的异质性。最后通过对比这两幅图像,发现在真实的landsat云图像中有一些云污染的像素没有被正确地标记在qa波段里。相反,在模拟云图像中可以确保所有的云污染的像素被正确地标记。由于云和云阴影掩膜的漏检误差,导致在真实云图像上的云去除性能较差。通过实验结果表明,landsat产品中的qa波段还不能满足实际应用中去云的要求。
技术实现要素:
本发明中,提出了如何提高landsat地表反射率(sr)云图像的除云性能的方法。从逻辑上讲,在执行去云操作前对qa进行进一步处理是解决这个问题的直接方法。因而开发了一种新的qa波段预处理方法称为auto-pcp,新方法旨在通过自动识别剩余的潜在云污染像素来修改qa波段。
auto-pcp使用与去云除操作相同的数据,从而可避免数据收集时的额外负担。auto-pcp只需要一张无云的参考图像,这也是基于多时间的去云方法中所需的最小图像数量。此外,auto-pcp不使用热红外图像和卷云图像,在光学图像进行去云操作时不收集这些图像。auto-pcp是基于qa波段的基础上发展的,因此需要预定义更少的阈值,这使得在qa波段上进行预处理成为一个简单的操作。auto-pcp在landsat地表反射率云污染图像中进行开展,为了更清楚的说明这个方法,使用符号pc和pcs表示云图像qa波段中标记为云和云阴影的像素,其余像素表示为符号pother,auto-pcp的目标是标记pother中漏检的云和云影像素以提高云去除性能。因而本发明一种基于landsat光学遥感图像的云识别方法,该方法包括:
步骤1:识别初始云像素
关于云图像和参考图像之间,云像素在蓝光波段有较大的反射率变化;云像素在蓝光波段的反射率变化值ρblue(change)为:
ρblue(change)=max(ρblue(cloud)-ρblue(ref′))-(ρblue(cloud)-ρblue(ref′))(1)其中,
云像素的另一个特征是云图像中蓝光波段的反射率值大;对于云像素,结合ρblue(cloud)值和ρblue(change)值,计算云指数:
结合ρblue(cloud)和ρblue(change)的归一化形式,ci的取值范围在-1到1之间,对于云像素来说ci值比非云像素大;基于以下两个标准在pother像素中确定了初始云像素:
1):初始云像素i的ci值
其中,median()表示取中值;
2):使用相对阈值来分别确定每类的初始云像素;利用k-means方法对参考图像进行聚类;分类的数目设置为4-5类;以其中的一类为例,在类a中初始云像素i的ci值表示为
其中mean(·)和std(·)分别是均值函数和标准差函数,ci(pother)表示pother的ci值;参数a为标准差倍数,可知a的值越小将会识别更多的初始云像素,但同时也增加了错检误差;经过测试实验,将a参数值设为2;
步骤2:识别初始的云阴影像素;提出云阴影指数csi识别初始云阴影,csi的核心理念与ci相似,csi考虑云图像中云阴影像素近红外波段的反射率值较低(ρnir(cloud));并且同时,csi描述了云阴影像素在云图像和参考图像之间近红外反射率下降的特征,csi表示如下:
其中:
ρnir(change)=(ρnir(ref′)-ρnir(cloud))-min(ρnir(ref′)-ρnir(cloud))(7)
ρnir(cloud)表示云图像中像素在近红外波段的反射率值,ρnir(ref′)表示参考图像中像素在近红外波段的反射率值,
1):
2):分别确定每类的初始云阴影像素;以其中一类为例,在类a中初始阴影像素i的csi值
其中参数b是标准差倍数;其值为2。
步骤3:匹配初始云和云阴影像素;
步骤3.1:云总是伴随着云阴影:利用云、云阴影和太阳之间的几何位置关系来进一步细化初始云和云阴影像素;设初始云像素i位于(x,y),根据下面的方程对应的云阴影像素为(x′,y′):
x′=x-hcloud_i×tanθ×sinφ(10)
y′=y+hcloud_i×tanθ×cosφ(11)
其中θ是太阳天顶角,φ是太阳方位角,这两者都由landsat图像元数据文件提供,hcloud_i表示位于图像(x,y)处此像素的云高;以前估算云高的方法大多是根据大气温度从地面到云的递减率来估计每个云块的高度;然而,本发明没有使用热红外图像来估计hcloud_i,这是因为qa波段中漏检的云通常都是薄云,薄云的亮度温度容易受到地表的影响;作为一个解决方案,
步骤3.2:基于qa波段估算hcloud_i范围,假设hcloud_i在qa波段标记云像素的云高度范围内;为此,根据8邻域的连通性在qa波段生成云斑块和云阴影斑块;对于云斑块j的云高度hcloud_pj可以从云斑块和其对应的阴影斑块之间的水平距离进行近似估计denotedasdispj,表示为:
步骤3.3:计算dispj(图2);
步骤a:将阴影斑块沿着云投影方向移动,当云与阴影斑块的重叠区域达到阴影斑块面积的三分之一则停止移动;此时移动的水平距离是假定为x1,阴影斑块与云斑块重叠的边界记为曲线ab;
步骤b:将曲线ab与阴影斑块对应的外边界a′b′进行匹配,然后基于两条曲线相似的形状的特性,通过线性插值使两条曲线具有相同的长度,并计算它们之间的相关系数;如果相关系数大于等于0.9,就认定匹配成功,此时两条曲线之间的水平距离表示为x2;最终,dispj是x1与x2的水平距离之和(图2);如果相关系数小于0.9,则计算qa波段里n个云斑的高度{hcloud_p1,..,hcloud_pn},则可能的云高范围hcloud_i为满足公式13条件的任意值:
min{hcloudp1,..,hcloudpn}≤hcloud_i≤max{hcloud_p1,..,hcloud_pn}(13)
为了避免hcloud_i受到异常值的影响,从{hcloud_p1,..,hcloud_pn}中删除了最大1%的云高值;auto-pcp允许初始云像素在可能的云高度范围内变化,从而通过使用不同的高度匹配所有初始云和云阴影像素;
若初始云阴影像素找到相匹配的云像素,则保留初始云阴影像素;如果初始云像素的投影像素被其它云覆盖;则从被覆盖的云像素开始投影并确定下一个投影像素,该过程一直持续到投影像素为云阴影像素或无云像素;如果最后投影的像素为云阴影像素,则保留该初始云像素,否则,初始云像素将被移除;此外,在图像边缘的一些初始云和阴影像素的投影位置可能在图像之外,保留这些初始的云和阴影像素;
步骤3.4:删除8邻域连接的像素集小于7个像素的小云斑块和阴影斑块。
进一步的,所述步骤1公式5中a参数值设为2,步骤2公式10中b参数值设为2。
为了说明该方法的技术效果,在四个实验区域对该方法分别进行了真实实验测试与模拟实验测试,通过使用三个不同的qa波段来比较云去除的性能:(1)原始的qa波段(简称“qa_original”);(2)云和云阴影边缘周围扩充两个像素处理的qa波段(简称“qa_dilation”);(3)auto-pcp处理的qa波段(简称“qa_auto-pcp”),以此来说明auto-pcp方法的有效性。这四个实验区域分别代表两季农作物,常绿林,城市,高寒草地四种植被类型。
在真实实验中,对于四个研究区域,比较了真实云图像去云的效果(图3-6)。每个图中展示了分别使用三种不同的qa波段,利用mnspi方法去云得到的结果图,在原始的qa波段中,每个区域都存在着不同程度的云漏检现象(见每张图的放大图)。然而在青藏高原区域中,qa原始波段错误地将许多雪像元识别为云像元,但同时也存在云像元的漏检情况(图6)。最后通过比较三种方法恢复云的视觉效果,发现auto-pcp去除云的性能明显更好,这要归功于对云和阴影的有效识别。在模拟实验中,基于模拟云图像进行定量评价,使用fmask3.3生成每幅模拟云图像的原始qa波段。采用两项指标进行定量评价:一是均方根误差(rmse),它主要量化预测的反射率值与真实值之间的差异,二是结构相似度指数(ssim),主要量化预测图像与真实图像之间的整体图像结构相似度。图8显示了六个波段的平均rmse和ssim值,发现,qa_auto-pcp在所有测试区域中的rmse值最小,ssim值最高(图8)。
附图说明
图1中(a)为2019年8月1日华北平原实测陆地卫星云图,(b)为真实云图像上的厚云去除,(c)为将(a)图像中的云叠加在2019年8月17日获取的无云图像上生成的云模拟图像,(d)为模拟云图像上的厚云去除。
图2中显示云斑块与对应阴影斑块之间几何匹配的示例图,dispj是云斑块j与匹配阴影斑块之间的水平距离。
图3为中国华北平原测试区真实实验结果,上面三张图为真实云图像,由auto-pcp识别的云污染像素(qa_auto-pcp),以及它们的放大视图;下面三张图为通过mnspi使用不同的qa波段生成的云去除图像;注:qa_auto-pcp中的白色多边形代表了在原始qa波段中识别出的云污染的像素,黄色多边形代表了auto-pcp识别出的剩余云像素。
图4为中国东南部测试区真实实验结果图。
图5为中国杭州测试区真实实验结果图。
图6为青藏高原测试区真实实验结果,每个图中的蓝色矩形突出明显的差异。
图7为四个测试区域的模拟云图像(标准假彩色合成)。
图8为实验二中模拟云图像去云结果的rmse和ssim值,其值为六个波段的平均值。
具体实施方式
在四个区域测试了auto-pcp。首先是在华北平原的两季农作物耕地,在冬小麦收获后,夏季玉米或大豆通常在六月中旬种植,地表反射率值变化迅速;第二个站点是中国东南部的常绿林区,属于亚热带季风气候,云污染频繁;第三个站点是中国杭州,这个城市正经历着快速的城市化,景观构成复杂并有一条河流穿过城市;第四个站点在青藏高原,处于高海拔地区并且具有积雪和较复杂的地形。
在四个区域收集了landsat8地表反射率图像。设计了两组实验,使用图像信息如表1所示。
表1.不同的实验中使用的landsat-8地表反射率数据
(1)实验i
(2)实验ii:方括号中为参考图像和云模拟图像之间的ssim
在实验i中,对真实云图像进行了云去除。在每个测试区域,分别使用了一幅陆地卫星云图。通过使用三个不同的qa波段来比较云去除的性能:(1)原始的qa波段(简称“qa_original”);(2)云和云阴影边缘周围扩充两个像素处理的qa波段(简称“qa_dilation”);(3)auto-pcp处理的qa波段(简称“qa_auto-pcp”),对最终的恢复结果进行了视觉评估。
在四个测试区域的真实云图像上比较了云去除的性能(图3-6)。在每个图中,分别展示了auto-pcp处理的qa波段和结合改进的邻域相似像素插值方法(mnspi)生成的去云图像。结果表明,在qa_original波段中,一些云和云的阴影没有被识别出来(见每张图的放大图)。在青藏高原站点中,qa原始波段错误地将许多雪像元识别为云像元,但同时也存在云像元的漏检情况(图6)。因此,基于qa_original的云去除图像在空间上具有明显的不连续性,在图像上存在显而易见的“白色”和“黑色”块。通过膨胀对qa波段进行处理,虽然在一定程度上提高了云去除的性能(参见各图中的qa_dilation),但qa_dilation仍然不能完全覆盖原始qa波段中被忽略的云和阴影斑块。然而通过应用auto-pcp,发现云去除的性能有了明显提高,这要归功于auto-pcp对剩余云和阴影像元的有效识别。
在实验二中,基于模拟云图像进行定量评估。使用fmask3.3生成每幅模拟云图像的原始qa波段,将采用两项指标对云恢复结果进行定量评价:一是均方根误差(rmse),它主要量化预测的反射率值与真实反射率值之间的差异。由于qa_original、qa_dilation和qa_auto-pcp重构的像素个数不同,因此对三个qa波段并集(即qa_original∪qa_dilation∪qa_auto-pcp)中的像素计算rmse。第二个评价指标是结构相似度指数(ssim),主要量化预测图像与真实图像之间的整体图像结构相似度。
图7显示了四个测试区域的模拟云图像。对六个波段的恢复结果进行了定量评估,包括蓝光、绿光、红光、近红外、和两个短波红外波段(即地球资源观测卫星8中的波段2-7)。图8显示了所有六个波段的平均rmse和ssim值,从中可至qa_auto-pcp在所有站点中rmse值最小,ssim值最高。例如,在华北平原通过mnspi去云方法的恢复结果中,qa_original、qa_dilation和qa_auto-pcp的rmse值分别为0.0368、0.0321和0.0152。
与qa_original相比,qa_dilation和qa_auto-pcp中标记了更多的云污染像素,这可能增加了云错检误差的概率。为了帮助理解使用不同qa波段去除云的性能,进一步分析了用于检测云污染像素的漏检误差和错检误差,定义为:
结果表明,qa_auto-pcp显著降低了云和阴影的漏检误差(如在华北平原漏检误差由8.7%降至0.6%)。与此同时,错检误差没有增加,甚至略有下降(表2)。相反,虽然qa_dilation也减少了漏检误差,但其错检误差有明显的增加。
表2.不同qa波段的云污染像素错检误差和漏检误差