获取代表典型水体类别的质心集的方法及装置制造方法
【专利摘要】本发明实施例公开了一种获取代表典型水体类别的质心集的方法及装置,获取水体样本数据,对各个水面采样点的反射率光谱数据进行降维得到每个采样点的反射率光谱的两个主成分数据,确定类别数目,至少两次依据各个水面采样点的反射率光谱的两个主成分数据对所述若干水面采样点进行模糊分类;其中,各次进行模糊分类所基于的距离测度不同;将各次执行模糊分类过程得到的,与第i个类别对应的初始质心集求交集,得到与第i个类别对应的质心集,其中,i=1,2,……,C。在提高与第i个类别对应的质心集的稳定性的同时,使得质心集更具有代表性。
【专利说明】获取代表典型水体类别的质心集的方法及装置
【技术领域】
[0001] 本发明涉及遥感【技术领域】,更具体地说,涉及一种获取代表典型水体类别的质也 集的方法及装置。
【背景技术】
[0002] 光学复杂水体水质参数的遥感反演一直是个难点。目前,很多研究采用分类反演 的策略进行遥感反演,即先对遥感像元进行分类,然后针对不同类别的遥感像元采用不同 的策略进行反演,W达到提高反演精度目的。对遥感像元进行分类可分为硬分类和模糊分 类,其中,模糊分类具有提高反演结果的平滑性和稳定性的特点,是该领域的主要研究方 向。
[0003] 对遥感像元进行模糊分类是计算各个像元属于各类别的权重系数,从而根据各个 象元属于各类别的权重系数对像元进行分类,得到若干个质也集。其中,每个像元属于各类 别的权重系数由该像元与各类别的质也像元之间的距离确定,当像元与质也像元之间的距 离越小,认为该像元与质也像元的相似度越好,认为该像元属于质也像元所代表类别的权 重系数就越大。因此,如何得到最有效的代表典型水体类别的质也集是采用模糊分类方法 反演内陆水体水质参数的重要研究内容之一。
[0004] 发明人在实现本发明的过程中发现,目前通过模糊分类获取的代表典型水体类别 的质也集的稳定性较差。
【发明内容】
[0005] 本发明的目的是提供一种获取代表典型水体类别的质也集的方法及装置,W提高 代表典型水体类别的质也集的稳定性。
[0006] 为实现上述目的,本发明提供了如下技术方案:
[0007] -种获取代表典型水体类别的质也集的方法,包括:
[0008] 获取水体样本数据,所述水体样本数据包括若干个水面采样点的遥感反射率光谱 数据;
[0009] 通过主成分分析变换对各个水面采样点的若干个波段的反射率光谱数据进行降 维,得到各个水面采样点的反射率光谱的两个主成分数据;
[0010] 确定类别数目C;
[0011] 至少两次执行模糊分类过程,各次模糊分类过程基于的距离测度不同;所述模糊 分类过程依据各个水面采样点的反射率光谱的两个主成分数据将所述若干水面采样点分 为C类,得到C个初始质也集;
[0012] 将各次执行模糊分类过程得到的,与第i个类别对应的初始质也集求交集,得到 与第i个类别对应的质也集;其中,i= 1,2,……,C。
[0013] 上述方法,优选的,所述确定类别数目C包括:
[0014] 依据各个水面采样点的反射率光谱的两个主成分数据计算不同分类数目下,所述 若干水面采样点的BIC指数;
[0015] 将BIC指数最小时所对应的分类数目确定为类别数目C。
[0016] 上述方法,优选的,所述确定类别数目C包括:
[0017] 依据各个水面采样点的反射率光谱的两个主成分数据计算不同分类数据下,所述 若干水面采样点的Dunn'C指数;
[0018] 将Dunn'C指数最大时所对应的分类数目确定为类别数目C。
[0019] 上述方法,优选的,所述水体样本数据还包括;所述若干个水面采样点的水体环境 变量,所述水体环境变量包括:水质参数和水体不同组分的固有光学量;在得到与第i个类 别对应的质也集之后,所述方法还包括:
[0020] 显示与第i个类别对应的质也集内各个样本的水体环境变量参数;
[0021] 当接收到用户触发的剔除指令时,依据所述剔除指令中携带的样本数据的识别标 识确定目标样本数据,删除所述目标样本数据,并重新执行所述至少两次执行模糊分类过 程的步骤。
[0022] 上述方法,优选的,所述水体样本数据的采样区域包括如下区域中的至少一个;内 陆水域和近岸水域。
[0023] -种获取代表典型水体类别的质也集的装置,包括:
[0024] 样本获取模块,用于获取水体样本数据,所述水体样本数据包括若干个水面采样 点的遥感反射率光谱数据;
[0025] 降维模块,用于通过主成分分析变换对各个水面采样点的若干个波段的反射率光 谱数据进行降维,得到各个水面采样点的反射率光谱的两个主成分数据;
[0026] 确定模块,用于确定类别数目C ;
[0027] 分类模块,用于至少两次执行模糊分类过程,各次模糊分类过程基于的距离测度 不同;所述模糊分类过程依据各个水面采样点的反射率光谱的两个主成分数据将所获取的 若干水面采样点分为C类,得到C个初始质也集;
[0028] 质也集获取模块,用于将各次执行模糊分类过程得到的,与第i个类别对应的初 始质也集求交集,得到与第i个类别对应的质也集;其中,i= 1,2,……,C。
[0029] 上述装置,优选的,所述确定模块包括:
[0030] 第一计算单元,用于依据各个水面采样点的反射率光谱的两个主成分数据计算不 同分类数目下,所述若干水面采样点的BIC指数;
[0031] 第一确定单元,用于将BIC指数最小时所对应的分类数目确定为类别数目C。
[0032] 上述装置,优选的,所述确定模块包括:
[0033] 第二计算单元,用于依据各个水面采样点的反射率光谱的两个主成分数据计算不 同分类数据下,所述若干水面采样点的Dunn'C指数;
[0034] 第二确定单元,用于将Dunn'C指数最大时所对应的分类数目确定为类别数目C。 [00巧]上述装置,优选的,所述水体样本数据还包括;所述若干个水面采样点的水体环境 变量,所述水体环境变量包括:水质参数和水体不同组分的固有光学量;所述装置还包括:
[0036] 显示模块,用于显示与第i个类别对应的质也集内各个样本的水体环境变量参 数;
[0037]删除模块,用于当接收到用户触发的剔除指令时,依据所述剔除指令中携带的样 本数据的识别标识确定目标样本数据,删除所述目标样本数据,并生成触发指令W指示所 述分类模块重新执行所述至少两次执行模糊分类过程的步骤。
[0038] 上述装置,优选的,所述样本获取模块具体用于,获取水体样本数据,所述水体样 本数据包括若干个水面采样点的遥感反射率光谱数据;所述水体样本数据的采样区域包括 如下区域中的至少一个:内陆水域和近岸水域。
[0039] 通过W上方案可知,本申请提供的一种获取代表典型水体类别的质也集的方法及 装置,获取水体样本数据,对各个水面采样点的反射率光谱数据进行降维得到每个采样点 的反射率光谱的两个主成分数据,确定类别数目,至少两次依据各个水面采样点的反射率 光谱的两个主成分数据对所述若干水面采样点进行分类;其中,各次进行模糊分类所基于 的距离测度不同;将各次执行模糊分类过程得到的,与第i个类别对应的初始质也集求交 集,得到与第i个类别对应的质也集,其中,i= 1,2,……,C。在提高与第i个类别对应的 质也集的稳定性的同时,使得质也集更具有代表性。
【专利附图】
【附图说明】
[0040] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W 根据该些附图获得其他的附图。
[0041] 图1为本申请实施例提供的获取代表典型水体类别的质也集的方法;
[0042] 图2为本申请实施例提供的确定类别数目C的一种实现流程图;
[0043] 图3为本申请实施例提供的确定类别数目C的另一种实现流程图;
[0044] 图4为本申请实施例提供的获取代表典型水体类别的质也集的方法的另一种实 现流程图;
[0045] 图5为本申请实施例提供的获取代表典型水体类别的质也集的装置的一种结构 示意图;
[0046] 图6为本申请实施例提供的确定模块的一种结构示意图;
[0047] 图7为本申请实施例提供的确定模块的另一种结构示意图;
[0048] 图8为本申请实施例提供的获取代表典型水体类别的质也集的装置的另一种结 构示意图。
[0049] 说明书和权利要求书及上述附图中的术语"第一"、"第二"、"第H""第四"等(如 果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解该样 使用的数据在适当情况下可W互换,W便该里描述的本申请的实施例能够W除了在该里图 示的W外的顺序实施。
【具体实施方式】
[0050] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0051] 本申请实施例提供的获取代表典型水体类别的质也集的方法的一种实现流程图, 可W包括:
[0052] 步骤Sll ;获取水体样本数据,所述水体样本数据包括若干个水面采样点的遥感 反射率光谱数据;
[0053] 所述若干水面采样点的遥感反射率光谱数据可W是通过实际测量得到的各个采 样点的遥感反射率光谱。光学复杂水体的遥感反射率光谱是采用"水面W上测量法"测量 得到的,该测量方法是目前测量水体的遥感反射率光谱的通用方法,该方法可W去除天空 光对水体的遥感反射率光谱的影响。并且每个站点(即每个采样点)都可W获取一条遥感 反射率光谱。遥感反射率光谱是指光的反射率随波长变化的情况,例如,遥感反射率光谱可 W是WInm(即1纳米)为间隔,至少包括从350nm至900nm的551个波段范围内的遥感反 射率光谱,反射率数值为介于0到1之间的实数。本发明实施例中,不同采样点的光谱范围 和光谱分辨率(即波段间隔)相同。
[0054] 所述若干水面采样点的遥感反射率光谱数据也可W是遥感器获取的覆盖光学复 杂水体的图像。通常,M行、N列、L波段的遥感图像,共M*N=Num个像元,每个像元对应的 L个波段的数值可W看作是该像元对应的水面点的反射率光谱。
[00巧]步骤S12;通过主成分分析变换(即PCA变换)对各个水面采样点的若干个波段 的反射率光谱数据进行降维,得到各个水面采样点的反射率光谱的两个主成分数据;
[0056] 本发明实施例中,通过PCA变换,将每个采样点的L个波段的反射率光谱数据用两 个主成分来表示。也就是说,本发明实施例中,在进行分类前,先对各个采样点的反射率光 谱数据进行降维,降低了数据量,减少了计算量。
[0057] 步骤S13;确定类别数目C;
[0058] 本发明实施例中,可W采用模糊聚类算法进行模糊分类。其中,模糊聚类是非监督 分类的一种,而进行非监督分类需要预先输入类别的数目。只有在类别数目已知的情况下, 才能够对样本进行非监督分类。
[0059] 其中,类别数目C可W由研究人员根据经验确定。
[0060] 步骤S14;至少两次执行模糊分类过程,各次模糊分类过程基于的距离测度不同; 所述模糊分类过程依据各个水面采样点的反射率光谱的两个主成分数据将所述若干水面 采样点分为C类,得到C个初始质也集;
[0061] 每执行一次模糊分类过程,得到C个初始质也集。每一个初始质也集代表一个典 型水体的类别,每一个初始质也集中都有若干个与该典型水体类别相似或相同的水体样本 数据。
[0062] 可选的,可W采用模糊C-均值聚类算法(fuzzyc-meansalgorithm,FCM)对水 体样本数据进行模糊分类。当然,本发明实施例中,并不限于使用FCM聚类算法进行模糊分 类,也可W采用其它的模糊聚类算法,如改进的模糊聚类算法EFC-MD巧volutionary化zzy clusteringwithminkowskidistances),只要是基于距离测度的模糊聚类算法均适用于 本发明实施例。
[0063] 距离是度量数据相似性简单而有效的指标。模糊分类过程中,需要依据像元与各 类别的质也像元之间的距离确定该像元属于各类别的权重系数。
[0064]本发明实施例中,第j次模糊分类过程所使用的距离测度与前j-1次模糊分类过 程所使用的距离测度均不同,其中,j= 1,2,3,……J,J为执行模糊分类过程的总的次数,J> 2。即任意两次模糊分类过程所使用的距离测度均不同。
[0065] 可选的,本发明实施例中,所述的距离测度可W使用但不限于W下几种:欧氏 距离巧uclideandistance,Euc),余弦距离(SAD),OPD散度(o;rthogonalprojection dive;rgence),TD散度(transformeddive;rgence),马氏距离等。
[0066] 优选的,可W执行四次模糊分类过程。具体的,四次执行模糊分类过程时,每次执 行模糊分类过程,使用一种距离测度,四次执行模糊分类过程,共使用四种距离测度。所选 用的距离测度可W分别为:欧式距离、余弦距离、oro散度和TD散度。当然,本发明实施例 中,并不限于该四种,也可W是上述五种距离测度中的任意四种。
[0067] 步骤S15;将各次执行模糊分类过程得到的,与第i个类别对应的初始质也集求交 集,得到与第i个类别对应的质也集;其中,i= 1,2,……,C。
[006引假设第j次模糊分类得到的C个质也集分别为Uj,,Uj,,……Uj.e,则与第i个类别 对应的质也集Ui为Ui=Uiin咕n……n恥,其中,Uw(j= 1,2,3,……J,J为执行模 糊分类过程的总的次数,J> 2)为进行第j次模糊分类得到与第i个类别对应的初始质也 集。
[0069] 通过分析与第i个类别对应的质也集内各个样本的环境参量就可W确定与第i个 类别对应质也集代表什么典型水体。具体如何确定与第i个类别对应质也集代表什么典型 水体属于本领域的公知常识,该里不再费述。
[0070]将与第i个类别对应的质也集内的反射率光谱求均值,得到代表典型水体类别的 质也光谱。
[0071]本发明实施例提供的获取代表典型水体类别的质也集的方法,获取水体样本数 据,对各个水面采样点的反射率光谱数据进行降维得到每个采样点的反射率光谱的两个主 成分数据,确定类别数目,至少两次依据各个水面采样点的反射率光谱的两个主成分数据 对所述若干水面采样点进行模糊分类;其中,各次进行模糊分类所基于的距离测度不同; 将各次执行模糊分类过程得到的,与第i个类别对应的初始质也集求交集,得到与第i个类 别对应的质也集,其中,i= 1,2,……,C。在提高与第i个类别对应的质也集的稳定性的 同时,使得质也集更具有代表性。
[0072] 优选的,由于类别数目C通过经验确定不足够客观,基于此,本发明实施例提出类 别数目C可W依据样本数据本身确定。
[0073] 可选的,确定类别数目C的一种实现流程图如图2所示,可W包括:
[0074] 步骤S21;依据各个水面采样点的反射率光谱的两个主成分数据计算不同分类数 目下,所述若干水面采样点的BIC指数;
[0075] BIC指数为对模糊聚类的有效性进行评价的一个指标。本发明实施例中使用各个 水面采样点降维后得到的主成分数据计算BIC指数,而不是使用原始获取的水面采样点的 反射率光谱数据进行计算,降低了计算BIC指数的计算量。
[0076] 本发明实施例中,分类数目从2到16逐一变化,分类数目每变化一次,计算一次样 本数据的BIC指数。在计算BIC指数时,使用经过PCA变换后的样本数据进行计算。BIC指 数可W依据如下公式计算:
【权利要求】
1. 一种获取代表典型水体类别的质心集的方法,其特征在于,包括: 获取水体样本数据,所述水体样本数据包括若干个水面采样点的遥感反射率光谱数 据; 通过主成分分析变换对各个水面采样点的若干个波段的反射率光谱数据进行降维,得 到各个水面采样点的反射率光谱的两个主成分数据; 确定类别数目C ; 至少两次执行模糊分类过程,各次模糊分类过程基于的距离测度不同;所述模糊分类 过程依据各个水面采样点的反射率光谱的两个主成分数据将所述若干水面采样点分为C 类,得到C个初始质心集; 将各次执行模糊分类过程得到的,与第i个类别对应的初始质心集求交集,得到与第i 个类别对应的质心集;其中,i = 1,2,……,C。
2. 根据权利要求1所述的方法,其特征在于,所述确定类别数目C包括: 依据各个水面采样点的反射率光谱的两个主成分数据计算不同分类数目下,所述若干 水面采样点的BIC指数; 将BIC指数最小时所对应的分类数目确定为类别数目C。
3. 根据权利要求1所述的方法,其特征在于,所述确定类别数目C包括: 依据各个水面采样点的反射率光谱的两个主成分数据计算不同分类数据下,所述若干 水面采样点的Dunn' c指数; 将Dunn' c指数最大时所对应的分类数目确定为类别数目C。
4. 根据权利要求1所述的方法,其特征在于,所述水体样本数据还包括:所述若干个水 面采样点的水体环境变量,所述水体环境变量包括:水质参数和水体不同组分的固有光学 量;在得到与第i个类别对应的质心集之后,所述方法还包括: 显示与第i个类别对应的质心集内各个样本的水体环境变量参数; 当接收到用户触发的剔除指令时,依据所述剔除指令中携带的样本数据的识别标识确 定目标样本数据,删除所述目标样本数据,并重新执行所述至少两次执行模糊分类过程的 步骤。
5. 根据权利要求1所述的方法,其特征在于,所述水体样本数据的采样区域包括如下 区域中的至少一个:内陆水域和近岸水域。
6. -种获取代表典型水体类别的质心集的装置,其特征在于,包括: 样本获取模块,用于获取水体样本数据,所述水体样本数据包括若干个水面采样点的 遥感反射率光谱数据; 降维模块,用于通过主成分分析变换对各个水面采样点的若干个波段的反射率光谱数 据进行降维,得到各个水面采样点的反射率光谱的两个主成分数据; 确定模块,用于确定类别数目C ; 分类模块,用于至少两次执行模糊分类过程,各次模糊分类过程基于的距离测度不同; 所述模糊分类过程依据各个水面采样点的反射率光谱的两个主成分数据将所获取的若干 水面采样点分为C类,得到C个初始质心集; 质心集获取模块,用于将各次执行模糊分类过程得到的,与第i个类别对应的初始质 心集求交集,得到与第i个类别对应的质心集;其中,i = 1,2,……,C。
7. 根据权利要求6所述的装置,其特征在于,所述确定模块包括: 第一计算单元,用于依据各个水面采样点的反射率光谱的两个主成分数据计算不同分 类数目下,所述若干水面采样点的BIC指数; 第一确定单元,用于将BIC指数最小时所对应的分类数目确定为类别数目C。
8. 根据权利要求6所述的装置,其特征在于,所述确定模块包括: 第二计算单元,用于依据各个水面采样点的反射率光谱的两个主成分数据计算不同分 类数据下,所述若干水面采样点的Dunn' c指数; 第二确定单元,用于将Dunn' c指数最大时所对应的分类数目确定为类别数目C。
9. 根据权利要求6所述的装置,其特征在于,所述水体样本数据还包括:所述若干个水 面采样点的水体环境变量,所述水体环境变量包括:水质参数和水体不同组分的固有光学 量;所述装置还包括: 显示模块,用于显示与第i个类别对应的质心集内各个样本的水体环境变量参数; 删除模块,用于当接收到用户触发的剔除指令时,依据所述剔除指令中携带的样本数 据的识别标识确定目标样本数据,删除所述目标样本数据,并并生成触发指令以指示所述 分类模块重新执行所述至少两次执行模糊分类过程的步骤。
10. 根据权利要求6所述的装置,其特征在于,所述样本获取模块具体用于,获取水体 样本数据,所述水体样本数据包括若干个水面采样点的遥感反射率光谱数据;所述水体样 本数据的采样区域包括如下区域中的至少一个:内陆水域和近岸水域。
【文档编号】G01N21/55GK104359847SQ201410742576
【公开日】2015年2月18日 申请日期:2014年12月8日 优先权日:2014年12月8日
【发明者】张兵, 申茜, 李俊生, 张方方, 叶虎平, 吴艳红 申请人:中国科学院遥感与数字地球研究所