一种基于蜂群智能的遥感影像聚类方法与流程

文档序号:11143367阅读:304来源:国知局
一种基于蜂群智能的遥感影像聚类方法与制造工艺

本发明涉及一种基于蜂群智能的遥感影像聚类方法,属于遥感影像聚类分析领域。



背景技术:

土地利用/覆被为很多学科提供了基础数据,包括生态学、地理学及气候学等。因而,一直是科学家关注的焦点之一。遥感技术已经被认为是获取土地利用/覆被数据的主流手段之一,这是因为其具有很多独特的优势,包括宏观性、现势性、可重复性和经济性等。科学家已经付出了很大精力发展了很多遥感分类算法,但由于遥感影像的复杂性,精确的遥感影像分类仍然是一项巨大挑战。

总体而言,分类方法分为监督分类与非监督分类(聚类)。监督分类(例如最大似然法)一般分类精度较好,但需要大量训练样本指导分类。而训练样本的搜集一般十分费时费力,并且很多地区不可到达。随着遥感技术的快速发展,人类获取的卫星遥感数据量呈现海量规模。在这种背景下,非监督分类受到了科学家越来越多的关注和注意,这是因为其不需要样本知识,而仅依靠遥感影像自身统计特性就能生产土地利用数据。目前,非监督分类方法已经广泛应用于各类遥感应用,包括全球土地利用制图等。

k-means算法是一种最为常用的非监督遥感分类算法。它工作原理简单,效率较高,因而得到广泛应用。然而,k-means建立在数据对象符合高斯分布基础之上,而遥感数据十分复杂,其数据分布往往不符合高斯分布。因而,k-means往往无法达到全局最优解。此外,其性能在很大程度上受到初始数据的影响,因而稳定性不足。

飞速发展的人工智能为这一领域的进步提供了新的契机。非监督分类问题可以转换为一个优化问题,利用人工智能方法加以解决。遗传算法(genetic algorithm,GA)是最为经典的和最常用的智能算法,基于GA学者们发展了遗传聚类算法(GA-clustering)用于遥感影像分类。该算法包括以下步骤:

1.将每一个解决方案视为一个染色体,通过对染色体的操作实现优化;

2.构造适宜度函数,通过选择算子保留精英群体,淘汰部分落后群体;

3.利用交叉算子和变异算子增加种群多样性;

4.达到循环停止条件,输出最优解决方案,实现遥感影像非监督分类。

但是上述遗传聚类算法具有如下缺点:

1开发能力弱:遗传聚类算法依靠选择和交叉算子来对已有染色体进行开发,但并没有对特别优异的染色体予以特别重视,因而其收敛速度较慢,不适合处理复杂和大规模的遥感数据。

2开拓能力较差:遗传聚类算法仅仅依靠交叉和变异来实现种群的开拓,往往很难实现解空间的全局搜索与开拓;由于其开拓能力弱,所以其遥感影像聚类结果好坏十分依赖于初始种群质量,即聚类结果不够稳定。

综上,现有智能算法由于开发和开拓能力弱,在挖掘最优聚类中心从而实现遥感影像分类任务中,往往无法得到全局最优聚类中心,无法取得满意遥感分类结果。



技术实现要素:

本发明的目的是为了解决现有用于遥感影像的分类算法开发和开拓能力弱,在挖掘最优聚类中心从而实现遥感影像分类任务中,往往无法得到全局最优聚类中心,无法取得满意遥感分类结果的缺点,而提出一种基于蜂群智能的遥感影像聚类方法,包括如下步骤:

步骤1)确定待分类遥感影像分类数目,并将遥感影像的每一个像元随机分配给一种分类;每个像元具有预定数量的特征;

步骤2)根据像元的特征对像元进行蜂群智能挖掘,具体为:

步骤2.1)初始化控制参数;所述控制参数包括蜜蜂数量、最大循环次数、限制搜索次数;蜜蜂包括雇佣蜂、观察蜂;所述蜜蜂数量为p,雇佣蜂数量为p/2,所述观察蜂数量为p/2;

步骤2.2)建立食物源;每个食物源对应于一个雇佣蜂;所述食物源由每一个类别的聚类中心连接形成,长度为n×m,其中n为遥感影像中每一个像元的波段数目,m为待分类数目;所述食物源的前n位表示第一个类别的聚类中心,以此类推;

步骤2.3)计算食物源的适宜度;所述适宜度函数f的表达式为f=1/(M+1),M为聚类指标;

步骤2.4)搜索新食物源;即在根据步骤2.3)计算完现有食物源的适宜度后,在已有食物源周围随机搜索新的食物源位置;

步骤2.5)观察蜂根据随机概率P(Xi)对一个食物源进行跟随,随机概率P(Xi)的表达式为:

其中,Xi为第i个蜜蜂食物源位置,f(Xi)为食物源Xi的花粉丰度,Ne为雇佣蜂数量;

步骤2.6)若一个食物源在经过限制搜索次数后始终不能提高f(Xi)的值,则雇佣蜂转变为侦察蜂,使用列维飞行在解空间内全局搜索新的食物源;若能够提高f(Xi)的值,则跳转到步骤2.4);

步骤2.7)当所有蜜蜂完成搜索,将当前的适宜度最高的最食物源与上一个循环的最优食物源进行比较,选取数值更高的作为当前的全局最优食物源;当循环达到最大循环次数时,停止循环并输出最优聚类中心。

本发明的有益效果为:1、现有技术中的遗传聚类算法仅仅通过选择算子来增加精英群体比例,但并没有围绕该群体进行强力搜索,因此其开发能力很弱。而本发明在影像最优聚类中心搜索过程中,利用观察蜂对优秀食物源周围进行多次搜索,大大提高了种群开发能力。2、遗传聚类算法通过交叉和变异算子实现全局搜索,然而交叉算子仅仅基于已有基因片段,而变异算子往往只针对一个基因位,且其变异幅度有限,因此遗传聚类算法开拓能力有限。而遗传聚类算法通过定义限制搜索次数,及时放弃低劣食物源,并通过列维飞行实现了全局漫游能力,因而能实现在最优聚类中心解空间的全局搜索能力,具备了强大的开拓能力。3、雇用蜂与观察蜂相互配合机制,实现遥感影像聚类最优食物源的快速搜索即强化了开发能力;4、使用了列维飞行的分布模型,列维飞行使得搜索新的食物源时,搜索位置为在小范围内流通,并且有小概率会流动到较远位置,使得对遥感影像的聚类可以做到全局搜索,其突出优点在于,小概率流动到较为位置的特性可以提高搜索蜜源的效率,即原有的搜索方式符合均值分布、正态分布,而导致搜索范围较小,如果相邻区域不存在符合条件的蜜源,则会大大降低搜索效率,而列维飞行的步长不符合高斯分布律,可以提高搜索效率,并且使用列维飞行模型克服了本领域内技术人员的技术偏见,本领域的技术人员仅仅认识到了可以通过随机算法来进行全局搜索、全局漫游,但是使用的算法都是符合高斯分布律的随机算法,即使做了提高效率也未从非高斯分布算法的角度考虑。因此本发明的基于蜂群智能的遥感影像聚类方法是非显而易见的,具有突出的技术效果。

附图说明

图1为本发明的基于蜂群智能的遥感影像聚类方法的流程图;

图2为本发明的基于蜂群智能的遥感影像聚类方法中蜂群智能挖掘的具体步骤流程图。

具体实施方式

具体实施方式一:本实施方式的一种基于蜂群智能的遥感影像聚类方法,其特征在于,包括如下步骤:

步骤1)确定待分类遥感影像分类数目,并将遥感影像的每一个像元随机分配给一种分类;每个像元具有预定数量的特征;

步骤2)根据像元的特征对像元进行蜂群智能挖掘,具体为:

步骤2.1)初始化控制参数;控制参数包括蜜蜂数量、最大循环次数、限制搜索次数;蜜蜂包括雇佣蜂、观察蜂;蜜蜂数量为p,雇佣蜂数量为p/2,观察蜂数量为p/2;

步骤2.2)建立食物源;每个食物源对应于一个雇佣蜂;食物源由每一个类别的聚类中心连接形成,长度为n×m,其中n为遥感影像中每一个像元的波段数目,m为待分类数目;食物源的前n位表示第一个类别的聚类中心,以此类推;

步骤2.3)计算食物源的适宜度;适宜度函数f的表达式为f=1/(M+1),M为聚类指标;聚类指标M直接反映了一个聚类中心的质量,因而在本发明中,我们基于聚类指标M评估食物源的收益,考虑到聚类指标越大,则食物源的质量越差,为了保障丰富的食物源具有高收益,故做了上述的适宜度函数。

步骤2.4)搜索新食物源;即在根据步骤2.3)计算完现有食物源的适宜度后,在已有食物源周围随机搜索新的食物源位置;

步骤2.5)观察蜂根据随机概率P(Xi)对一个食物源进行跟随,随机概率P(Xi)的表达式为:

其中,Xi为第i个蜜蜂食物源位置,f(Xi)为食物源Xi的花粉丰度,Ne为雇佣蜂数量;这表示当开始搜索时,观察蜂随机变为雇佣蜂搜索食物源,随机变为雇佣蜂的概率即为P(Xi),P(Xi)一定程度上反映了食物源丰度,即食物源丰度越高,雇佣蜂就有越高的几率跟随这个食物源。如此一来可以把更多的注意力放在丰富的食物源上。

步骤2.6)若一个食物源在经过限制搜索次数后始终不能提高f(Xi)的值,则雇佣蜂转变为侦察蜂,使用列维飞行在解空间内全局搜索新的食物源;若能够提高f(Xi)的值,则跳转到步骤2.4);

步骤2.7)当所有蜜蜂完成搜索,将当前的适宜度最高的最食物源与上一个循环的最优食物源进行比较,选取数值更高的作为当前的全局最优食物源;当循环达到最大循环次数时,停止循环并输出最优聚类中心,从而完成遥感影像聚类的任务。

其中列维飞行是从分布角度上讲,大部分情况在小范围内流动,也有一小部分情况会流动到较远位置的一种运动模式。

使用列维飞行的好处是,列维飞行使得搜索新的食物源时,搜索位置为在小范围内流通,并且有小概率会流动到较远位置,使得对遥感影像的聚类可以做到全局搜索,其突出优点在于,小概率流动到较为位置的特性可以提高搜索蜜源的效率,即原有的搜索方式符合均值分布、正态分布,而导致搜索范围较小,如果相邻区域不存在符合条件的蜜源,则会大大降低搜索效率,而列维飞行的步长不符合高斯分布律,可以提高搜索效率。

由于传统的蜂群智能算法不能做到全局搜索,因此相比于传统算法,本实施方式的好处是通过列维飞行在小范围内随机流动,可以在小范围随机位置搜索新蜜源;相比于其他做了全局搜索的蜂群算法,本实施方式的好处在于,列维步长提供了一种小概率产生长步长的方法,使得蜜源的搜索效率更高。

需要说明的是,步骤2.5)中的f(Xi)与步骤2.3)中的适宜度函数f是相同的函数,适宜度函数f是关于M的函数,同时从M的表达式中可以看出,通过两次累加符号累加出来的值其实就是第i个蜜蜂食物源的位置。因此适宜度函数f虽然从表示形式上没有直接体现出其为关于Xi的函数,但是实际上适宜度函数f的自变量就是Xi

具体实施方式二:本实施方式与具体实施方式一不同的是:聚类指标通过如下公式计算:

其中,xj为i(i=1,2,…,k)类别中的任意一个像元,zi为类别i的聚类中心,Ci为第i类聚类,j为类别i的像元个数,k∈{1,2,…,p/2}且k≠i。

其它步骤及参数与具体实施方式一相同。

具体实施方式三:本实施方式与具体实施方式一至二之一不同的是:

步骤2.2)中,食物源的位置由如下公式确定:

其中,表示第i个雇佣蜂在第j个特征的位置,和分别表示第j个特征的最小值和最大值,rand(0,1)表示在0-1之间变化的随机数。第j个特征是指遥感影像多维特征(即波段)中的第j个特征

其它步骤及参数与具体实施方式一至三之一相同。

具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:

步骤2.2)中新的食物源表达式为:

其中,是第i个雇佣蜂在第j个特征(j=1,2,…,n)的新食物源位置;和分别表示第i、k个蜜蜂在第j个特征的原食物源位置,其中i,k∈{1,2,…,p/2}且k≠i;是一个在-1和1之间变化的随机数。

本实施方式表示在完成现有的食物源收益评估后,雇佣蜂开始在已有食物源周围随机搜索新食物源位置,搜索机制如上式所示,如果新的食物源收益度高于原食物源,则原食物源被新食物源替换。

其它步骤及参数与具体实施方式一至四之一相同。

具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:

步骤2.6)中新的位置通过如下公式计算:

其中,表示被放弃的食物源i的新位置,Xi为原位置,s为列维飞行所产生步长。

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:

列维飞行所产生步长s通过如下公式进行计算:

在这里,μ,ν和λ分别从正态分布中计算得到,即:

其中,

其中,Γ为gamma函数,β为在1到2之间变化的常量。

其它步骤及参数与具体实施方式一至六之一相同。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1