基于多视角学习的极化SAR数据分类器实时更新方法与流程

文档序号:15145430发布日期:2018-08-10 20:23阅读:268来源:国知局
本发明属于机器学习算法和图像处理
技术领域
,具体涉及一种基于多视角学习的极化sar数据分类器实时更新方法。
背景技术
:极化sar是一种先进的微波遥感工具,在不同的收发极化组合下,对地物目标的散射特性进行测量,能够获取目标的介电常数、物理特性、几何形状和取向等信息。相较于单通道sar,极化sar能够获取更丰富的地物信息和分类特征,是微波成像发展的主要方向之一。因此,极化sar在地球资源普查、环境灾害监测、城市规划、军事侦察等领域都有着广阔的应用前景。随着极化sar系统的发展和应用,对海量极化sar数据的在线分类技术的研究具有重要的理论价值和应用意义。在过去的二十年里,极化sar分类问题得到了广泛的关注,并涌现了包括有监督、半监督和无监督的一系列分类方法,如西安电子科技大学申请的专利“基于稀疏编码和小波自编码器的极化sar图像分类方法”(专利申请号:201610407916.8,公开号:cn106096652a)中国人民解放军国防科学技术大学申请的专利“一种结合旋转域极化零角特征的极化sar地物分类方法”(专利申请号:201710088598.8,公开号:cn106909939a)。然而,现有的这些极化sar分类方法都是离线学习算法,它们要求数据在训练开始时都是可用的,从训练数据中学习模型,只有当训练完成时,才能做分类预测。另外,当新来样本被错分时,训练的分类器不再进行更新,或者需要在整个新的数据集上重新进行训练。因此,这类方法环境自适应性不强,重训练也会比较耗时。除此之外,现有的大多数方法都是单视角分类算法,即仅使用了一种类型的特征或将多种特征简单的串联起来组合成一个向量特征,而忽视了各视角特征数据的不同属性和之间的关系,影响了分类精度。针对上述问题,本发明提出一种在线多视角学习方法,并用于极化sar数据的在线分类任务中。不同于离线学习,在线学习能高效地更新分类器并且不会重新使用之前所有数据。对于机载或星载的极化sar系统,数据往往是大规模的,并按照一个连续的序列不断被获取。通过引入在线学习,系统能从数据流中增量式地学习一个模型,其对新增样本能高效更新分类器,对动态环境具有较强自适应性,对大规模数据具有很好的扩展性。因此,在线分类技术的研究对极化sar的实际应用非常重要。近年来,有很多种在线学习方法被提出,如感知机(perceptron)算法,在线梯度下降(onlinegradientdescent,ogd)算法和被动攻击(passive-aggressive,pa)算法等。其中,pa算法最小化新分类器和先前分类器间的距离,并同时最小化新分类器在当前样本上的损失,(参见参考文献1:k.crammer,o.dekel,j.keshet,s.shalev-shwartz,andy.singer,“onlinepassive-aggressivealgorithms,”j.mach.learn.res.,vol.7,no.mar,pp.551–585,2006.),由于其较好的效果和较低的计算复杂度而被广泛应用。然而,该方法只适用于单视角分类问题。nguyen等人提出两视角pa算法(参见参考文献2:t.nguyen,k.chang,ands.hui,“two-viewonlinelearning,”inproc.pacific-asiaconf.knowl.discov.datamin.springer,2012,pp.74–85.)和自适应两视角pa算法,记为adapa(参见参考文献3:t.nguyen,k.chang,ands.hui,“adaptivetwo-viewonlinelearningformathtopicclassification,”inproc.jointeuropeanconf.mach.learn.knowl.discov.databases.springer,2012,pp.794–809.),它们分别存在权重组合固定以致无法权衡视角间重要性,一致性约束项会加剧视角间的不一致性以及没有参数权衡不同视角的拟合项等问题,从而其效果不够理想。针对这些问题,我们提出了在线两视角pa算法(参见参考文献4:x.nie,s.ding,h.qiao,b.zhang,andx.y.huang,“polsardataonlineclassificationbasedonmulti-viewlearning,”inproc.int.conf.imageprocess.(icip).ieee,2017.),算法效果有了显著提升。然而,上述这三种方法只能用于两视角和二分类问题,对于任意数量的多视角和多分类问题并不适用。wu等人提出一种在线多模态距离度量学习算法用于图像提取(参见参考文献5:p.wu,s.c.hoi,p.zhao,c.miao,andz.-y.liu,“onlinemulti-modaldistancemetriclearningwithapplicationtoimageretrieval,”ieeetrans.knowl.dataeng.,vol.28,no.2,pp.454–467,2016.),其可用于任意数量的多视角问题中,然而,其每个视角的分类器是单独更新的,没有利用视角间的一致性和互补性关系,从而影响了分类精度。针对上述问题,本发明提出的在线分类方法在建模时考虑了多视角之前的关系,适用于任意数量视角的二分类和多分类问题。技术实现要素:为了解决现有技术中的上述问题,即为了解决分类器不能实时更新或只能单独更新而忽略视角间一致性、互补性以致影响分类精度提升的问题,本发明提出了一种基于多视角学习的极化sar数据分类器实时更新方法,包括以下步骤:步骤s1,基于t时刻的极化sar图像,提取样本极化特征颜色特征纹理特征三视角数据;步骤s2,基于通过在线多视角分类模型,估计样本的地物类别标签步骤s3,根据真实地物类别标签yt计算损失lt,通过与设定损失阈值对比判断样本是否被正确表示;如果样本被错误表示,则通过拉格朗日乘子法求解所述在线多视角分类模型闭式解的方法,对所述在线多视角分类模型中的分类器进行更新;步骤s4,获取t+1时刻的极化sar图像后,重复步骤s1至步骤s3,直至全部极化sar图像处理完毕。进一步地,所述在线多视角分类模型为二分类任务的在线多视角分类模型;所述二分类任务的在线多视角分类模型为:估计的样本类别标签为预测函数为为权重参数且满足损失函数为lt=max{0,1-ytft},yt为真实的样本标签;其中,为t时刻分类器的权重向量,m为提取样本的视角数量,λi为不同视角距离变差的均衡参数,di为视角间的耦合参数,c为一个正的惩罚参数,ξ为松弛变量,为待求的t+1时刻分类器的权重向量,ft+1为t+1时刻的预测函数,为t时刻视角为i的样本。进一步地,所述“通过拉格朗日乘子法求解所述在线多视角分类模型闭式解的方法,对所述在线多视角分类模型中的分类器进行更新”,其方法为:其中,进一步地,所述在线多视角分类模型的初始化分类器权重为一个随机的ni维的列向量,即i为提取的第i个视角样本。进一步地,所述在线多视角分类模型为多分类任务的在线多视角分类模型;所述多分类任务的在线多视角分类模型为:估计的样本类别标签为预测函数为为权重参数且满足损失函数为yt为真实的样本标签,其中,为t时刻分类器的权重矩阵,m为提取样本的视角数量,λi为不同视角距离变差的均衡参数,di为视角间的耦合参数,c为一个正的惩罚参数,ξ为松弛变量,是t+1时刻分类器的权重矩阵,ft+1为t+1时刻的预测向量,为第i视角在t时刻的样本;f为矩阵的forbenius范数。进一步地,所述“通过拉格朗日乘子法求解所述在线多视角分类模型闭式解的方法,对所述在线多视角分类模型中的分类器进行更新”,其方法为:其中,进一步地,所述在线多视角分类模型的初始化分类器权重初始化为一个随机的k×ni的矩阵,i为提取的第i个视角样本。进一步地,通过交叉验证选择参数,选择所述在线多视角分类模型估计得类别标签错误率最小的一组;通过交叉验证选择的参数包括:不同视角距离变差的均衡参数λi,视角间的耦合参数di,惩罚参数c,权重参数r1,r2。进一步地,极化特征包括直接从获取的极化sar数据及其变换中提取的原始特征和基于极化分解的特征;颜色特征包括伪彩色图像元素、主导颜色权重及hsv图像和其直方图;纹理特征包括局部二值模式直方图,灰度共生矩阵,gabor和小波变换系数。进一步地,输入参数的取值范围为:不同视角距离变差的均衡参数λi包括λ1、λ2、λ3;λ1=1,λ2,λ3∈{1,1.5}:视角间的耦合参数di包括d1、d2、d3;d1=d2=d3{0.001,0.01,0.1};惩罚参数c∈{0.05,0.1,0.15};权重参数r1,r2∈{0.3,0.4},且满足本发明与现有技术相比较,具有以下优点:(1)实现极化sar数据在线分类本发明提出的基于pa的在线学习方法更新步都有解析表达,因此能高效地更新分类器,克服了现有的极化sar离线分类方法不对分类器做更新或需要使用全部数据重新训练分类器的问题,使得本发明能实现实时的分类,并对动态环境具有很强的自适应性以及对大规模数据有很强的扩展性。(2)在线分类错误率更低本发明从极化sar数据中提取了极化、颜色和纹理特征,并将它们作为不同的视角,本发明充分利用了它们之间的一致性和互补性关系进行建模,克服了现有技术只使用某单一特征导致信息未充分开发或使用某几个特征串联成一个高维向量导致计算复杂度太高的不足,使得本发明利用了更完备的信息,从而在线分类的错误率会更低。附图说明图1是本发明一种实施例的图2(a)是由esar获取的德国奥博珀法芬霍芬地区的单视极化sar数据的pauli分解伪彩色图像;图2(b)是由esar获取的德国奥博珀法芬霍芬地区的与图2(a)对应的真实地物类别标记图;图3是在线二分类完成后整体分类图的视觉对比结果;图4是在线多分类完成后整体分类图的视觉对比结果。具体实施方式下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。本发明的一种基于多视角学习的极化sar数据分类器实时更新方法,包括以下步骤:步骤s1,基于t时刻的极化sar图像,提取样本极化特征颜色特征纹理特征三视角数据;步骤s2,基于通过在线多视角分类模型,估计样本的地物类别标签步骤s3,根据真实地物类别标签yt计算损失lt,通过与设定损失阈值对比判断样本是否被正确表示;如果样本被错误表示,则通过拉格朗日乘子法求解所述在线多视角分类模型闭式解的方法,对所述在线多视角分类模型中的分类器进行更新;步骤s4,获取t+1时刻的极化sar图像后,重复步骤s1至步骤s3,直至全部极化sar图像处理完毕。下面按照具体实施过程中从输入参数选择、参数初化到分类器更的流程对本发明技术方案进行详细说明,如图1所示,包括以下步骤:步骤1:通过交叉验证选择参数,我们考虑的极化、颜色和纹理的特征,因此是三视角,即m=3,输入参数的具体范围如下:惩罚参数c∈{0.05,0.1,0.15},平衡参数λ1=1,λ2,λ3∈{1,1.5},耦合参数d1=d2=d3∈{0.001,0.01,0.1},权重参数r1,r2∈{0.3,0.4},且满足这里给出了参数的选择范围,通过交叉验证的方式可以选出最优的参数取值,即错误率最小的一组参数。步骤2:初始化分类器的权重,对二分类问题,即为一个随机的ni维的列向量;对多分类问题,即初始化为一个随机的k×ni的矩阵。步骤3:获取极化sar协方差数据,提取极化、颜色和纹理特征:极化特征包括直接从获取的极化sar数据及其变换中提取的原始特征和基于极化分解的特征;颜色特征包括伪彩色图像元素,主导颜色权重及hsv图像和其直方图;纹理特征包括局部二值模式直方图,灰度共生矩阵,gabor和小波变换系数等。本发明中具体使用的极化、颜色和纹理特征见表1,可以看出这三类特征的维数分别是n1=45,n2=34和n3=86,本发明将它们作为三个视角数据用于后续分类。表1:用于在线分类的极化、颜色和纹理特征步骤4:建立在线多视角分类模型,并根据分类函数预测样本的标签。具体来讲,针对二分类任务的在线多视角分类模型如下:s.t.l(w;(xt,yt))≤ξ;ξ≥0.其表示对二分类损失函数的松弛约束,其中松弛变量ξ必须是非负的。其中,为t时刻分类器的权重向量,m为提取样本的视角数量,λi是不同视角距离变差的均衡参数,di是视角间的耦合参数,c是一个正的惩罚参数,ξ为松弛变量,为待求的t+1时刻分类器的权重向量,ft+1为t+1时刻的预测函数,为t时刻视角为i的样本。损失函数定义为hinge-loss损失lt=max{0,1-ytft}。预测函数定义为其中ri∈(0,1)为权重参数且满足则估计的样本的类别标签针对多分类任务的在线多视角分类模型如下:s.t.lmc(w;(xt,yt))≤ξ;ξ≥0。表示对多类分类损失函数的松弛约束,其中松弛变量ξ必须大于或等于0。其中,λi,di,c是正参数,为t时刻分类器的权重矩阵,是t+1时刻分类器的权重矩阵,ft+1为t+1时刻的预测向量,f为矩阵的forbenius范数。预测函数可知lmc表示多类分类的损失函数,其定义为yt为真实的样本标签,多数情况下,估计的样本的类别标签步骤5:根据样本对应的真实标签,计算损失lt,如果lt=0,表示样本被正确分类,不对分类器更新;如果lt>0,表示样本被错误分类,需要对当前分类器做更新。针对二分类问题,损失lt=max{0,1-ytft},如果lt>0,对上一步骤中二分类优化问题,通过拉格朗日乘子法求解,可得到如下的闭式解,以此对分类器进行更新:其中,针对多分类问题,损失如果lt>0,对上一步骤中多分类优化问题,通过拉格朗日乘子法求解,可得到如下的闭式解,以此对分类器进行更新:其中,步骤6:若还有新样本输入,返回到步骤1;如果所有样本都处理完毕,则计算整个在线学习过程的分类错误率,针对每个子类的错误率是子类中被错分的样本数比子类总样本数,总错误率是被错分的样本数比总样本数;画出最终的分类图,极化sar图像中具有相同地物类别的像素,用同一种颜色表示,进而得到分类图。下面分别结合二分类任务和多分类任务情况下的细分步骤进行进一步说明。本发明一种实施例中,针对二分类任务的在线多视角学习算法包括以下步骤:(1)通过交叉验证选择参数:惩罚参数c>0,平衡参数λi>0,耦合参数di>0和权重参数ri∈(0,1)且(2)初始化分类器的权重向量其中,m是视角的个数,ni是第i个视角的维数,可知(3)在t时刻,接收极化sar数据,提取极化颜色和纹理特征分别作为不同视角,因此,接收的样本(4)计算预测函数(5)估计样本的类别标签(6)接收正确的标签yt∈{+1,-1};(7)计算损失lt=max{0,1-ytft};(8)如果lt=0,表示样本被正确分类,不对分类器更新,直接进入下一轮迭代;如果lt>0,就对当前分类器做如下更新:(9)根据下面公式计算辅助变量:(10)更新分类器:(11)若有新样本到来,t=t+1,返回执行第(3)步,否则算法终止。本发明一种实施例中针对多分类任务的在线多视角学习算法包括以下步骤:(1)通过交叉验证选择参数:c>0,λi>0,di>0和ri∈(0,1)且其中m是视角的个数;(2)初始化分类器的权重向量其中k是类别数,ni是第i个视角的维数,可知(3)在t时刻,接收极化sar数据,提取极化颜色和纹理特征分别作为不同视角,因此,接收的样本(4)计算预测函数可知(5)估计样本的类别标签(6)接收正确的标签yt∈y=[1,2,...,k};(7)计算(8)计算损失(9)如果lt=0,表示样本被正确分类,不对分类器更新,直接进入下一轮迭代,否则如果lt>0,就对当前分类器做如下更新:(10)根据下面公式计算辅助变量:(11)更新分类器:(12)若有新样本到来,t=t+1,返回执行第(3)步,否则算法终止。下面结合图2-4对本发明的效果做进一步的说明:实验数据及条件:本发明使用真实的极化sar数据做测试实验,是由e-sar传感器获取的德国奥博珀法芬霍芬地区的单视l波段数据,可从欧洲空间局网站下载到。该数据的pauli分解伪彩色图像如图2(a)所示,其尺寸为1300*1200,图2(b)是其对应的真实地物分类图,其中的色块分别表示城区、林地、公路、农田、其它场景。仿真实验中,使用的软件:matlabr2015b,处理器:intel(r)core(tm)i7-6700hq,内存:20.0gb,操作系统:64位windows10。实验内容及结果分析:实验中分别考虑了二分类和多分类任务,它们分别对应城市场景提取和地物分类问题。为更好评估本发明提出的方法的效果,与pa分别在极化、颜色、纹理和它们的组合特征上的结果对比,分别记为pa_pol,pa_col,pa_tex,pa_cat。另外,也与参考文献3中提出的adapa方法和参考文献5中提出的omdml方法的结果进行了比较,注意adapa方法只适用于二分类问题,所以在多分类任务中未与其比较。为了更好的对比这些方法,它们包含的参数通过交叉验证来选取,参数的选取范围设置如下:pa方法的攻击参数c∈[0.05,0.15];adapa方法的耦合参数d∈{0.001,0.01,0.1},权重参数r∈(0,1),惩罚参数c∈[0.01,0.15];omdml方法的惩罚参数c∈[0.01,0.15],折扣参数β∈[0.8,1];本发明的方法,λ1=1,λ2,λ3∈{1,1.5},d1=d2=d3∈{0.001,0.01,0.1},r1,r2∈{0.3,0.4},c∈{0.05,0.1,0.15}。图3展示了在线二分类完成后整体分类图的视觉对比结果,图3(a)是城区场景提取的真实类别标记图,非城区区域被标记为白色;图3(b)-(h)分别是pa_pol,pa_col,pa_tex,pa_cat,adapa,omdml和本发明的分类结果图。表2给出了二分类情况下这些方法的分类错误率对比结果。从图3中可以看出,pa_cat的分类结果要明显好于pa_pol,pa_col和pa_tex的结果,因为pa_cat中使用了更多的特征信息,这点也可以从表2中得到证实。另外,根据表2可知adapa和omdml的结果中城市区域被错分为非城区的比率分别是43.95%和51.08%,要显著高于pa_cat对城区的错分率29.72%,该结论也可以从图3(e)-(g)中看出,在(f)和(g)中有很多地方被错分成白色区域。从表2和图3中可得出结论,本发明提出的方法得到了最低的正样本(即城区)分类错误率22.89%和最低的总体分类错误率7.05%。表2:二分类情况下的分类错误率对比结果方法pa_polpa_colpa_texpa_catadapaomdml本方法城区0.41690.54490.44420.29720.43950.51080.2289非城区0.07770.10390.08470.05710.03460.01990.0396总错误率0.13330.17580.14350.09650.10070.10120.0705图4是在线多分类完成后整体分类图的视觉对比结果,其对应的真实类别标签图见图2(b)。图4(a)-(f)分别是pa_pol,pa_col,pa_tex,pa_cat,omdml和本发明的分类结果图。表3给出了该多分类情况下这些方法的分类错误率对比结果。可以看出相比于颜色和纹理特征,极化特征提供了更好的判别信息,因为pa_pol的总体错误率要比pa_col和pa_tex的低10%,另外,pa_col和pa_tex在公路和农田区域有超过一半的像素被错分了。而pa_cat的结果要显著优于pa_pol,pa_col和pa_tex,并且pa_cat改善了边界区域的判别性,如图4(d)所示。omdml的总体分类精度比pa_cat提升了6%,而且根据图4(e),不同区域的边界变得更加清晰。根据表3中的数值结果和图4中的视觉结果,可以看出本发明提出的方法使得大部分的样本被正确分类,与其它方法相比,达到了最低的总体错误率。表3:多分类情况下的分类错误率对比本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或
技术领域
内所公知的任意其它形式的存储介质中。术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1