基于带权重的解卷积深度网络学习的场景识别方法
【专利摘要】一种基于带权重的解卷积深度网络学习的场景识别方法,其包括以下步骤:1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络模型学习,得到每幅图像不同尺度上的特征图;2)利用空间金字塔模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的特征向量表达;3)将原始输入图像分为训练集和测试集,然后将这些图像的特征向量表达分别输入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。本发明提供的基于带权重的解卷积深度网络学习的场景识别方法,通过建立不同尺度上的场景的表达,以使场景表达更为精细和充分,从而提高场景分类的精度。
【专利说明】
基于带权重的解卷积深度网络学习的场景识别方法
技术领域
[0001] 本发明属于信息处理技术领域,涉及一种遥感图像的场景识别与理解方法,尤其 涉及一种基于带权重的解卷积深度网络学习的场景识别方法。
【背景技术】
[0002] 随着我国航天技术的发展,越来越多的高分卫星被发射到太空中W获取地球表面 数据,达到灾害监测、农业估产W及军事侦查等目的。通常从卫星传送到地面上的数据画幅 巨大,为了充分利用送些大量的大幅高分遥感数据,场景分类是非常重要的预处理手段,它 对后续进一步的目标识别、变化检测、图像检索等任务有着重要帮助。
[0003] 目前,对于遥感影像进行场景分类的方法主要分为四类:
[0004] -是自底向上的分层场景建模的方法,该方法首先从图像像素开始分类,对 每个像素赋予一个标签,然后通过迭代区域分割的方法得到图像中不同区域的类别标 记,最后通过分析各区域之间的空间关系,得到整幅图像的场景类别。具体方法见参考 文献"Learning Bayesian Classifiers for Scene Classification With a Visual Grammar, IEEE Transactions on Remote Sensing, 43 (3) : 581-589, 2005',。
[0005] 二是基于词包模型度ag of Words, BOW)的方法,在场景分类中,该方法首先将 训练图像打块,提取送些图像块中特征向量;然后对送些特征进行聚类并将聚类中必作为 字典,进而计算每幅图像的特征与字典的距离,并统计落入每个字典中的特征点的个数, 送样得到每幅图像的特征直方图;最后利用支持向量机(Suppcxrt Vector Machine, SVM) 分类器进行分类得到最终的场景分类结果。具体方法见参考文献"Video Google:a text retriev曰1 曰ppro曰ch to object notching in videos, in Proc.9th IEEE Int.Conf. Computer Vision, 2:1470-1477, 2003"。
[0006] H是基于主题模型的方法,该方法最初是用于文本分析领域,在场景分类中,将 图像特征作为文本分析中的单词,每幅图像即为文档,每幅图像的场景类别即为文档的主 题,因此通过主题模型分析,可W得到每幅图像的场景类别。具体方法见参考文献"Latent Dirichlet Allocation for Spatial Analysis of Satellite Images, IEEE Transactions on Geoscience and Remote Sensing, 51巧):2770-2786, 2013"。
[0007] 四是稀疏表达的方法,该方法首先利用稀疏字典学习的方法得到一组基,然后 将每幅图像特征通过稀疏编码的方法投影到送一组基上得到图像的稀疏表达,最后利用 SVM分类器得到场景分类的结果,具体方法见参考文献"Saliency-Guided Unsupervised Feature Learning for Scene Classification, IEEE Transaction on Geoscience and Remote Sensing, 53(4):2175-2184, 2014"。
[0008] 上述四种方法虽然取得了较好的结果,但是它们均忽略了遥感图像的地物复杂、 不同场景类别相似性很大的特点,从而导致分类精度不高。例如,机场场景中不仅有飞机, 还有跑道和候机楼等,其中跑道和道路场景难W区分,而候机楼容易与居民区混淆;再如城 市和密集活动房,它们属于不同的场景,但是即便是从人类视觉上看,它们也有很大的相似 性,因而阻碍了分类精度的进一步提升;此外,送些现有方法中大多数都采用人为设计好的 特征,如;尺度不变特征旋转描述子、颜色直方图等,相比于从数据本身学习到的特征来讲, 它们的普适性更差。
【发明内容】
[0009] 为了解决【背景技术】中存在的上述技术问题,本发明提供了一种基于带权重的解卷 积深度网络学习的场景识别方法,通过建立不同尺度上的场景的表达,W使场景表达更为 精细和充分,从而提高场景分类的精度。
[0010] 本发明的技术解决方案是:
[0011] 本发明提供了一种基于带权重的解卷积深度网络学习的场景识别方法,其特殊之 处在于:包括W下步骤:
[0012] 1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度 网络模型学习,得到每幅图像不同尺度上的特征图;
[0013] 2)利用空间金字培模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图 像的特征向量表达;
[0014] 3)将原始输入图像分为训练集和测试集,然后将送些图像的特征向量表达分别输 入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。
[0015] 上述基于带权重的解卷积深度网络学习的场景识别方法在步骤3)之后还包括:
[0016] 4)根据步骤3)所得不同场景的识别结果,分别计算分类精度与混淆矩阵。
[0017] 上述步骤1)中构建的带权重的解卷积深度网络模型为:
[001 引
(1)
[0019] 其中,C(l)是带权重的解卷积深度网络模型的目标函数,1是带权重的解卷积深 度网络结构的层数,λ 1是正则项参数,y是原始输入图像,氣是由第1层的特征图向下重 构得到的图像,Zk,i是第1层第k个特征图,Κι是第1层的特征图总数,II 1是对特征图的稀 疏约束;
[0020] 对于带权重的解卷积深度网络结构中的第一层,
[002引其中,Zk,康示第1层第k个特征图,fk,康示第1层第k个滤波器,Wk,康示第1 层第k个滤波器的权重,表示由第1层的特征图向下重构得到的图像,*表示卷积;公式 做是将卷积操作和求和操作综合为矩阵的相乘操作,Wi是由Wk,i组成的向量,Fi是由fka 组成的滤波器组,Zi是由Z k,i组成的特征图矩阵;
[0024] 对于带权重的解卷积深度网络结构中的其他层,
[0025]
(4)
[0026] Ai= F 1W1U1F2W2U2. . . F1W1 (5)
[0027] 其中,Zi表示第1层的特征图,Fi表示第1层的滤波器组,Wi表示第1层滤波器组 的权重,Ui表示第1层去融合的过程。
[0028] 上述步骤1)中对原始输入图像利用带权重的解卷积深度网络模型学习的方法包 括W下步骤:
[0029] 1. 1)通过迭代收缩阔值化方法学习特征图Z :
[0030] 1. 1. 1)对公式(1)求Z的偏导,得到特征图Z的梯度:奶二-闲一y),库中 每是Ai的逆过程;
[OOW 1. 1.。利用梯度下降更新Zi;z 1= Z 1- λ 1目惭,其中目1是梯度下降步长;
[003引1. 1.如利用收敛操作,使Ζ冲值较小的元素变为0,即Ζ 1= max(|z ι|-β 1,0) sign(zi);
[0033] 1. 2)迭代学习滤波器组F :
[0034] 1.2. 1)对公式(1)求Fi的偏导,并令求偏导后的结果等于0,得:
[0035]
[003引其中,i表示第i幅图像,N为图像总数,隶示第i幅图像第1层的特征图向量 的转置,fti表示对第i幅图像第1-1层的特征图的融合过程,隶示对第i幅图像第 1层的特征图进行A的逆操作,表示第i幅图像的特征图从第1层向下重构得到的重构 图像,/表示第i幅原始输入图像;
[0037] 1.2.2)利用共辆梯度下降方法,结合公式(6) W及 袭Z = Az; = 巧求解,得到更新后的Fi;
[0038] 1. 3)迭代学习滤波器的权重W :
[0039] 1.3. 1)对公式(1)求Wi的偏导,并令求偏导后的结果等于0,得:
[0040]
[0041] 其中,i表示第i幅图像,N为图像总数,z/了表示第i幅图像第1层的特征图向量 的转置,巧Li:表示对第i幅图像第1-1层的特征图的融合过程,,4'王1表示对第i幅图像第 1层的特征图进行A的逆操作,;Ρ?表示第i幅图像的特征图从第1层向下重构得到的重构 图像,表W第i帖原始输入图像;
[0042] 1.3.2)利用共辆梯度下降方法,结合公式(7) W及 而=4间二A-1听巧求解,得到更新后的Wi;
[0043] 1.4)输入一幅原始图像yW及训练的层数1、迭代次数、正则项参数λ 1、特征图总 数Κι和梯度下降步长目1,初始化该层的特征图Ζ、滤波器组FW及滤波器组的权重W,然后 根据步骤1.1)学习特征图Ζ;
[0044] 所有图像的特征图Ζ学完后,根据步骤1. 2)和步骤1. 3)分别学习滤波器组F和 滤波器组的权重W ;
[0045] 1. 5)所有层迭代学习完成后,输出每幅图像的特征图Ζ、滤波器组F W及滤波器组 的权重w。
[0046] 上述步骤2)的具体实现方式是:
[0047] 2. 1)对图像的特征图Z用3X3的格网进行打块,设Z的大小为mXn,则提取到 (m/3+l) X (n/3+l) = Q个块,将每个块的特征拉成特征向量,得到数据矩阵X E R?x9k,其中 K是当前层特征图的个数,R是实数集;
[0048] 2. 2)对数据矩阵X进行k-means聚类,共聚50类,并将聚类中必作为字典,得到字 典矩阵D e Rwxbk;
[0049] 2. 3)计算数据矩阵X与字典矩阵D之间的距离,得到距离矩阵dis e R?x5°;
[0050] 2. 4)将每一个特征向量分配给距离其最近的聚类中必,得到图像的字典索引向量 index e R?,然后将字典索引向量变形为矩阵,得到图像的单词分布图Μ ;
[0051] 2. 5)对步骤2. 4)所得的单词分布图Μ,分别在图像的1Χ1、2Χ2、4Χ4的尺度上 统计不同单词出现的频率,得到统计直方图,然后将统计直方图连接成向量作为图像的特 征向量表达;
[0052] 2. 6)对于每一层的特征图,均按照步骤2. 1)至步骤2. 5)的顺序进行处理,得到最 终的图像的特征向量表达。
[0053] 上述步骤4)中分类精度的计算方式为;将步骤3)所得不同场景的识别结果与测 试集的真实结果对比,统计分类正确的个数Β,则:
[0054] 分类精度=Β/Β总,X 100% ;其中,Β,留为测试集的总样本个数;
[0055] 所述步骤4)中混淆矩阵的计算方式为:W待分类图像的所有场景类别分别建立 横、纵坐标轴,将每一类分类正确的百分比一一对应作为混淆矩阵的对角线元素,将各当前 行的类别错分到当前列的类别的百分比作为混淆矩阵的其他元素。
[005引本发明的优点是:
[0057] 本发明提供了一种基于带权重的解卷积深度网络学习的场景识别方法,该场景识 别方法充分考虑了遥感图像地物复杂、不同类别场景之间相似性很大的情况,利用解卷积 深度网络学习到了一系列包含遥感图像场景的细节信息的特征图,然后利用空间金字培模 型(Spatial Pyramid Matching, SPM)对送些特征图进行特征抽样,因此可W在不同尺度上 对图像场景进行描述,使得对场景的表达更加细化,同时无监督地学习图像特征,使得学习 到的特征更具有泛化性,从而提高了场景分类的精度。
【附图说明】
[0058] 图1是本发明提供的基于带权重的解卷积深度网络学习的场景识别方法的流程 图;
[0059] 图2是本发明中带权重的解卷积深度网络结构第一层的框架示意图;
[0060] 图3是本发明中带权重的解卷积深度网络多层结构的总体示意图;
[0061] 图4是利用本发明在Sy化ey数据库上实验所得的混淆矩阵结果。
【具体实施方式】
[0062] 参见图1,本发明提供了一种基于带权重的解卷积深度网络学习的场景识别方法, 其包括W下步骤:
[0063] 1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度 网络模型学习,得到每幅图像不同尺度上的特征图;
[0064] 1. 1)构建带权重的解卷积深度网络模型:
[00 财
(1)
[0066] 其中,C(l)是带权重的解卷积深度网络模型的目标函数,1是带权重的解卷积深 度网络结构的层数,λ 1是正则项参数,y是原始输入图像,兴是由第1层的特征图向下重 构得到的图像,Zk,i是第1层第k个特征图,Κι是第1层的特征图总数,II 1是对特征图的稀 疏约束;
[0067] 如图2所示,对于带权重的解卷积深度网络结构中的第一层,
[0070] 其中,Zk,康示第1层第k个特征图,fk,康示第1层第k个滤波器,Wk,康示第1 层第k个滤波器的权重,受1表示由第1层的特征图向下重构得到的图像,*表示卷积;公式 做是将卷积操作和求和操作综合为矩阵的相乘操作,Wi是由Wk,i组成的向量,Fi是由f k,l 组成的滤波器组,Zi是由z k,i组成的特征图矩阵;
[0071] 如图3所示,对于带权重的解卷积深度网络结构中的其他层,在由第1层的特征图 向下重构时,首先特征图zi和滤波器组F 1进行卷积后乘W当前层的权重W 1,然后进行一个 去融合的过程,之后再与下一层的滤波器组Fi iW及滤波器组的权重W 1 1进行相乘直至第 一层,得到重构后的薪,即:
[0072]
(4)
[0073] Ai= F 1W1U1F2W2U2. . . F1W1 (5)
[0074] 其中,Zi表示第1层的特征图,F 1表示第1层的滤波器组,W 1表示第1层滤波器组 的权重,Ui表示第1层去融合的过程。
[0075] 对原始输入图像利用带权重的解卷积深度网络模型学习的方法包括W下步骤:
[0076] 1. 2)通过迭代收缩阔值化方法学习特征图Z :
[0077] 1. 2. 1)对公式(1)求Z的偏导,得到特征图Z的梯度:撕=- y),库中 是的逆过程;
[007引1.2.2)利用梯度下降更新Zl;Zl=Zl-λlβlgl,其中βl是梯度下降步长;
[0079] 1.2.3)利用收敛操作,使Z冲值较小的元素变为0,即Z 1= max(|z il-目1,0) si即(Zi);其中si即是一个符号函数;当Zi〉0, si即(Zi) = 1 ;当Zi= 0, si即(Z 1) = 0 ;当 Zi<0, si邑η (Zi) = -1 ;
[0080] 1. 3)迭代学习滤波器组F :
[0081] 1.3.1)对公式(1)求Fi的偏导,并令求偏导后的结果等于0,得:
[0082]
[008引其中,i表示第i幅图像,N为图像总数,zf隶示第i幅图像第1层的特征图向量 的转置,巧表示对第i幅图像第1-1层的特征图的融合过程,/li亡1表示对第i幅图像第 1层的特征图进行A的逆操作,兴'表示第i幅图像的特征图从第1层向下重构得到的重构 图像,表W第i帖原始输入图像;
[0084] 1.3.2)利用共辆梯度下降方法,结合公式(6) W及 取=4沟=4_1化_1巧蛛树求解,得到更新后的Fl;
[0085] 1. 4)迭代学习滤波器的权重W :
[0086] 1.4. 1)对公式(1)求Wi的偏导,并令求偏导后的结果等于0,得:
[0087]
[008引其中,i表示第i幅图像,N为图像总数,2/了表示第i幅图像第1层的特征图向量 的转置,巧Li隶示对第i幅图像第1-1层的特征图的融合过程,^4^1表示对第i幅图像第 1层的特征图进行A的逆操作,夕/表示第i幅图像的特征图从第1层向下重构得到的重构 图像,/表示第i幅原始输入图像;
[0089] 1.4.扣利用共辆梯度下降方法,结合公式(7) W及 於二/4间二闲求解,得到更新后的Wi;
[0090] 1.5)输入一幅原始图像yW及训练的层数1、迭代次数、正则项参数λ 1、特征图总 数Κι和梯度下降步长目1,初始化该层的特征图Ζ、滤波器组FW及滤波器组的权重W,然后 根据步骤1.1)学习特征图Ζ;
[0091] 所有图像的特征图Ζ学完后,根据步骤1. 2)和步骤1. 3)分别学习滤波器组F和 滤波器组的权重W;
[0092] 1. 6)所有层迭代学习完成后,输出每幅图像的特征图Ζ、滤波器组F W及滤波器组 的权重W。
[0093] 2)利用空间金字培模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图 像的特征向量表达;
[0094] 2. 1)对图像的特征图Ζ用3X3的格网进行打块,设Ζ的大小为mXn,则提取到 (m/3+l) X (n/3+l) = Q个块,将每个块的特征拉成特征向量,得到数据矩阵X E R?x9k,其中 K是当前层特征图的个数,R是实数集;
[0095] 2. 2)对数据矩阵X进行k-means聚类,共聚50类,并将聚类中必作为字典,得到字 典矩阵D e rwxbk;
[0096] 2. 3)计算数据矩阵X与字典矩阵D之间的距离,得到距离矩阵dis e R?x5°;
[0097] 2. 4)将每一个特征向量分配给距离其最近的聚类中必,得到图像的字典索引向量 index e R?,然后将字典索引向量变形为矩阵,得到图像的单词分布图Μ ;
[0098] 2. 5)对步骤2. 4)所得的单词分布图Μ,分别在图像的1Χ1、2Χ2、4Χ4的尺度上 统计不同单词出现的频率,得到统计直方图,然后将统计直方图连接成向量作为图像的特 征向量表达;
[0099] 2. 6)对于每一层的特征图,均按照步骤2. 1)至步骤2. 5)的顺序进行处理,得到最 终的图像的特征向量表达。
[0100] 3)将原始输入图像分为训练集和测试集,然后将送些图像的特征向量表达分别输 入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。
[0101] 4)根据步骤3)所得不同场景的识别结果,分别计算分类精度与混淆矩阵,即;将 步骤3)所得不同场景的识别结果与测试集的真实结果对比,统计分类正确的个数B,则:分 类精度=B/B,g, X 100% ;其中,B,g,为测试集的总样本个数;
[0102] 步骤4)中混淆矩阵的计算方式为;W待分类图像的所有场景类别分别建立横、纵 坐标轴,将每一类分类正确的百分比一一对应作为混淆矩阵的对角线元素,将各当前行的 类别错分到当前列的类别的百分比作为混淆矩阵的其他元素。
[0103] 下面通过W下仿真实验说明本发明的有益效果:
[0104] 1)仿真条件
[010引 在中央处理器为 Intel (R)Core i3-2130 3. 4G监、内存 16G、WIND0WS8 操作 系统上,运用MTLAB软件进行仿真试验;仿真实验数据利用美国地质调查局(the U. S. Geological Surv巧,USG巧提供的UCM数据库W及武汉大学测绘遥感国家重点实验室 公布的Sy化ey数据库。
[0106] 2)仿真内容
[0107] 采用不同分类方法对遥感图像进行场景分类:
[0108] 2. 1)在UCM数据库上,分别采用本发明提供的基于带权重的解卷积深度网络学习 的场景识别方法,传统的词包模型方法、主题模型方法W及稀疏编码方法进行场景分类,得 到最终的分类精度,实验结果如表1所示。
[0109] 2. 2)在Sy化ey数据库上,分别采用本发明提供的基于带权重的解卷积深度网络 学习的场景识别方法,传统的词包模型方法、主题模型方法W及稀疏编码方法进行场景分 类,得到最终的分类精度,实验结果如表2所示。
[0110] 从表1、表2的分类精度结果W及图4的混淆矩阵结果可知,本发明与传统的词包 模型方法、主题模型方法W及稀疏编码方法相比,分类精度有了 10% W上的提升。送是因为 本发明利用了解卷积深度网络学习 W及空间金字培模型(SPM)进行特征抽样,在不同尺度 上对图像进行了更为准确和精细的描述,从而获得了更好的分类精度,进一步验证了本发 明的先进性。
[0111] 表1 UCM数据库上不同分类方法的场景分类精度
[0112]
[0113] 表2 Sy化ey数据库上不同分类方法的场景分类精度
[0114]
[0115] 本发明与现有方法相比,充分考虑了遥感图像在不同尺度上的表达,克服了遥感 图像地物复杂、类间相似性大的难点,同时也克服了传统方法中利用人为设定的特征的缺 陷,极大的提高了识别率,可用于地理国情勘察、军事侦察和环境监测等方面。
【主权项】
1. 一种基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:包括W下步 骤: 1) 构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络 模型学习,得到每幅图像不同尺度上的特征图; 2) 利用空间金字培模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的 特征向量表达; 3) 将原始输入图像分为训练集和测试集,然后将送些图像的特征向量表达分别输入到 支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。2. 根据权利要求1所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征 在于;所述基于带权重的解卷积深度网络学习的场景识别方法在步骤3)之后还包括: 4) 根据步骤3)所得不同场景的识别结果,分别计算分类精度与混淆矩阵。3. 根据权利要求2所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征 在于:所述步骤1)中构建的带权重的解卷积深度网络模型为:Cl) 其中,Cd)是带权重的解卷积深度网络模型的目标函数,1是带权重的解卷积深度网 络结构的层数,入1是正则项参数,y是原始输入图像,薪是由第1层的特征图向下重构得到 的图像,Zk,1是第1层第k个特征图,Ki是第1层的特征图总数,I Ii是对特征图的稀疏约 束; 对于带权重的解卷积深度网络结构中的第一层,(2) (3) 其中,Zk,i表示第1层第k个特征图,fk,i表示第1层第k个滤波器,Wk,i表示第1层第 k个滤波器的权重,萝1表示由第1层的特征图向下重构得到的图像,*表示卷积;公式(3) 是将卷积操作和求和操作综合为矩阵的相乘操作,Wi是由Wk,1组成的向量,F 1是由组成 的滤波器组,Zi是由Z 组成的特征图矩阵; 对于带权重的解卷积深度网络结构中的其他层,(斗) Ai= F 1W1U1F2W2U2. . . FiWi (5) 其中,Zi表示第1层的特征图,F 1表示第1层的滤波器组,W 1表示第1层滤波器组的权 重,Ui表示第1层去融合的过程。4. 根据权利要求3所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征 在于:所述步骤1)中对原始输入图像利用带权重的解卷积深度网络模型学习的方法包括 W下步骤: 1. 1)通过迭代收缩阔值化方法学习特征图Z : 1. 1. 1)对公式(1)求Z的偏导,得到特征图Z的梯度:是Al的逆过程; 1. 1.。利用梯度下降更新Zi = Z 1= Z 1- A 1目曲,其中目1是梯度下降步长; 1. 1.扣利用收敛操作,使Z冲值较小的元素变为0,即Zi= max(| Zil-目1,0) Si即(Zi); 1.2)迭代学习滤波器组F : 1.2. 1)对公式(1)求F,的偏导,并今求偏导后的结果尊干0,得:其中,i表示第i幅图像,N为图像总数,zf;表示第i幅图像第1层的特征图向量的转 置,巧Ll表示对第i幅图像第1-1层的特征图的融合过程,i4ili隶示对第i幅图像第1层 的特征图进行A的逆操作,兴表示第i幅图像的特征图从第1层向下重构得到的重构图像, /表示第i幅原始输入图像; 1. 2. 2)利用共辆梯度下降方法,结合公式化)W及求 解,得到更新后的Fi; 1. 3)迭代学习滤波器的权重W : 1. 3. 1)对公式(1)求Wi的偏导,并令求偏导后的结果等于0,得:其中,i表示第i幅图像,N为图像总数,zf未示第i幅图像第1层的特征图向量的转 置,戶/_1:表示对第i幅图像第1-1层的特征图的融合过程,^^1表示对第i幅图像第1层 的特征图进行A的逆操作,於< 表示第i幅图像的特征图从第1层向下重构得到的重构图像, /表示第i幅原始输入图像; 1. 3. 2)利用共辆梯度下降方法,结合公式(7) W及求 解,得到更新后的Wi; 1.4) 输入一幅原始图像y W及训练的层数1、迭代次数、正则项参数Ai、特征图总数Ki 和梯度下降步长目1,初始化该层的特征图Z、滤波器组F W及滤波器组的权重W,然后根据 步骤1.1)学习特征图Z ; 所有图像的特征图Z学完后,根据步骤1. 2)和步骤1. 3)分别学习滤波器组F和滤波 器组的权重W ; 1.5) 所有层迭代学习完成后,输出每幅图像的特征图Z、滤波器组F W及滤波器组的权 重Wo5.根据权利要求4所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征 在于:所述步骤2)的具体实现方式是: 2. 1)对图像的特征图Z用3X3的格网进行打块,设Z的大小为mXn,则提取到 (m/3+l) X (n/3+l) = Q个块,将每个块的特征拉成特征向量,得到数据矩阵X E R?x9K,其中 K是当前层特征图的个数,R是实数集; 2. 2)对数据矩阵X进行k-means聚类,共聚50类,并将聚类中必作为字典,得到字典矩 阵 D E R50X9K; 2. 3)计算数据矩阵X与字典矩阵D之间的距离,得到距离矩阵dis e R?x5°; 2.4) 将每一个特征向量分配给距离其最近的聚类中必,得到图像的字典索引向量 index e护,然后将字典索引向量变形为矩阵,得到图像的单词分布图M ; 2.5) 对步骤2. 4)所得的单词分布图M,分别在图像的IX 1、2X2、4X4的尺度上统计 不同单词出现的频率,得到统计直方图,然后将统计直方图连接成向量作为图像的特征向 量表达; 2. 6)对于每一层的特征图,均按照步骤2. 1)至步骤2. 5)的顺序进行处理,得到最终的 图像的特征向量表达。6.根据权利要求5所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征 在于:所述步骤4)中分类精度的计算方式为;将步骤3)所得不同场景的识别结果与测试 集的真实结果对比,统计分类正确的个数B,则: 分类精度=B/B,g, X100% ;其中,B,g,为测试集的总样本个数; 所述步骤4)中混淆矩阵的计算方式为;W待分类图像的所有场景类别分别建立横、纵 坐标轴,将每一类分类正确的百分比一一对应作为混淆矩阵的对角线元素,将各当前行的 类别错分到当前列的类别的百分比作为混淆矩阵的其他元素。
【文档编号】G06K9/00GK105989336SQ201510080035
【公开日】2016年10月5日
【申请日】2015年2月13日
【发明人】袁媛, 卢孝强, 付敏
【申请人】中国科学院西安光学精密机械研究所