一种基于脉冲神经网络的SAR图像舰船目标识别方法

文档序号:25859537发布日期:2021-07-13 16:14阅读:234来源:国知局
一种基于脉冲神经网络的SAR图像舰船目标识别方法
本发明涉及图像目标识别领域,更具体地,涉及一种基于脉冲神经网络的sar图像舰船目标识别方法。
背景技术
:合成孔径雷达(syntheticapertureradar,sar)是一种高分辨率成像雷达,具有全天候、全天时、不受天气影响等成像特点,可有效地识别伪装和穿透掩盖物,能够宏观、长期、动态、实时地对陆地和海洋进行观测,已成为对地、对海观测系统的重要构成部分,目前成为遥感技术的研究重点。它不仅被广泛应用于国民经济建设、生态环境保护等领域,而且在国家安全与军事领域发挥着越来越重要的作用。随着高分三号等卫星的发射,提供了越来越多的高分辨率sar图像,进一步促进了sar图像解译技术的发展和应用。近年来,人工智能(artificialintelligence,ai)技术的兴起引发了以计算机视觉领域为代表的快速发展,并逐渐在sar图像解译领域得到推广。ai的代表性技术为深度学习(deeplearning),深度学习的概念源于对人工神经网络(artificialneuralnetworks,ann)的研究,含多个隐藏层的神经网络就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布和特征表示。以神经网络为代表的深度学习方法能够自主学习图像特征而不依赖人工设计,具有自动化程度高、识别能力强等特点,在sar图像诸多任务(如检测、鉴别、分类和分割等)方面取得了突破性进展。\尽管传统的人工神经网络在多项任务上取得了突破性的进展,能耗问题却限制了其更加广泛的部署应用。为了解决这一问题,第三代人工神经网络---脉冲神经网络(spikingneuralnetworks,snn)被提了出来。基于类脑计算框架下的snn以脉冲神经元为基本计算单元,通过稀疏脉冲序列传递信息,被称为能耗更低的新一代绿色人工智能技术。snn最早由1997年maass受生物大脑的启发而提出,原理是利用脉冲函数来模仿生物神经元之间的信息传递。作为第三代神经网络,snn能够模仿人类大脑的信息编码和处理过程,是一种具有高生物可塑性,事件驱动特性和低功耗的类脑计算模型。相比于人工神经元,脉冲神经元则从神经科学的角度出发,对真实的生物神经元进行建模,其模拟神经元更加接近生物实际,因此能够更好地模拟生物神经元的复杂系统。然而,不同于传统神经网络以连续的实值进行模拟计算,snn是以离散的脉冲序列进行消息传递,因此存在难以训练或训练效率低等问题,针对snn的研究仍然远落后于传统神经网络。当前,针对snn的研究主要集中在以光学图像为载体的计算机视觉领域,对于sar图像舰船目标识别场景,如何提出一个高效节能、识别准确率高的模型正是一个亟待解决的技术问题。技术实现要素:本发明提供一种基于脉冲神经网络的sar图像舰船目标识别方法,该方法克服现有的sar图像舰船目标识别神经网络参数庞大、能耗高等技术问题。为了达到上述技术效果,本发明的技术方案如下:一种基于脉冲神经网络的sar图像舰船目标识别方法,包括以下步骤:s1:进行sar图像视觉显著图提取和脉冲编码;s2:进行脉冲神经网络模型构建;s3:进行脉冲神经网络模型训练。进一步地,所述步骤s1中,进行sar图像视觉显著图提取的过程包括:进行sar图像亮度信息提取:给定输入图像j,首先利用高斯金字塔对其进行尺度为2的特征图提取,实现图像在水平和垂直方向上尺度逐渐递减的八级下采样过程;每层图像的亮度特征图表示为i(k),其中k∈[0,8]代表图像高斯金字塔结构中的不同层级;在图像中,相邻像素之间在纹理和灰度层面上具有很强的相关性,如果某一像素点与周围像素点差异越大越容易引起视觉注意,成为视觉显著点,引入中央周边差方法对不同尺度分辨率的特征图做进一步处理得到注意力信息;定义为中央周边差算子,亮度特征图的提取过程为将不同层级的特征图缩放到同一尺度后进行逐像素点的相减,该过程表示为:其中,c∈{2,3,4},s=c+δ,δ∈{3,4},表示将第c层的特征图与第s层的特征图进行差值运算;所述步骤s1中,进行sar图像视觉显著图提取的过程还包括:进行sar图像方向信息提取:方向信息提取过程与亮度信息提取过程类似,首先利用高斯金字塔对输入图像进行八级下采样得到多尺度特征图,然后再针对特征度作进一步方向特征提取;使用二维gabor滤波器提取图像的方向通道特征信息,其数学表达式为:其中,(x0,y0)表示目标中心在图像中的坐标位置,(ξ0,v0)表示滤波器在频域上的最优空间频率,表示高斯函数在x轴方向上的方差,表示高斯函数在y轴上的方差,和决定了gabor滤波核可接受区域的大小;通过gabor对高斯金字塔中的每一层级的特征图进行方向特征提取,得到不同尺度的方向特征图o(k),利用中央周边差方法提取方向特征的注意力信息:所述步骤s1中,进行sar图像视觉显著图提取的过程还包括:进行sar图像全局加强合并:选取全局加强合并的策略融合亮度和方向特征图的信息以生产视觉显著图:1)归一化特征图至[0,n],其中n∈[0,255]限制了归一化的范围;2)计算全局最大值m和局部平均值3)对于每一副特征图,乘以权值假设表示全局加强合并过程,则融合了中央周边差算子的亮度通道显著图合并过程表示为:方向通道显著图的合并过程表示为:再利用全局加强合并策略合并两个通道的特征图,得到最终的视觉显著图s:所述步骤s1中,进行脉冲编码的过程包括:在脉冲神经网络中,编码过程主要用于将输入的连续实值信号转换为带有时间信息的脉冲序列,并且尽可能地保留数据的大部分信息,基于速率的泊松编码器将输入的实值数据编码为发射次数分布符合泊松过程的脉冲,对于输入x∈[0,1],在一个仿真步长内,假设脉冲发射的概率为p=x,泊松编码的采样过程为:考虑到脉冲序列具有时间相关性,额外引入时间步长变量t,在每个时间步长应用泊松编码过程,将静态像素数据的输入转换为脉冲序列在各个时间步长上的映射。进一步地,所述步骤s2的过程是:对于脉冲神经元,可由如下微分方程进行描述:其中,r为膜电阻,c为电容量,i(t)表示t时刻的输入电流,上式表示为:τ(v(t)-v(t-1))=-(v(t-1)-vreset)+x(t)其中,τ=rc称为膜时间常数,x(t)=i(t)r为t时刻的外源输入;当电荷累积到一定程度,即膜电压达到阈值,神经元则输出脉冲,通常为heavisidestep阶跃函数:脉冲神经网络模型的重置过程发生在脉冲发射后,释放脉冲消耗了神经元之前积累的电荷,膜电位会有一个瞬间的降低,根据重置的方式,分为硬重置和软重置两种方式:进一步地,所述步骤s3的过程是:利用步骤s2构建好的脉冲神经网络模型对sar图像进行目标训练,需要考虑到脉冲发射函数的不可导性,引入梯度替代函数平滑反正切函数在反向传播时进行替代训练:在反向传播对应的梯度为:其中α为平滑因子,用于控制反正切函数的平滑程度。其中,每个像素在t个时间步长内产生的t个脉冲序列,并且脉冲的发射概率与像素值大小呈正比。与现有技术相比,本发明技术方案的有益效果是:本发明方法采用了基于视觉注意力机制的视觉显著图提取方法,可以增强图像特征、去除相干斑等噪声影响,提高模型泛化能力和鲁棒性;然后,利用泊松编码器对视觉显著图进行步长为t的脉冲编码,得到离散的脉冲时间序列,以便后续的网络进行信息传递;接着,利用卷积神经网络和lif脉冲神经元构建脉冲神经网络模型,赋予神经网络更好的生物特性,从而能够更准确地模拟大脑的信息传递过程;最后,利用替代梯度训练方法,解决了脉冲神经网络模型难以利用梯度下降和反向传播进行优化的问题。本发明提出的脉冲神经网络模型是一个高效节能的目标识别模型,通过利用离散的脉冲序列及其事件驱动的特性,使得模型能够模拟大脑神经元突触结构进行离散脉冲消息传递,从而达到能耗更低的目的。本发明提出的目标识别方法通过基于注意力机制的有效编码和基于深度学习方法的模型构建与训练,能够准确识别舰船目标,同时兼具有高效节能的优势,对实现未来的智能雷达感知有重要的参考价值。附图说明图1为本发明提出的sar舰船图像目标识别方法框架图;图2为本发明使用的视觉注意力模型框架图;图3为本发明使用的泊松编码过程图;图4为本发明使用的lif神经元模型图;图5为本发明对sar图像进行脉冲编码结果。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。如图1所示,本发明提出的sar图像舰船目标识别方法框架图,,整个框架包括对输入图像进行视觉显著图提取和脉冲编码得到脉冲序列,然后通过交替堆叠卷积层与lif神经元、全连接层与lif神经元对脉冲序列进行处理第一步,sar图像视觉显著图提取和脉冲编码:设输入的sar舰船图像为j,视觉显著图提取主要包含如下步骤:(1)亮度信息提取给定输入图像j,首先利用高斯金字塔对其进行尺度为2的特征图提取,实现图像在水平和垂直方向上尺度逐渐递减的八级下采样过程。每层图像的亮度特征图表示为i(k),其中k∈[0,8]代表图像高斯金字塔结构中的不同层级。在图像中,相邻像素之间在纹理和灰度层面上具有很强的相关性,如果某一像素点与周围像素点差异越大越容易引起视觉注意,成为视觉显著点。因此,引入中央周边差方法对不同尺度分辨率的特征图做进一步处理得到注意力信息。定义为中央周边差算子,亮度特征图的提取过程为将不同层级的特征图缩放到同一尺度后进行逐像素点的相减,该过程可以表示为:其中,c∈{2,3,4},s=c+δ,δ∈{3,4},表示将第c层的特征图与第s层的特征图进行差值运算。(2)方向信息提取如图2所示,输入图像经过八层高斯金字塔提取图像不同分辨率特征,得到亮度通道和方向通道的特征图,然后经过中央周边差处理及全局加强合并得到最终的视觉显著图。方向信息提取过程与亮度信息提取过程类似,首先利用高斯金字塔对输入图像进行八级下采样得到多尺度特征图,然后再针对特征度作进一步方向特征提取。gabor滤波是一种可以有效抽取图像空间局部特征的处理方法,本发明使用二维gabor滤波器提取图像的方向通道特征信息,其数学表达式为:其中,(x0,y0)表示目标中心在图像中的坐标位置,(ξ0,v0)表示滤波器在频域上的最优空间频率,表示高斯函数在x轴方向上的方差,表示高斯函数在y轴上的方差,和决定了gabor滤波核可接受区域的大小。通过gabor对高斯金字塔中的每一层级的特征图进行方向特征提取,得到不同尺度的方向特征图o(k)。进一步地,利用中央周边差方法提取方向特征的注意力信息:(3)全局加强合并选取全局加强合并的策略融合亮度和方向特征图的信息以生产视觉显著图。全局加强合并是一种无需目标先验信息的特征信息合并策略,能够有效地加强对特征图中的显著性峰值区域,去除背景杂波的干扰。该方法主要由三个步骤组成:1)归一化特征图至[0,n],其中n∈[0,255]限制了归一化的范围;2)计算全局最大值m和局部平均值3)对于每一副特征图,乘以权值假设表示全局加强合并过程,则融合了中央周边差算子的亮度通道显著图合并过程表示为:类似地,方向通道显著图的合并过程表示为:最后,再利用全局加强合并策略合并两个通道的特征图,得到最终的视觉显著图s:(4)泊松编码如图3所示,该编码为基于速率的编码,能够将输入图像编码为离散的脉冲序列。考虑到脉冲序列具有时间相关性,因此本发明额外引入时间步长变量t,在每个时间步长应用泊松编码过程,将静态像素数据的输入转换为脉冲序列在各个时间步长上的映射。每个像素在t个时间步长内产生的t个脉冲序列,并且脉冲的发射概率与像素值大小呈正比。在脉冲神经网络中,编码过程主要用于将输入的连续实值信号转换为带有时间信息的脉冲序列,并且尽可能地保留数据的大部分信息。基于速率的泊松编码器是最简单有效的一种编码方式,能够将输入的实值数据编码为发射次数分布符合泊松过程的脉冲,在脉冲序列估计和神经网络背景噪声模拟中具有广泛的应用。泊松编码是一种基于速率的编码方式,对于输入x∈[0,1],在一个仿真步长内,假设脉冲发射的概率为p=x,泊松编码的采样过程为:考虑到脉冲序列具有时间相关性,因此本发明额外引入时间步长变量t,在每个时间步长应用泊松编码过程,将静态像素数据的输入转换为脉冲序列在各个时间步长上的映射。每个像素在t个时间步长内产生的t个脉冲序列,并且脉冲的发射概率与像素值大小呈正比。第二步,脉冲神经网络模型构建。如图4所示,lif神经元模型考虑了人脑神经元一个重要的生理因素:细胞膜不是完美的电容器,电荷会随着时间的流逝缓慢地通过细胞膜泄露,从而使得膜电压恢复到其静息电位。因此,lif神经元的等效电路为电阻和电容的并联组合。lif模型\cite{lif}是一类经典的脉冲神经网络模型,具有更好的生物特性。lif模型考虑了一个重要的生理因素:细胞膜不是完美的电容器,电荷会随着时间的流逝缓慢地通过细胞膜泄露,从而使得膜电压恢复到其静息电位。因此,lif模型将细胞膜的电特性看成是电阻和电容的并联组合。对于lif神经元,可由如下微分方程进行描述:其中,r为膜电阻,c为电容量,i(t)表示t时刻的输入电流。经化简,上式可以表示为:τ(v(t)-v(t-1))=-(v(t-1)-vreset)+x(t)其中,τ=rc称为膜时间常数,x(t)=i(t)r为t时刻的外源输入。当电荷累积到一定程度,即膜电压达到阈值,神经元则输出脉冲。通常为heavisidestep阶跃函数:lif模型的重置过程发生在脉冲发射后,释放脉冲消耗了神经元之前积累的电荷,因此膜电位会有一个瞬间的降低。根据重置的方式,可以分为硬重置(hardreset)和软重置(softreset)两种方式:第三步,脉冲神经网络模型训练。利用第二步构建好的模型对sar图像进行目标训练,需要考虑到脉冲发射函数的不可导性。因此,引入梯度替代函数平滑反正切函数在反向传播时进行替代训练:在反向传播对应的梯度为其中α为平滑因子,用于控制反正切函数的平滑程度。如图5所示,通过对比实验,对本发明提出的sar图像舰船目标检测方法进行了验证,理论分析和对比实验证明了本发明的有效性。在对比实验中,本发明中使用数据集为c.p.schwegmann等人提供的sar-ship数据集,该数据集包含4,788张sar图像及对应类别信息,对比实验以75%作为训练集,25%作为测试集。表1为本发明对sar舰船图像进行目标识别的结果。对比的模型包括传统的机器学习方法:svm,dt和knn,以及基于深度学习的方法alexnet与resnet。本发明提出的方法能够准确地识别舰船目标,具有较高的准确率和召回率,并且综合二者指标得到的f1分数也取得了最好的结果,说明本发明对sar图像舰船目标识别的有效性。表1本发明最终目标识别结果对比对比模型精确度召回率f1分数svm88.13%87.37%87.75%knn88.5%92.49%92.50%dt89.34%89.39%89.36%alexnet94.66%94.73%94.69%resnet95.05%95.07%95.06%本发明95.57%95.59%95.58%相同或相似的标号对应相同或相似的部件;附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1