本发明涉及弱小目标检测领域,尤其是一种基于特征映射神经网络的弱小目标检测方法。
背景技术
被动毫米波pmmw和红外成像具有无辐射、穿透能力强的优良特性,其在军事领域中的应用日益受到关注,因此在毫米波和红外成像下对弱小目标检测进行研究具有十分重要的意义。弱小目标检测技术近年来得到了快速发展,弱小目标指直径为3-5个像素的目标,但针对毫米波和红外成像条件下弱小目标高精度检测依然面临极大的困难:首先,目标的成像距离一般较远,所检测到的目标面积较小,信噪比较低,无纹理特征可提取;第二,目标成像通常受到复杂背景的干扰,大量的杂波、噪声,还有一些边缘信息如:云边缘、海天基线、建筑物边缘等的存在,造成了目标淹没于背景之中。
针对弱小目标检测,近年来学术界提出了一系列检测方法;背景抑制方法是弱小目标检测中最常见的方法,该方法通过估计待检测图像的背景,在此基础上进行目标检测。它主要分为三类检测方法:第一类是基于滤波的方法,通过图像滤波来估计背景,最终使目标得到增强;其在背景较简单的情况下抑制背景的效果较好,在背景较复杂、信噪比较低的情况,虚警概率增高,检测精度下降;第二类是基于回归的方法,回归方法又可以分为线性回归和非线性回归,经典的线性回归方法依赖于特定的背景杂波模型和寻求假设模型的参数估计;而非线性回归方法仅依赖于数据本身来估计回归函数;核回归算法nrrkr为典型的非线性回归算法;在实际应用中,由于缺乏背景杂波的先验知识,非线性回归方法更适合复杂背景条件下弱小目标的检测,但其存在明显的不足:每一个局部区域都需要进行多次回归迭代,整体算法效率极低;第三类方法是依据局部对比度差异对背景进行抑制,对目标进行增强,完成对目标的检测。这类方法在背景较简单的情况下检测效果较好,而在复杂背景下容易增加虚警目标数量且易受噪声的影响。
除了背景抑制方法外,还有一种基于机器学习的检测方法,该类方法用模式分类的思想去解决目标检测问题,它分别对目标和背景进行训练建模,然后根据判别规则判定测试图像的子图像块是否含有目标,如nlpca、spca、fld等。后来,随着稀疏表示理论的出现,为解决弱小目标检测问题带来了新的方法。基于图像稀疏表示的红外弱小目标检测算法sr,该方法采用二元高斯模型生成目标字典,继而通过背景子块与目标子块在目标字典中稀疏系数的差异来判断目标的位置。高斯字典作为典型的结构化过完备字典只适用于高斯分布的弱小目标,而对于非结构性的目标,其稀疏表示系数不足以区分目标和背景杂波。后来,王等人提出了多尺度自适应形态的稀疏字典来检测弱小目标,通过采用不同大小的原子来描述图像的不同成分,捕获图像更为细微的局部特征,提高检测精度;接着,陈等人提出了基于稀疏度的方法,该方法以离线学习的方式手动构造有区别性的双字典来提高稀疏表示的差异;后来,有人提出的新方法:基于空时联合稀疏重构弱小运动目标检测算法stcsr,该方法首先通过学习序列图像的内容构建自适应型态过完备空时字典,然后利用多元高斯模型从过完备字典中提取出目标空时字典和背景空时字典,将多帧图像分别在目标空时字典和背景空时字典进行稀疏重构,利用重构差异来区分目标和背景。针对该方法在字典学习方面的不足,有人提出了改进的isr方法,该方法提出一种显著背景和目标双字典构造方法,具有更好的目标和背景建模能力。以上方法都在一定程度上提高了检测精度,但上述方法均存在缺点:一方面容易受到噪声的干扰,另一方面目标与背景稀疏特征的差异不明显,容易混杂在一起,增加了检测难度。
因此需要一种弱小目标检测方法可以克服弱小目标的噪声因素的同时提高检测精度。
技术实现要素:
本发明的目的在于:本发明提供了一种基于特征映射神经网络的弱小目标检测方法,解决了现有弱小目标受噪声和干扰影响导致检测精度低的问题。
本发明采用的技术方案如下:
一种基于特征映射神经网络的弱小目标检测方法,包括如下步骤:
步骤1:构建、训练纺锤型深度神经网络;
步骤2:将采集的弱小目标图像输入已训练的纺锤型深度神经网络获取目标增强和背景抑制的幅值图;
步骤3:幅值图采用恒虚警率方法完成弱小目标检测。
优选地,所述步骤1包括如下步骤:
步骤1.1:构建包括输入层、解码层、编码层和softmax输出层的纺锤型深度神经网络的结构;
步骤1.2:采用交叉验证方法确定纺锤型深度神经网络的超参数获得纺锤型深度神经网络;
步骤1.3:构建训练数据集;
步骤1.4:将训练数据集输入纺锤型深度神经网络采用无监督方式进行训练获得初始化网络权重完成训练。
优选地,所述解码层、编码层训练计算如下:
hk=σ(wkx+bk)
其中,wk表示权重矩阵,bk表示偏置向量,σ表示激活函数,x={x1,x2,...,xm}表示当前层的输入,hk表示当前层的输出。
优选地,所述步骤2包括如下步骤:
步骤2.1:将采集的弱小目标图像输入已训练的纺锤型深度神经网络后,将弱小目标样本标签设置为1,背景样本标签设置为0;
步骤2.2:采用滑动窗口的方法对弱小目标图像进行判别获得图像中弱小目标的概率值;
步骤2.3:采用输出层logistic回归的结果即多个概率值作为窗口坐标点响应幅值获取多个弱小目标对应的目标增强和背景抑制的幅值图。
优选地,所述步骤3包括如下步骤:
步骤3.1:幅值图中的每个值采用滑动窗口提取子块
步骤3.2:采用恒虚警率对检测后的每个幅值进行统计获取虚警概率;
其中,t表示似然比检测的阈值,
步骤3.3:根据虚警概率计算候选目标总数,将虚警概率从高到低排序,从多个幅值中检测定位目标。
优选地,所述步骤1.3中的构建训练数据集包括如下步骤:
步骤1.3.1:在不包含弱小目标图像中随机产生坐标点作为仿真目标,提取n*n窗口区域作为背景样本;
步骤1.3.2:在背景样本中采用二维高斯强度模型加上一个仿真目标作为目标样本,二维高斯模型如下:
其中,(x0,y0)表示目标图像的中心位置,s(i,j)表示目标图像在位置(i,j)的像素值,se表示生成目标的强度,其值是(0,1]之间的随机数,σx和σy分别表示水平和垂直散布参数,其值介于[0,2]之间;
步骤1.3.3:调整目标样本的不同参数生成不同信噪比的弱小目标完成训练数据集的构建。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明采用纺锤形网络结构,首先将低维的弱小目标区块特征映射到高维空间,然后通过编码神经网络提取高分辨特征,完成背景和目标判别,根据网络判别输出的强度得到背景抑制目标增强的图像,最后采用基于恒虚警率的检测方法完成对弱小目标检测,解决了现有弱小目标受噪声和干扰影响导致检测精度低的问题,达到了提高网络强大的表示能力,在高噪声环境下,提高弱小目标检测精度的效果;
2.本发明对不同场景下的毫米波和红外图像进行检测,在网络的前端实现解码操作,使得网络具有更强大的表示能力,首先将弱小目标区域像素特征映射到高维特征空间,再将高维特征通过编码映射到易于判别的低维特征空间,达到更低的虚警率、更高的检测精度、更强的鲁棒性的效果;
3.本发明网络采用的无监督的学习方式预训练,构建更深层次结构,通过无监督学习得到的初始化网络权重可以提高网络稳定性,以避免直接训练深度神经网络过程中的局部最小问题,同时无监督学习获取一系列相关数据集的内部特征,去除输入数据的冗余成分,利于获得高可判别特征,进一步提高网络的判别精度;
4.本发明的恒虚警率方法中采用滑块进行检测,根据实际情况假设两个目标距离有一定的距离时采用滑块进行恒虚假率检测,一方面可以加快检测速度,另一方面利于提高检测精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明的纺锤型深度神经网络结构示意图;
图2为本发明的纺锤型深度神经网络具体实施示意图;
图3为本发明的训练数据二维图;
图4为本发明的训练数据三维映射图;
图5为本发明的训练数据二维映射图;
图6为本发明的训练数据示意图;
图7为本发明的仿真测试数据集数据示意图;
图8为本发明的仿真图背景抑制后检测结果示意图;
图9为本发明的snr<10时检测概率pd与虚警率pfa之间的关系图;
图10为本发明的10<snr<20时检测概率pd与虚警率pfa之间的关系图;
图11为本发明的20<snr<30时检测概率pd与虚警率pfa之间的关系图;
图12为本发明的30<snr<40时检测概率pd与虚警率pfa之间的关系图;
图13为本发明的pfa=1e-4之下,pd随snr的变化效果检测图;
图14为本发明的pfa=10e-4,pd随snr的变化效果检测图;
图15为本发明的pfa=20e-4,pd随snr的变化效果检测图;
图16为本发明的pfa=30e-4,pd随snr的变化效果检测图;
图17为本发明的dl算法的效果示意放大图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
技术问题:解决了现有弱小目标受噪声和干扰影响导致检测精度低的问题
技术手段:
一种基于特征映射神经网络的弱小目标检测方法,包括如下步骤:
步骤1:构建、训练纺锤型深度神经网络;
步骤2:将采集的弱小目标图像输入已训练的纺锤型深度神经网络获取目标增强和背景抑制的幅值图;
步骤3:幅值图采用恒虚警率方法完成弱小目标检测。
步骤1包括如下步骤:
步骤1.1:构建包括输入层、解码层、编码层和softmax输出层的纺锤型深度神经网络的结构;
步骤1.2:采用交叉验证方法确定纺锤型深度神经网络的超参数获得纺锤型深度神经网络;
步骤1.3:构建训练数据集;
步骤1.4:将训练数据集输入纺锤型深度神经网络采用无监督方式进行训练获得初始化网络权重完成训练。
解码层、编码层训练计算如下:
hk=σ(wkx+bk)
其中,wk表示权重矩阵,bk表示偏置向量,σ表示激活函数,x={x1,x2,...,xm}表示当前层的输入,hk表示当前层的输出。
步骤2包括如下步骤:
步骤2.1:将采集的弱小目标图像输入已训练的纺锤型深度神经网络后,将弱小目标样本标签设置为1,背景样本标签设置为0;
步骤2.2:采用滑动窗口的方法对弱小目标图像进行判别获得图像中弱小目标的概率值;
步骤2.3:采用输出层logistic回归的结果即多个概率值作为窗口坐标点响应幅值获取多个弱小目标对应的目标增强和背景抑制的幅值图。
步骤3包括如下步骤:
步骤3.1:幅值图中的每个值采用滑动窗口提取子块
步骤3.2:采用恒虚警率对检测后的每个幅值进行统计获取虚警概率;
其中,t表示似然比检测的阈值,
步骤3.3:根据虚警概率计算候选目标总数,将虚警概率从高到低排序,从多个幅值中检测定位目标。
步骤1.3中的构建训练数据集包括如下步骤:
步骤1.3.1:在不包含弱小目标图像中随机产生坐标点作为仿真目标,提取n*n窗口区域作为背景样本;
步骤1.3.2:在背景样本中采用二维高斯强度模型加上一个仿真目标作为目标样本,二维高斯模型如下:
其中,(x0,y0)表示目标图像的中心位置,s(i,j)表示目标图像在位置(i,j)的像素值,se表示生成目标的强度,其值是(0,1]之间的随机数,σx和σy分别表示水平和垂直散布参数,其值介于[0,2]之间;
步骤1.3.3:调整目标样本的不同参数生成不同信噪比的弱小目标完成训练数据集的构建。
技术效果:
本发明采用纺锤形网络结构,首先将低维的弱小目标区块特征映射到高维空间,然后通过编码神经网络提取高分辨特征,完成背景和目标判别,根据网络判别输出的强度得到背景抑制目标增强的图像,最后采用基于恒虚警率的检测方法完成对弱小目标检测,解决了现有弱小目标受噪声和干扰影响导致检测精度低的问题,达到了提高网络强大的表示能力,在高噪声环境下,提高弱小目标检测精度的效果。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
网络的训练数据如图3所示,小圆圈表示一类项目,x点表示另外一类样本,训练样本是线性不可分的,具有较大的判别难度;通过训练样本对深度网络进行训练后,输出第二层和第三层特征如图4所示,线性不可分的二维特征通过神经网络映射到三维后,在三维特征空间具有线性可判别性,三维特征重新编码到二维后,如图5所示,原来不可线性不可分的低维特征被映射到了线性可判别特征空间,而且蓝色x点样本分布在紧致的区域内。如图2所示,整个网络一共包含6层,可以分为2个部分,输入层到第2层是解码层,完成特征的升维,低维到高维的映射;2层到5层是典型的稀疏自编码器,实现抽象高级特征的编码提取,最后一层是softmax输出层;本文提出的网络模型和典型的深度神经网络模型主要区别是第一层到第二层的解码层,传统深度神经网络主要是处理高维数据,提取抽象的降维的特征;基于弱小目标检测窗口较小,维度较低的特点,首先在网络的前端实现解码操作,使得网络具有更强大的表示能力;在高噪声环境下,弱小目标检测精度更高;构建、训练纺锤型深度神经网络:步骤1.1:构建包括输入层、解码层、编码层和softmax输出层的纺锤型深度神经网络的结构;步骤1.2:采用交叉验证方法确定纺锤型深度神经网络的超参数;步骤1.3:构建训练数据集;步骤1.4:将训练数据集输入纺锤型深度神经网络采用无监督方式进行训练获得初始化网络权重完成训练。完成训练的网络模型各层的尺寸为[81,512,256,121,81,1],其中输入层{i1,i2,…,in}为图像中弱小目标检测窗口像素的线性排列;特征转换,我们采用稀疏自编码器,计算公式如下:
其中,x(i)表示在给定输入为x情况下,自编码神经网络隐藏神经元j的激活度,
ρ设置为0.5,β设置为3,采用梯度下降法学习网络参数,学习率设置为0.01;在训练的时候,弱小目标样本标签设置为1,背景样本标签设置为0,采用滑动窗口的方法对图像所有的区域输入网络进行判别,采用输出层logistic回归的结果作为窗口坐标点响应幅值,该值越多说明该检测窗口包含弱小目标的概率越高,通过纺锤型深度神经网络得到目标增强和背景抑制的幅值图为io;幅值图采用恒虚警率方法完成弱小目标检测;训练的数据集采用仿真方法获取,通过在220幅不包含弱小目标的图像中人工添加弱小目标,仿真构造训练集;在每一幅图像中随机产生坐标点,提取9*9的区域作为背景样本,在背景样本中用二维高斯强度模型加上一个仿真目标作为目标样本,二维高斯模型如下:
其中,(x0,y0)表示目标图像的中心位置,s(i,j)表示目标图像在位置(i,j)的像素值,se表示生成目标的强度,其值是(0,1]之间的随机数,σx和σy分别表示水平和垂直散布参数,其值介于[0,2]之间。
通过调整不同参数生成不同信噪比的弱小目标,本文生成的弱小目标信噪比介于[0-120]之间,各样本基本均匀分布在这个信噪比区间范围内,一共包含26400个正样本和26400个负样本,部分生成训练样本图像如图6所示,仿真测试数据集部分数据如图7所示。
测试集包含仿真测试集和真实数据测试集,图像数据包含毫米波图像和红外图像,红外图像来自于多个数据集,仿真测试数据集采用训练数据相同的弱小目标仿真方法,在背景图像中随机加入不同信噪比的弱小目标,本申请一共在32幅图像中加入1920个弱小目标,同样他们的信噪比接近均匀分布在[0-120]db之间;将测试集数据输入已经训练的纺锤形神经网络完成测试,通过纺锤形神经网络首先将低维的弱小目标区块特征映射到高维空间,然后通过编码神经网络提取高分辨特征,完成背景和目标判别,根据网络判别输出的强度得到背景抑制目标增强的图像,最后采用基于恒虚警率的检测方法完成对弱小目标检测,有效提高弱小目标的检测精度。
实施例2
步骤1包括如下步骤:
步骤1.1:构建包括输入层、解码层、编码层和softmax输出层的纺锤型深度神经网络的结构;
步骤1.2:采用交叉验证方法确定纺锤型深度神经网络的超参数获得纺锤型深度神经网络;
步骤1.3:构建训练数据集;
步骤1.4:将训练数据集输入纺锤型深度神经网络采用无监督方式进行训练获得初始化网络权重完成训练。
解码层、编码层训练计算如下:
hk=σ(wkx+bk)
其中,wk表示权重矩阵,bk表示偏置向量,σ表示激活函数,x={x1,x2,...,xm}表示当前层的输入,hk表示当前层的输出。
步骤2包括如下步骤:
步骤2.1:将采集的弱小目标图像输入已训练的纺锤型深度神经网络后,将弱小目标样本标签设置为1,背景样本标签设置为0,图像的具体如下:
其中,s表示传感器采集图像,st表示目标信号,sb表示背景信号,n表示噪声。
步骤2.2:采用滑动窗口的方法对弱小目标图像进行判别获得图像中弱小目标的概率值;
步骤2.3:采用输出层logistic回归的结果即多个概率值作为窗口坐标点响应幅值获取多个弱小目标对应的目标增强和背景抑制的幅值图。
步骤3包括如下步骤:
步骤3.1:幅值图中的每个值采用滑动窗口提取子块
步骤3.2:采用恒虚警率对检测后的每个幅值进行统计获取虚警概率;
其中,t表示似然比检测的阈值,
步骤3.3:根据虚警概率计算候选目标总数,将虚警概率从高到低排序,从多个幅值中检测定位目标。
步骤1.3中的构建训练数据集包括如下步骤:
步骤1.3.1:在不包含弱小目标图像中随机产生坐标点作为仿真目标,提取n*n窗口区域作为背景样本;
步骤1.3.2:在背景样本中采用二维高斯强度模型加上一个仿真目标作为目标样本,二维高斯模型如下:
其中,(x0,y0)表示目标图像的中心位置,s(i,j)表示目标图像在位置(i,j)的像素值,se表示生成目标的强度,其值是(0,1]之间的随机数,σx和σy分别表示水平和垂直散布参数,其值介于[0,2]之间;
步骤1.3.3:调整目标样本的不同参数生成不同信噪比的弱小目标完成训练数据集的构建。
通过对比分析其它几种主流算法检测效果和本申请的检测效果,体现本申请的精度。采用两类曲线作为评价指标,第一类曲线是roc曲线,在目标检测中它反映的是检测概率pd与虚警率pfa之间的变化关系,roc曲线下的面积越大,检测性能越好,pd与pfa的计算公式如下:
其中,nt表示正确检测到的目标数量,na表示目标的总数量,nf表示检测到目标的虚假数量,n表示图像中所有像素点的数量。
第二类曲线是检测概率pd与信噪比snr之间的变化关系,随着snr值的增加,pd将逐渐变大,最后趋近于1,采用的snr计算公式为:
其中,gt表示目标局部区域像素的平均值,gb和σb分别表示背景局部区域像素平均值和标准差。
几种主流算法检测效果包括:acsdm、cscd、sr、istcr、istcsr-cscd,本申请表示的是dl算法;如图8所示:从左至右分别代表acsdm、cscd、sr、istcr、istcsr-cscd和dl算法;其中,绿色实线框表示目标的真实位置,红色框表示检测器的输出,如果检测器输出位置和目标真实位置重合,则红色框会覆盖绿色框,该目标点仅仅现实红色框,只有绿色框的目标,表示检测器在指定虚警率下出现了漏检,从图可以看出dl算法相对于其它几种算法,检测到的真实目标数最多,漏检的目标数量最少;
6种算法的定量分析结果如图9-12所示,图9-12描述了不同信噪比snr之下(snr<10,10<snr<20,20<snr<30,30<snr<40)检测概率pd与虚警率pfa之间的关系,标志为star的实线是本文提出的dl算法的结果,可以看出在4种不同snr区间上本申请算法总体上都要优于其它5种算法;在snr<10时,在pfa=1×10-4时,istcr算法优于本文方法,具有最好的结果,其余情况我们的方法dl具有更好的检测的精度;在10<snr<20时,本文算法在各个虚警率下检测率都远高于其余方法,相比排名第二的方法cscd,dl高出约20%;在20<snr<30时,高于同类最好方法约12%;在30<snr<40时,本文方法也明显优于同类方法,约高8%左右;
图13-16表示在相同的pfa之下,pd随snr的变化情况,标志为star的实线代表本申请提出的dl算法,可以看出在4种不同的恒虚警率情况下,dl算法都获得了最好的结果,尤其是在pfa>10×10-4时,本文方法平均高于同类最好方法20%;在pfa=1×10-4时,dl、istcr和istcr-cscd三种算法检测方法性能比较接近,但明显优于其余三种算法。图17为dl算法的检测效果放大示意图,因为本检测采用颜色区分真实位置框和检测输出框,根据专利法进行黑白化后效果可能不是很明显,有必要时可提供彩色图。
通过构造纺锤体神经网络结构,学习复杂背景下弱小目标的特征,通过深度神经网络对图像块进行判别输出目标概率,目标区域拥有更高的概率,背景区域概率更低,以此概率构造目标强度地图,再运用恒虚警率即cfar方法进行目标检测和定位,与主流算法相比,dl算法的检测精度平均提高了约15%,尤其是真实测试图像上,dl性能远超同类方法,基于学习的方法在复杂背景下,具有更好的检测能力,说明dl方法具有高检测精度情况下,还拥有远超同类方法的泛化能力。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。