基于深度长短期记忆网络的窄带雷达目标跟踪方法与流程

文档序号:16604177发布日期:2019-01-14 20:49阅读:200来源:国知局
基于深度长短期记忆网络的窄带雷达目标跟踪方法与流程

本发明属于通信技术领域,更进一步涉及窄带雷达通信技术领域中的一种基于深度长短期记忆网络的窄带雷达目标跟踪方法。本发明可用于对窄带雷达观测下的目标数据序列中的单个运动目标进行跟踪,并且可以实现对多种运动类型目标的有效跟踪。



背景技术:

窄带雷达观测下的运动目标跟踪的主要任务是,从窄带雷达对目标连续的观测中提取出目标在每一帧回波中的真实状态。随着人们对窄带雷达通信领域的不断深入了解,运动目标跟踪在该领域得到广泛的应用和发展,目前已经存在大量跟踪算法来实现单运动目标跟踪。但是由于目标运动类型的不确定性容易造成跟踪滤波器失配,使得准确地进行目标跟踪目标仍面临极大挑战。

电子科技大学在其申请的专利文献“一种用于目标跟踪的强跟踪容积卡尔曼滤波方法”(专利申请号201410654687.0,申请公开号104408744a)中公安开了一种用于目标跟踪的强跟踪容积卡尔曼滤波方法。该方法实现的具体步骤是,(1)建立离散非线性动态系统模型;(2)进行系统初始化;(3)进行时间更新,引入时变渐消因子λk;(4)进行量测更新;(5)进行滤波更新。该方法的不足之处是,建立完成的离散非线性动态系统模型只有一种,在实际应用中若目标运动与其不符合,则容易产生滤波器失配、丢失目标的问题。

东南大学在其申请的专利文献“一种基于交互多模型的目标跟踪方法”(专利申请号201410778057.4,申请公开号104573190a)中公开了一种基于交互式多模型的目标跟踪方法。该方法实现的具体步骤是,(1)根据目标动态条件,设定五组辛格尔singer模型参数,构建五个singer模型;(2)根据观测到的目标位置信息,将五个singer模型进行交互式多模型非线性滤波,估计目标的运动速度、加速度和位置信息;(3)利用目标的运动速度和加速度,计算目标转弯角速率;(4)将目标转弯角速率与设定的阈值进行比较,判断是否发生转弯运动,如果未发生转弯运动,则将步骤(2)中得到的位置信息作为目标跟踪结果;(5)如果发生转弯运动,选取三个相邻时刻的转弯角速率构建三个转弯模型来近似目标的实际运动,进行交互式多模型非线性滤波得到目标位置作为目标跟踪结果。该方法存在的不足之处在于,观测误差会影响目标转弯角速率计算的准确性,进而影响关于目标是否发生转弯运动的判断,并且在目标运动特性发生变化时,用于近似目标实际运动的多个模型近似误差会增大,使得跟踪滤波误差增大。



技术实现要素:

本发明的目的是针对上述现有技术的不足,提出一种基于深度长短期记忆网络的窄带雷达目标跟踪方法,以实现更加准确地对多种不同运动类型的目标的跟踪。

为实现本发明目的思路是,首先,根据待跟踪目标的运动类型构建训练数据集,利用窄带雷达系统的观测范围归一化训练数据集。其次,构建出包含滤波网络和预测网络的深度长短期记忆网络,并用归一化后的训练数据集来训练深度长短期记忆网络。最后,利用窄带雷达系统的观测范围归一化窄带雷达对待跟踪的目标的观测,输入到训练好的深度长短期记忆网络,再分别利用窄带雷达的观测范围将滤波网络和预测网络的输出逆归一化,得到待跟踪目标滤波和预测的状态,完成目标跟踪。

本发明的具体步骤如下:

(1)构建多种运动类型组成的训练数据集:

(1a)利用距离单元公式,计算窄带雷达观测场景中距离单元的总数nr;

(1b)利用目标运动轨迹的构建方法,构建10nr条训练目标的运动轨迹,将每一个训练目标每次被窄带雷达扫描时的坐标值,组成二维向量,作为当前时刻该训练目标的真实运动状态;

(1c)利用窄带雷达观测方程,生成对应于每一个训练目标的真实运动状态的窄带雷达观测值;

(1d)将所有训练目标的真实运动状态与相应的窄带雷达观测值组成训练数据集;

(2)构建深度长短期记忆网络:

(2a)搭建一个由滤波网络和预测网络组成的深度长短期记忆网络,每一个网络的结构均为8层,其结构依次为:输入层→含有6个隐藏层的长短期记忆网络→输出层;

(2b)设置每一个网络各层参数如下:

将输入层设置为2×16的全连接层;

将长短期记忆网络的隐藏层数设置为6,输入单元的个数设置为16,隐单元的个数设置为256;

将输出层设置为256×2的全连接层;

(3)对训练集进行归一化处理:

(3a)用训练目标的真实运动状态除以窄带雷达观测的最远距离,得到归一化后的目标真实运动状态;

(3b)用窄带雷达观测训练目标的径向距离除以窄带雷达观测的最远距离,得到归一化后的窄带雷达观测训练目标的径向距离;用窄带雷达观测训练目标的方位角除以窄带雷达观测的最大方位角,得到归一化后的窄带雷达观测训练目标的方位角;

(4)训练深度长短期记忆网络:

(4a)将归一化后的训练集中径向距离观测值与方位角观测值,分别输入到深度长短期记忆网络中得到网络的实际输出值,将归一化后的训练集中实际运动状态作为深度长短期记忆网络的期望输出值;

(4b)将深度长短期记忆网络的实际输出值与期望输出值,组成滤波网络和预测网络的代价函数;

(4c)使用最小批梯度下降法,训练深度长短期记忆网络,调整梯度下降法中梯度更新的步长,直到滤波网络和预测网络的代价函数均趋于不变,得到训练好的深度长短期记忆网络;

(5)窄带雷达目标跟踪:

(5a)用窄带雷达对待跟踪目标径向距离的观测值,除以窄带雷达观测的最远距离,得到归一化后的窄带雷达观测待跟踪目标的径向距离;用窄带雷达对待跟踪目标方位角的观测值,除以窄带雷达观测的最大方位角,得到归一化后的窄带雷达观测待跟踪目标的方位角;

(5b)将归一化后待跟踪目标的径向距离和方位角,输入训练好的深度长短期记忆网络,得到相应的归一化后待跟踪目标位置的滤波值和预测值;

(5c)用窄带雷达观测的最远距离,分别乘以归一化后待跟踪目标位置的滤波值和预测值,得到待跟踪目标位置的滤波值和预测值,完成窄带雷达目标跟踪。

发明与现有的技术相比具有以下优点:

第一,由于本发明构建多种运动类型组成的训练数据集,克服了现有技术中只能跟踪预先假设的单个运动类型,目标实际运动类型与其不同则容易发生滤波器失配、丢失目标的问题,使得本发明能够更有效地适用于不同运动类型目标的跟踪。

第二,由于本发明构建深度长短期记忆网络,克服了现有技术中采用多模型方法跟踪目标运动特性发生变化时,用于近似目标实际运动的多个模型近似误差会增大,使得跟踪滤波误差增大的问题,使得本发明能够适用于机动目标的跟踪,提高了滤波精度。

附图说明

图1为本发明的流程图;

图2为本发明深度长短期记忆网络的结构示意图;

图3为本发明的仿真图。

具体实施方式

下面结合附图对本发明做进一步的描述。

参照图1,对本发明的具体步骤做进一步的描述。

步骤1,构建多种运动类型组成的训练数据集。

利用距离单元公式,计算窄带雷达观测场景中距离单元的总数nr。

所述距离单元公式如下:

其中,nr表示窄带雷达观测场景中距离单元的总数,c表示光速,b表示窄带雷达发射信号的带宽,δρ表示窄带雷达观测的距离范围,δθ表示窄带雷达观测的方位角范围,θ3db表示窄带雷达发射信号的3db波瓣宽度。

利用目标运动轨迹的构建方法,构建10nr条训练目标的运动轨迹,将每一个训练目标每次被窄带雷达扫描时的坐标值,组成二维向量,作为当前时刻该训练目标的真实运动状态。

所述目标运动轨迹的构建方法的步骤如下:

第1步,在待跟踪的目标运动类型中随机选择训练目标的运动类型。

第2步,在窄带雷达扫描范围内,随机设定训练目标运动的初始位置。

第3步,根据待跟踪目标的机动特性,设定训练目标运动的过程噪声的方差。

第4步,若训练目标运动为匀速运动,在待跟踪目标运动速度范围内随机选择其运动速度,若训练目标运动为匀变速运动,在待跟踪目标运动加速度范围内随机选择其加速度,若训练目标运动为协同转弯运动,在待跟踪目标运动转弯率范围内随机选择其转弯率。

第5步,根据不同运动类型的状态转移方程,仿真训练目标的真实运动状态。

利用窄带雷达观测方程,生成对应于每一个训练目标的真实运动状态的窄带雷达观测值。

所述窄带雷达观测方程如下:

ρm=ρt+ερ

θm=θt+εθ

其中,ρm表示窄带雷达观测训练目标的径向距离,ρt表示训练目标真实的径向距离,ερ表示窄带雷达观测训练目标的径向距离的观测噪声,θm表示窄带雷达观测训练目标的方位角,θt表示训练目标真实的方位角,εθ表示窄带雷达观测训练目标方位角的观测噪声。

将所有训练目标的真实运动状态与相应的窄带雷达观测值组成训练数据集。

步骤2,构建深度长短期记忆网络。

搭建一个由滤波网络和预测网络组成的深度长短期记忆网络,每一个网络的结构均为8层,其结构依次为:输入层→含有6个隐藏层的长短期记忆网络→输出层。

设置每一个网络各层参数如下:

将输入层设置为2×16的全连接层。

将长短期记忆网络的隐藏层数设置为6,输入单元的个数设置为16,隐单元的个数设置为256。

将输出层设置为256×2的全连接层。

参照图2,对深度长短期记忆网络的结构做进一步的描述。

图2中的分别表示k-1时刻滤波网络中长短期记忆网络的隐状态和单元状态,zk-1表示第k-1次窄带雷达对目标的观测,分别表示k-1时刻滤波网络中长短期记忆网络的隐状态和单元状态,表示输入训练集中窄带雷达对目标在第k-1次的观测值时滤波网络的输出,表示输入训练集中窄带雷达对目标在第k次的观测值时预测网络的输出。

步骤3,对训练集进行归一化处理。

用训练目标的真实运动状态除以窄带雷达观测的最远距离,得到归一化后的目标真实运动状态。

用窄带雷达观测训练目标的径向距离除以窄带雷达观测的最远距离,得到归一化后的窄带雷达观测训练目标的径向距离;用窄带雷达观测训练目标的方位角除以窄带雷达观测的最大方位角,得到归一化后的窄带雷达观测训练目标的方位角。

步骤4,训练深度长短期记忆网络。

将归一化后的训练集中径向距离观测值与方位角观测值,分别输入到深度长短期记忆网络中得到网络的实际输出值,将归一化后的训练集中实际运动状态作为深度长短期记忆网络的期望输出值。

将深度长短期记忆网络的实际输出值与期望输出值,组成滤波网络和预测网络的代价函数。

所述滤波网络和预测网络的代价函数分别如下:

其中,j(θf)表示滤波网络的代价函数,θf表示滤波网络中连接每一层网络的参数,其在训练滤波网络的过程中随着代价函数趋于不变而趋于最优,n表示训练集中目标的序号,k表示每一个目标被窄带雷达观测的序号,n表示训练集中目标的总数,σ表示求和操作,ln表示训练集中第n个轨迹包含的目标被窄带雷达观测的次数,表示训练集中第n个目标在第k次被窄带雷达观测时的真实状态,表示输入训练集中窄带雷达对第n个目标在第k次的观测值时滤波网络的输出,j(θp)表示预测网络的代价函数,θp表示预测网络中连接每一层网络的参数,其在训练预测网络的过程中随着代价函数趋于不变而趋于最优,表示输入训练集中窄带雷达对第n个目标在第k次的观测值时预测网络的输出。

使用最小批梯度下降法,训练深度长短期记忆网络,调整梯度下降法中梯度更新的步长,直到滤波网络和预测网络的代价函数均趋于不变,得到训练好的深度长短期记忆网络。

步骤5,窄带雷达目标跟踪。

用窄带雷达对待跟踪目标径向距离的观测值,除以窄带雷达观测的最远距离,得到归一化后的窄带雷达观测待跟踪目标的径向距离;用窄带雷达对待跟踪目标方位角的观测值,除以窄带雷达观测的最大方位角,得到归一化后的窄带雷达观测待跟踪目标的方位角。

将归一化后待跟踪目标位置的径向距离和方位角,输入训练好的深度长短期记忆网络,得到相应的归一化后待跟踪目标位置的滤波值和预测值。

用窄带雷达观测的最远距离,分别乘以归一化后待跟踪目标位置的滤波值和预测值,得到待跟踪目标位置的滤波值和预测值,完成窄带雷达目标跟踪。

下面结合仿真实验对本发明的效果做进一步说明。

1.仿真实验条件:

本发明仿真实验的硬件测试平台是:处理器为cpuxeone5-2643,主频为3.4ghz,内存64gb;软件平台为:ubuntu16.04lts,64位操作系统,python2.7。

2.仿真内容及仿真结果分析:

为证明深度长短期记忆网络方法可以同时实现对不同运动类型目标以及机动目标的跟踪,且能够获得更高的滤波精度,本发明的仿真实验采用本发明的方法深度长短期记忆网络和现有技术的交互多模型方法,分别针对做匀速运动和机动的目标进行了跟踪的仿真实验。

本发明的仿真实验训练目标为民航飞机,其所做的运动主要为匀速运动、匀加速运动及协同转弯运动,窄带雷达的采样时间为10s,径向距离观测误差标准差为30m,方位角观测误差标准差为0.5°,窄带雷达观测径向距离范围为15km~150km,方位角范围为0~90°。在构建多种运动类型组成的训练数据集时,按照初速度为100m/s~300m/s,最大加速度30m/s2,最大转弯率4.5°/s产生训练目标的真实运动状态与窄带雷达观测。

在窄带雷达目标跟踪阶段,窄带雷达对匀速运动的目标和机动目标分别进行持续50步地跟踪。其中,匀速运动目标的起始位置为[30km,80km],运动速度为机动目标的起始位置为[30km,10km],初始速度为[0,150m/s]。在100s的匀速运动之后,目标按照[1.5m/s2,-1.5m/s2]的加速度做持续100s的匀加速运动,目标继续按照[150m/s,]0的速度匀速运动100s,然后按照1°/s的速度朝正北方向转弯,持续90s之后,最后以[0,150m/s]的速度继续做110s的匀速直线运动。

针对上述测试场景,分别使用传统的包含匀速运动类型和匀加速运动类型的交互多模型方法(interactivemultiplemodel,imm)和本发明方法,通过5000次蒙特卡洛结果,比较滤波后的结果。

图3(a)为本发明仿真实验中使用深度长短期记忆网络与交互多模型方法跟踪一个匀速运动目标时,滤波位置的均方误差的仿真结果对比图。图3(a)中x轴表示跟踪的步数,y轴表示两个方法关于目标位置滤波的均方误差。其中以实线标示的为采用现有技术交互多模型方法进行跟踪的滤波位置均方误差曲线,点划线标示的为采用本发明方法深度长短期记忆网络进行跟踪的滤波位置均方误差曲线。图3(a)中整个跟踪阶段本发明方法深度长短期记忆网络均可以获得比现有技术交互多模型方法更低的滤波位置均方误差。可以看出针对匀速运动目标本发明可以获得更高的滤波精度。

图3(b)为本发明仿真实验中使用深度长短期记忆网络与交互多模型方法跟踪一个机动目标时,滤波位置的均方误差的仿真结果对比图。图3(b)中x轴表示跟踪的步数,y轴表示两个方法关于目标位置滤波的均方误差。其中以实线标示的为采用现有技术交互多模型方法进行跟踪的滤波位置均方误差曲线,以点划线标示的为采用本发明方法深度长短期记忆网络进行跟踪的滤波位置均方误差曲线。图3(b)中在起始跟踪阶段本发明方法深度长短期记忆网络的滤波均方误差高于现有技术交互多模型方法,但是随着跟踪步数增加,滤波均方误差逐渐低于现有技术交互多模型方法。可见针对做机动的目标,本发明方法除了在起始阶段滤波不太稳定之外,仍可以获得更高的滤波精度,并且本发明方法对目标的机动不太敏感。

综合图3(a)和图3(b),本发明方法深度长短期记忆网络针对匀速运动目标和机动目标均能够实现相比于现有技术交互多模型方法更有效的跟踪,可以看出:本发明方法,能够适用于不同运动类型目标地跟踪,并且利用本发明方法深度长短期记忆网络获得的滤波精度更高,可以实现更有效地跟踪。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1