分布式mimo雷达目标定位的全连接网络结构选择方法
技术领域
1.本技术涉及信号处理技术领域,具体涉及分布式mimo雷达目标定位的全连接网络结构选择方法。
背景技术:2.目标定位问题是分布式多输入多输出(multiple input multiple out,mimo)雷达中一个非常重要的问题。在该类问题中,先通过本地的处理估计得到中间观测值,比如到达时间,到达时间差,或到达角,然后将该中间观测值送到融合中心得到目标物体的位置估计。虽然通过本地信号处理得到了中间观测值,但它与目标物体位置之间的映射依然比较复杂。
3.基于学习的方法能够在可控的复杂度内较好的拟合复杂的映射,但基于学习的方法的性能与神经网络的结构有较大的关系。
4.故,如何研究用于分布式mimo雷达目标定位的fcn结构设计方法是有必要的。
技术实现要素:5.针对背景技术的不足,本技术提供了解决上述问题的分布式mimo雷达目标定位的全连接网络结构选择方法。因mimo雷达目标定位的性能与全连接网络(fully connected network,fcn)结构有较强的关系,而学习的方法的性能与神经网络的结构有较大的关系。本技术采用机器学习中的fcn来完成目标定位。
6.本技术通过下述技术方案实现:
7.第一方面,本技术提供一种分布式mimo雷达目标定位的全连接网络结构选择方法,包括:
8.采集目标的回波信号并按信号采样值顺序排列成一列接收信号;
9.处理接收信号,计算每条信号路径的时延的极大似然估计;
10.整合所有路径的时延估计为一个估计向量,并基于所述估计向量采用fcn作为估计器得到最终的目标物体位置估计;
11.推导给定fcn,训练集,以及训练方法下的均方误差界并基于所述均方误差界,构建网络结构设计的优化问题;
12.采用遗传算法解决网络结构设计的优化问题得到最优fcn结构。
13.可选的,所述采集mimo雷达发射向目标的回波信号并按采样值顺序排列成一列接收信号,包括:
14.分布式mimo雷达系统的多个发射机发射至目标的发射信号,经目标后多个接收机接收,并依据接收信号的信号采样值按顺序排列成一列接收信号,其中,所述发射信号正交且经过时间后保持正交,所述一列接收信号包括路径下的目标物体反射系数、时间白和空间白的高斯噪声、发射信号功率和采用时间间隔。
15.可选的,所述训练集根据时延和位置的关系产生,所述训练集的收集过程,即构建
训练集的过程,包括:
16.选定一区域,对二维坐标系的两个维度分别进行间隔采样,对采样收集的数据进行处理,包括对时延处理至时延的每一个元素在范围[0,1]之内,对目标物体位置归一化处理至目标物体位置的每一个元素在范围[0,1]之内。
[0017]
可选的,所述推导给定fcn,训练集,以及训练方法下的均方误差界并基于所述均方误差界,构建网络结构设计的优化问题,包括:
[0018]
fcn的输入是归一化后的时延,输出经过线性变换得到最终的目标物体位置估计,在训练阶段采用mse作为损失函数,当训练迭代次数达到设定值时迭代停止,得到优化后的fcn网络参数。
[0019]
可选的,对于fcn,在给定训练集下的工作流程,包括:
[0020]
训练阶段:获取所述优化后的fcn网络参数;
[0021]
测试阶段:计算所述时延估计的分布,fcn的每一层的前向传播包含一个线性变换和一个激活函数,输出层向后经过线性变换后得到目标物体的位置估计,获取在给定位置的mseb,再通过mseb设计最优的fcn结构,在对fcn网络的深度和尺寸加以限制的条件下,设计最优的网络配置和深度,深度即fcn的隐藏层数目,获取构建网络结构设计的优化问题,即一个整数规划问题,再通过设计遗传算法来解决所述整数规划问题。
[0022]
可选的,所述采用遗传算法解决网络结构设计的优化问题得到最优fcn结构,包括:
[0023]
构建初始化种群,其中,种群代表了一堆fcn结构,其中的任意一个fcn被称为一个个体;
[0024]
计算初始种群中每个个体的适应度值;
[0025]
初始种群进行多次演化迭代后得到最优fcn结构,其中,每次迭代包含选择、交叉以及变异操作。
[0026]
第二方面,本技术还提供一种分布式mimo雷达目标定位的全连接网络结构选择装置,包括:
[0027]
采集模块,用于采集目标的回波信号并按信号采样值顺序排列成一列接收信号;
[0028]
计算模块,用于处理接收信号,计算每条信号路径的时延的极大似然估计;
[0029]
融合中心,用于整合所有路径的时延估计为一个估计向量,并基于所述估计向量采用fcn作为估计器得到最终的目标物体位置估计;
[0030]
优化问题构建模块,用于推导给定fcn,训练集,以及训练方法下的均方误差界并基于所述均方误差界,构建网络结构设计的优化问题;
[0031]
处理模块,用于采用遗传算法解决网络结构设计的优化问题得到最优fcn结构。
[0032]
第三方面,本技术提供一种电子设备,包括:处理器以及与所述处理器通信连接的存储器。
[0033]
存储器存储计算机执行指令;
[0034]
处理器执行存储器存储的计算机执行指令,处理器实现本技术第一方面任一项所述的方法。
[0035]
第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面任一项所
述的方法。
[0036]
第五方面,本技术提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器或芯片执行时实现如第一方面任一项所述的方法。
[0037]
本技术具有如下的优点和有益效果:
[0038]
本技术可以得到在固定fcn,训练集和训练方法时,该网络执行目标定位任务的mseb。基于mseb设计了ga算法,从理论的角度来选取最合适的fcn结构,本技术选取的fcn结构实现更好的估计性能。
附图说明
[0039]
此处所说明的附图用来提供对本技术实施例的进一步理解,构成本技术的一部分,并不构成对本技术实施例的限定。在附图中:
[0040]
图1是本技术实施例提供的fcn示意图。
[0041]
图2是本技术实施例提供的ga算法的编码示意图。
[0042]
图3是本技术实施例提供的基于ga设计的不同结构的fcn的估计性能图。
[0043]
图4是本技术实施例提供的方法流程图。
具体实施方式
[0044]
在对本技术的任意实施例进行详细的描述之前,应该理解本技术的应用不局限于下面的说明或附图中所示的结构的细节。本技术可采用其它的实施例,并且可以以各种方式被实施或被执行。基于本技术中的实施例,本领域普通技术人员在没有做出创造性改进前提下所获得的所有其它实施例,均属于本技术保护的范围。
[0045]
为了方便描述,首先进行如下定义:
[0046]
()
t
为转置,()h为共轭转置,re{
·
}为取实部,
⊙
为哈达玛积,ε{
·
}为取期望,i表示单位矩阵,[
·
]i表示向量的第i个元素,[
·
]
i,j
表示矩阵的第(i,j)个元素,||
·
||2代表l2范数,||
·
||0代表l0范数。
[0047]
本技术提供一种分布式mimo雷达目标定位的全连接网络结构选择方法,如图4所示,包括如下步骤:
[0048]
步骤1:将分布式mimo雷达系统第n个接收机接收到的由第m个发射机贡献的信号采样值按顺序排列成一列,构成接收信号r
nm
;
[0049]rnm
=[r
nm
[1],...,r
nm
[k]]
t
[0050]
=u
nm
+w
nm
,
[0051]
其中,
[0052][0053]unm
=[u
nm
[1],...,u
nm
[k]]
t
[0054]wnm
=[w
nm
[1],...,w
nm
[k]]
t
[0055][0056]
分布式mimo雷达系统发射天线的个数为m,接收天线的个数为n,且每个天线之间
的距离很远;第m个发射天线的坐标是(x
tm
,y
tm
),第n个接收天线的坐标是(x
rn
,y
rn
);一个静止的目标物体位于(x,y),该位置未知;第m个发射天线的发射信号在kts时刻的采样值为其中e为总的发射信号功率,ts为采样时间间隔,k是采样数字,sm表示发射信号;第m个发射天线和目标物体的距离为d
tm
,第n个接收天线和目标物体的距离为d
rn
;τ
nm
代表第(n,m)条路径的时延,ζ
nm
代表该路径的目标物体反射系数,假设其已知;w
nm
[k]表示时间白和空间白的高斯噪声,且其方差已知;定义未知参数向量θ=[x,y]
t
;
[0057]
步骤2:在本地得到每条路径时延的极大似然估计
[0058]
步骤3:融合中心将所有路径的时延估计整合成一个向量并基于该估计向量得到最终的目标物体位置估计使用fcn作为融合中心的估计器来完成目标物体位置估计;
[0059]
步骤4:推导给定fcn,训练集,以及训练方法下的均方误差界(mean square error bound,mseb);
[0060]
步骤5:基于mseb,构建网络结构设计的优化问题;
[0061]
步骤6:用遗传算法(genetic algorithm,ga)来解决网络结构设计的优化问题;首先构建初始化种群;
[0062]
步骤7:计算初始种群中每个个体的适应度值;
[0063]
步骤8:初始种群进行多次演化迭代后得到最优fcn结构,其中,每次迭代包含选择、交叉以及变异操作。
[0064]
实施例1:
[0065]
考虑一个有m个发射天线和n个接收天线的分布式mimo雷达系统,其中,第m(m=1,...,m)个雷达发射天线在一个二维的笛卡尔坐标中位于(x
tm
,y
tm
),第n(n=1,...,n)个雷达接收天线位于(x
rn
,y
rn
)。第m个雷达发射天线的发射信号在kts时刻的采样值为其中,e为总的发射信号能量,ts为采样间隔。假设一个静止的目标物体位于(x,y)。为了简化分析,假设发射信号是正交的而且在经过时延之后依然保持正交。那么,在kts时刻第n个接收天线接收到的由第m个发射端贡献的信号为
[0066][0067]
且接收信号向量为
[0068][0069]
其中
[0070]unm
=[u
nm
[1],...,u
nm
[k]]
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0071]wnm
=[w
nm
[1],...,w
nm
[k]]
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0072]
[0073]
假设杂波加噪声w
nm
[k]为时间白和空间白的零均值复高斯分布且方差已知为即因此,τ
nm
表示第(n,m)条路径的时延。为了简便,假设目标物体反射系数ζ
nm
是已知的。定义位置参数向量
[0074]
θ=[x,y]
t
ꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0075]
通过本地信号处理,可以得到每条路径时延的极大似然估计融合中心将所有路径的时延估计融合成一个向量
[0076][0077]
并基于该向量来完成目标物体位置估计。采用神经网络中最为基础的fcn作为融合中心的估计器来得到目标物体的位置估计
[0078]
神经网络的良好性能得益于训练阶段的数据。因此,需要构建训练集。出于简化mseb推导的考虑,构建不含噪声的训练集。训练数据根据时延和位置的如下关系直接产生:
[0079][0080]
训练数据收集过程如下:针对一个感兴趣的区域g={(x,y)|x∈[x
min
,x
max
],y∈[y
min
,y
max
]},在x轴和y轴分别以δ
x
和δy为间隔进行采样。对于第i个位置对应的时延为s
tr
为训练数据数目。考虑到时延和目标物体位置的数量级差别太大,直接作为训练数据效果不理想,因此对收集的数据进行如下处理:对于时延将其乘以一个常数ctst
l
使得它的每一个元素在范围[0,1]之内,即
[0081][0082]
t
l
是发射信号的脉冲宽度。对于目标物体位置使用机器学习中的归一化来使其每一个元素在范围[0,1]之内,即
[0083][0084]
其中
[0085][0086]
α=[x
min
,y
min
]
t
ꢀꢀꢀꢀꢀꢀꢀ
(12)
[0087]
因此,训练集可以写为其中是第i个训练数据,是其对应的标签。
[0088]
fcn可以看作一个参数方程f
φ
:h0→hl+1
,其中,φ代表所有可训练参数的集合,是y0×
1的实输入向量,是y
l+1
×
1的实输出向量,l是隐藏层的层数。神经网络的输入是神经网络第l层的前向传播可以写成以下形式
[0089]zl
=w
lhl-1
+b
l
,h
l
=ρ
l
(z
l
)
ꢀꢀꢀꢀꢀꢀꢀ
(13)
[0090]
其中ρ
l
(
·
)是激活函数,隐藏层使用的是非线性激活函数,输出层用的是线性激活函数。w
l
和b
l
是第l层的权重矩阵和偏置向量,整个fcn的待训练参数可以写为
[0091][0092]
vec{
·
}代表向量化操作,
[0093][0094]
是fcn待训练参数的总数。神经网络的输出为基于该输出,可以通过如下线性变换得到最终的目标物体位置估计
[0095][0096]
在训练阶段,使用mse作为损失函数
[0097][0098]
其中,是第i个训练数据样本对应的fcn的输出,是其对应的标签。网络可训练参数的第d次迭代为
[0099][0100]
其中,ω{
·
}代表了优化器函数,为训练损失对φ的梯度在φ=φ(
d-1
)处的取值,η是优化器的内部参数;当训练迭代次数达到设定值d时迭代停止,此时,损失函数应当小于一个预先设置的值δ,此时得到优化后的fcn网络参数
[0101][0102]
接下来给出给定神经网络,训练集以及训练方法下的mseb推导过程。神经网络的工作流程包括了训练和测试两个阶段。在训练阶段,由于使用的是无噪声的训练数据,所以可以直接得到训练后的优化参数φ
*
。
[0103]
在测试阶段,首先需要得到输入的分布。时延估计在高信杂噪比(signal-to-clutter-plus-noise ratio,scnr)假设下是一个服从高斯分布的渐近无偏估计量,且它的方差渐近于如下的克拉美罗界(cramer-rao bound,crb):
[0104][0105]
其中,re{
·
}代表取实部操作。因此,可以得到的分布其中,
[0106]
是的crb矩阵,它的第(i,j)个元素为
[0107][0108]
测试阶段只包含前向传播,每一层的前向传播包含一个线性变换和一个激活函
数。把z
l
的均值和方差记为和把h
l
的均值和方差记为和特别的,输入层的均值和方差为
[0109][0110][0111]
对隐藏层来说,z
l
的均值和方差为
[0112][0113][0114]hl
的均值和方差为
[0115][0116][0117]
其中,
⊙
表示哈达玛积。由于输出层使用的是线性激活函数,所以它的均值和方差为
[0118][0119][0120]
输出经过线性变换后得到目标物体的位置估计,因此可以得到的均值和方差如下
[0121][0122][0123]
因此,可以得到在某一给定位置下的mseb为
[0124][0125]
考虑到初始化方法是随机的而且目标物体位置会在感兴趣的范围内出现,对
[0126]
初始化方法和目标物体位置做积分,可以得到如下的mseb表达式
[0127][0128]
其中,p(φ
(0)
)代表初始化方法的概率密度函数,p(θ)是区域g内的均匀分布。
[0129]
接下来,考虑使用(33)中的mseb来设计最优的fcn结构。为了方便,首先定义和fcn结构有关的一些量,把fcn的隐藏层的数目l定义为网络的深度,把
[0130][0131]
定义为网络的尺寸,把
[0132][0133]
定义为网络的配置。考虑到mseb是网络各个参数的函数,而主要关心的是网络的结构设计问题,因此,把(33)中的mseb写为mseb(y,l)来突出需要优化的变量。考虑到fcn的输入和输出维度已经固定,只针对隐藏层进行结构设计,即设计fcn的隐藏层的层数和每层的节点数目的任务是:在对网络的深度和尺寸加以限制的条件下,设计最优的网络配置y
opt
和深度l
opt
,它可以整理为以下的优化问题
[0134][0135]
其中,y
max
是尺寸的上界,l
max
是深度的上界。
[0136]
考虑到(36)式中的优化问题是一个整数规划问题,设计ga来解决该问题。ga通过种群的多次迭代演化得到最优解。在该问题中,种群代表了一堆fcn结构,其中的任意一个fcn被称为一个个体。首先,采用固定长度的编码方式对每个个体进行编码。如图2所示,对于一个满足(36)式中条件的fcn,它可以由一个l
max
×
1的实值向量进行编码,其中,p的前l各元素为fcn隐藏层的结点数,其余的元素为0,即
[0137][0138]
经过编码后,将(36)中的优化问题p1重新整理为如下的形式:
[0139][0140]
每个个体都对应着一个适应度值。一个个体的适应度值越高,代表这个个体性能越好而且存活的概率越大。因此,将负的mseb设置为该问题的适应度函数。
[0141]
在算法1中给出了基于mseb的用于解决网络结构设计的ga算法。首先,这个算法随机生成了z个个体作为初始种群(第1行)。然后,计算出了初始种群中每个个体的适应度(第2行)。之后,初始种群经过t代的进化过程(第3-15行),最终返回最优的个体。
[0142]
在进化过程中,先初始化一个空集d
t
用于囊括产生的子代(第5行),这些子代是由选中的父代通过交叉和变异操作产生的(第6-10行)。接着,d
t
中不符合尺寸约束的个体被
移除(第11行)。在计算完d
t
中每个个体的适应度之后(第12行),通过环境选择操作从p
t
∪d
t
中选择个体作为新一代的种群p
t+1
(第13行)。第6行中的|
·
|代表集合的势。
[0143][0144]
本技术的工作原理
[0145]
1.算法1中初始化群体p0的产生方式
[0146]
[0147][0148]
2.算法1中的选择、交叉和变异操作
[0149]
1)选择操作:使用常用的二元锦标赛法来完成选择操作,即随机从种群中选择两个个体,并把适应度值高的那个保留下来作为父个体。重复上述过程,可以得到另一个父个体。
[0150]
2)交叉操作
[0151][0152][0153]
3)变异操作
[0154]
[0155][0156]
其中,{
·
}/a代表从集合{
·
}中去除元素a。
[0157]
3.算法1中的环境选择操作
[0158][0159][0160]
4.通过仿真验证所提网络结构设计方法的有效性。其中仿真参数设置如下:
[0161]
分布式mimo雷达的发射天线和接收天线均距离原点70km。发射的信号如下
[0162][0163]
其中,f
δ
是相邻发射信号之间的频率补偿。设置f
δ
=500hz且t
l
=0.01s。scnr的定义如下:在仿真中将设为0.01。
[0164]
训练数据的采样区域为g={(x,y)|x∈[2.5,12.75]km,y∈[1.2,11.2]km},在该区域内,以δ
x
=250m为间隔对x轴进行采样,以δy=200m为间隔对y轴进行采样。因此,训练集总共包含s
tr
=502=2500个训练数据。对于测试集,考虑的信噪比范围是-5db到30db,在每一个信噪比下,在区域g内考虑了10个目标物体。隐藏层使用的激活函数是双曲正切激活函数(tanh),训练时使用的优化器为adam优化器,训练的迭代次数为100次。
[0165]
在图3中,研究了结构对fcn估计性能的影响,其中,fcn深度的上界设为l
max
=3,网络尺寸的上界设为y
max
=16。由ga得到fcn的最好和最差结构,其中,种群数目为z=30,最大
代数t=30,交叉概率pc=0.9,变异概率pm=0.2。发现ga算法选出的最优结构的性能(mseb:optimal structure,ga)接近于最优性能(smse:mle)。此外,还给出了最差结构的性能(mseb:worst structure,ga)。用两个尺寸为y=16及深度为l=3的fcn为具体例子来说明结构对性能的影响,其中一个fcn的配置为y=[8,4,4],记作fcn1,另一个fcn的配置为y=[8,1,7],记作fcn2。从图中可以看到fcn1的性能(smse:fcn1)接近于最优结构的性能,且在高scnr的情况下对应的mseb(mseb:fcn1)是一个紧的下界。作为对比,fcn2的估计性能(smse:fcn2)很不理想,接近于最差结构的性能,同样的,在高scnr区域,其mseb(mseb:fcn2)是一个紧的下界。
[0166]
通过这个例子可以得到以下几个结论:mseb在高scnr的情况下是一个紧的下界,所以它可以被用来指导网络结构设计。此外,fcn的性能会受到结构的影响,而所设计的ga算法能够有效的选出接近于最优性能的网络结构。
[0167]
以上所述的具体实施方式,对本技术的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本技术的具体实施方式而已,并不用于限定本技术的保护范围,凡在本技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。