一种抑制毫米波通信系统中波束漂移效应的自适应波束宽度调制算法

文档序号:26749342发布日期:2021-09-25 01:57阅读:187来源:国知局
一种抑制毫米波通信系统中波束漂移效应的自适应波束宽度调制算法

1.本发明属于无线通信领域,具体涉及抑制毫米波通信系统中波束漂移效应的自适应波束宽度调制算法。


背景技术:

2.随着技术的不断革新,无线通信的传输速率已取得重大突破,中国商用5g虽然仍使用6ghz以下频段,但是用户体验速率已经可以达到百兆级别,峰值速率突破gbps;相比于6ghz以下rf1频段,毫米波频段rf2具有丰富的频谱资源,可以满足爆炸式增长的接入需求。毫米波通信具有如下特点:带宽高,通常有1

2ghz连续可用的频谱资源;自由空间路径损耗高,且在物体周围绕射的能力较小;方向性强,安全性高,由于高路径损耗,需要在发射机或接收机处进行波束成形以提高信噪比(snr);阵列天线集成度高,因为阵列天线阵源之间的空间距离与波长成反比。
3.为了获得较高的信噪比,波束成形后的主波束方向需要与用户对准,即需要波束训练来保证发射机主波束跟踪移动中的接收机。典型的设计方案是在一个时隙内先进行波束训练,获得较高的增益后,再在该时隙内传输数据。但是当接收机在移动时,其偏离角(aod)或到达角(aoa)总是连续变化,而波束切换在时间上是离散的,即使在波束训练后发射与接收主波束对准,在该时隙内接收机也会因移动与发射机波束中心角发生偏移,导致波束形成/阵列增益降低,严重时会影响通信链路的质量,此现象称为波束漂移效应。
4.一般情况下,应使用窄(甚至最窄)波束进行数据传输,以实现较高的波束成形增益。但是,从波束训练的角度出发,窄波束会增加波束训练时搜索空间的大小以及由此产生的训练开销。此外,波束漂移效应也对波束成形增益产生负面影响,一旦环境迅速变化,这一点就特别明显。波束漂移效应意味着需要在波束成形增益和数据传输的有效时间之间进行权衡,尽管可以通过减少每个时隙的长度来减轻波束漂移效应,但也因此增加了波束训练的开销,降低了有效可到达率性能。


技术实现要素:

5.为了抑制波束漂移效应并提高系统性能,本发明提出了一种自适应波束宽度调制算法,以实现有效地抑制毫米波通信系统中的波束漂移效应。该方案减缓毫米波通信中波束漂移的影响,保证在整个通信过程中均能获得较高的通信链路质量,提高毫米波通信系统的吞吐量。
6.为实现本发明的目的,本发明所采用的技术方案是:一种抑制毫米波通信系统中波束漂移效应的自适应波束宽度调制算法,包括如下步骤:
7.步骤(1):将波束宽度调制问题建模为基于上下文的在线优化选择问题,模型由全连接神经网络和bayes线性回归组成,bayes决策中的每个选项对应不同的波束宽度,依据感知的信道环境变化快慢,通过bayes方法选择数据传输的最佳波束宽度;
8.步骤(2):初始化模型中的参数,包括神经网络权重与偏置、bayes线性回归先验分布、数据传输波束初始宽度、时间单元计数,并清空存储空间;
9.步骤(3):在每个时间单元初始步,构造相应的通信环境上下文,通过神经网络提取非线性特征,采用bayes线性决策确定当前最佳数据传输波束宽度,并基于波束训练结果,选择最佳数据传输码字;
10.步骤(4):接收外部环境回报,基于收集的信息更新bayes线性回归所使用的后验分布及样本集,当满足一定条件时,即每隔一定时间(由算法输入参数决定),更新用于提取非线性特征的神经网络的参数。
11.整个算法流程如图1所示,循环执行步骤(3)和步骤(4)。
12.步骤(1)中,不同的波束宽度是通过多分辨率码书实现的,每个子码书由一组波束主瓣宽度相等、波束主瓣方向角等距分布的波束组成。自适应波束宽度调制的本质是根据环境变化的快慢自适应地选择最优的波束宽度进行数据传输,以获得最优的系统性能。由于基于bayes学习设计算法,自适应波束宽度调制问题转化为基于通信环境上下文选择不同波束宽度对应的子码书。
13.bayes学习随机选择模型是基于上下文(context)的bandit模型,其核心是定义行动空间、回报函数、通信环境上下文、预测模型、bayes先验后验分布。假设最小时间单位为时隙,每k个时隙定义为一个时间单元,即每个时间单元包括k个时隙。
14.(1.1)定义行动空间与回报函数:假设多分辨率码书对应的行动空间定义为回报函数定义为k个时隙的和速率,即
[0015][0016]
其中,r
u,i
表示第u个时间单元中第i个时隙对应的传输速率。
[0017]
(1.2)定义通信环境上下文,第u个时间单元的通信环境上下文x
u
定义为
[0018][0019]
其中,h
u,i
,p
u,i
和g
u,i
分别表示第u个时间单元中第i个时隙对应的等效信道系数、波束训练开销、发送功率和波束形成/阵列增益。
[0020]
(1.3)定义预测模型,考虑到实际通信环境非常复杂且随机变化,本发明考虑联合使用神经网络及bayes线性回归模型建立预测模型。如图2所示,在神经网络最后一层执行bayes线性回归,相应地bayes线性回归的回报预测值为r,由下式给出:
[0021]
r=ω
t
f
x

ꢀꢀꢀ
(3)
[0022]
其中f
x
=f(x)为通信环境上下文x通过神经网络的输出,ε服从均值为0、方差为σ2的正态分布,即ω为bayes线性回归系数向量。
[0023]
(1.4)定义bayes先验后验分布,bayes学习需要为行动空间中的每个选项a定义参数的先验和后验分布。为了能够获得解析的后验分布表达式,避免复杂的后验采样等操作,进而降低算法的复杂度,选项a的先验分布定义如下:
[0024][0025]
其中,igam(x|p,q)表示逆伽玛分布,p和q分别表示形状参数和比例参数,参数m0,s0分别表示均值矢量和方差矢量,m0,s0,p0>0,q0>0均为常数,需要适当地初始化。相应地,后验分布解析表达式为:
[0026][0027]
其中,参数和更新公式如下:
[0028][0029]
其中,(
·
)
t
表示矢量转置运算,是选项a积累的经验,存储于对应的子空间中,l
a
表示选项a对应的经验样本集大小,分别表示选项a作为最佳选项时神经网络的输出和回报值。
[0030]
步骤(2):初始化模型中的参数,包括神经网络权重与偏置、bayes线性回归先验分布、数据传输波束初始宽度、时间单元计数,并清空存储空间;
[0031]
(2.1)初始化网络权重与偏置、行动空间中每个选择对应的bayes先验分布,bayes先验分布如公式(4)所示。在初始化时,所有选项对应的bayes先验分布是相同的,之后通过不断积累的样本集来更新bayes后验分布和网络参数。
[0032]
(2.2)初始化时间单元计数,令u=1,随机选择数据传输的波束初始宽度,并将存储空间置空。存储空间由每个选项对应的的子空间组成,存储历史经验信息,包括在时间单元u下的通信环境上下文x
u
、最佳选项及相应的外部回报值r
u
,用于训练网络参数和更新bayes后验分布。
[0033]
步骤(3):在每个时间单元初始步,构造相应的通信环境上下文,通过神经网络提取非线性特征,采用bayes线性决策确定当前最佳数据传输波束宽度,并基于波束训练结果,选择最佳数据传输码字;
[0034]
在步骤(3)中,对于时间单元u,按序执行如下步骤:
[0035]
(3.1)根据公式(2)构造通信环境上下文x
u
[0036]
(3.2)计算x
u
通过神经网络的非线性特征输出
[0037]
(3.3)根据行动空间中每个选项a对应的bayes后验分布,采样生成参数
[0038]
(3.4)计算最佳(3.4)计算最佳
[0039]
(3.5)选择最佳对应的数据传输子码书
[0040]
(3.6)选择中最佳码字用于数据传输
[0041]
对于步骤(3.6),在确定最佳对应的子码书后,数据传输还需要选择中的码字,记其中f
i
表示第i个码字,n
a
表示子码书的大小。每个码字f
i
对应的波束中心角为φ
i
,而波束训练得到的最佳方向角为φ0,则最佳数据传输码字为:
[0042][0043]
步骤(4):接收外部环境回报,基于收集的信息更新bayes线性回归所使用的后验分布及样本集,当满足一定条件时,更新用于提取非线性特征的神经网络的参数。
[0044]
在步骤(4)中,对于时间单元u,按序执行如下步骤:
[0045]
(4.1)接收外部环境的回报值r
u
[0046]
(4.2)根据公式(5)(6)更新后验分布,将更新为
[0047]
(4.3)更新存储空间,保存最新的经验信息
[0048]
(4.4)如果u mod f==0,反向传播更新神经网络的权重和偏置
[0049]
(4.5)更新计数器u

u+1
[0050]
对于步骤(4.2),需要得到u+1时间单元所有选项a对应的bayes后验分布除了最佳选项对应的概率分布需要更新,其他行动概率分布保持不变。
[0051]
对于步骤(4.4),f为输入参数,表示每隔f个时间单元对神经网络的权重与偏置进行更新。对于行动空间中每个选项a,都有如下训练集:
[0052][0053]
其中分别表示选项a对应的第i个输入通信环境上下文及相应的输出回报值。由于回报值r不仅取决于神经网络,还与bayes线性回归相关,因此线性回归模型中参数ω的作用不可忽略。考虑到回报值r与神经网络的输出f
x
是线性关系,可以将线性回归模型附加到神经网络最后,作为神经网络额外的线性层,并与原先的神经网络一起训练。当神经网络和新的线性层训练结束后,更新每个选项a对应的神经网络输出,即:
[0054][0055]
其中f

表示训练后的神经网络映射/函数。
[0056]
相对于现有技术,本发明的优点如下:
[0057]
1)在更小的时间尺度内考虑信道方向角(即到达角或分离角)的变化速率,通过感知信道方向角的变化快慢,自适应调整数据传输的波束宽度,以保证通信链路质量;
[0058]
2)以机器学习相应的算法处理复杂且随机变化的实际通信环境,通过神经网络提取非线性特征,并以bayes决策确定最佳数据传输波束宽度,该方法既具有一定的实时性,
又能够获得较高的信噪比;
[0059]
3)可以在波束成形增益和数据传输的有效时间之间进行权衡,其有效可达速率性能均大于任何固定的子码本的有效可达速率性能,尤其在快速变化的环境中优势更明显,可以有效减轻波束漂移效应。
附图说明
[0060]
图1为自适应波束宽度调制算法流程图;
[0061]
图2为联合神经网络与bayes线性回归模型的预测模型示意图;
[0062]
图3为使用的多分辨率分层码书示意图;
[0063]
图4为有效可达速率性能示意图。
具体实施方式
[0064]
为了使本技术的技术方案和优点更加明白清楚,以下结合实施例及软件仿真,对本技术进行进一步详细说明。
[0065]
为了抑制毫米波系统中波束漂移效应,在更小的时间尺度即小于波束训练的时间尺度内考虑信道方向角的变化速率,通过感知信道方向角的变化快慢调整数据传输波束宽度,以保证在整个通信过程中,接收端的信噪比或通信链路质量均较高。
[0066]
在具体解决问题时,将波束宽度调制问题建模为基于上下文的bayes学习随机选择模型,其中每个选项对应不同的波束宽度,可以通过多分辨率码书实现,其中每个子码书中波束的主瓣宽度相同,不同子码书中各个波束的主瓣宽度不同,设计目标是根据信道环境变化的快慢选择相应的子码书,并基于波束训练的结果,选择该子码书中的最佳码字进行数据传输。
[0067]
1.模型建立
[0068]
在bayes学习模型中,首先需要定义行动空间、回报函数、通信环境上下文、预测模型、bayes先验后验分布,其次需要在所确定的子码书中选择最佳码字,最后还需要维护模型中参数的更新。假设最小时间单位为时隙,每k个时隙定义为一个时间单元,即每个时间单元包括k个时隙。
[0069]
定义行动空间与回报函数:假设采用的多分辨率码书定义为相应的行动空间为回报函数定义为k个时隙的和速率,即
[0070][0071]
其中,r
u,i
表示第u个时间单元中第i个时隙对应的传输速率。
[0072]
定义通信环境上下文,第u个时间单元的通信环境上下文x
u
定义为
[0073][0074]
其中,h
u,i
,p
u,i
和g
u,i
分别表示第u个时间单元中第i个时隙对应的等效信道系数、波束训练开销、发送功率和波束形成/阵列增益。
[0075]
定义预测模型,如图2所示,联合使用神经网络及bayes线性回归建立预测模型,在
神经网络最后一层执行bayes线性回归,相应地bayes线性回归的回报预测值为r,由下式给出:
[0076]
r=ω
t
f
x

ꢀꢀꢀ
(3)
[0077]
其中f
x
=f(x)为通信环境上下文x通过神经网络的输出,ε服从均值为0、方差为σ2的正态分布,即ω为bayes线性回归系数向量。
[0078]
定义bayes先验后验分布,图2表明行动空间中的每个选项都对应一个bayes线性回归单元,因此需要为行动空间中的每个选项a定义参数的先验和后验分布。为了能够获得解析的后验分布表达式,避免复杂的后验采样等操作,选项a的先验分布定义如下:
[0079][0080]
其中,igam(x|p,q)表示逆伽玛分布,p和q分别表示形状参数和比例参数,参数m0,s0分别表示均值矢量和方差矢量,m0,s0,p0>0,q0>0均为常数,需要适当地初始化。相应地,后验分布解析表达式为:
[0081][0082]
其中,参数和更新公式如下:
[0083][0084]
其中,(
·
)
t
表示矢量转置运算,是选项a积累的经验,存储于对应的子空间中,l
a
表示选项a对应的经验样本集大小,分别表示选项a作为最佳选项时神经网络的输出和回报值。
[0085]
选择最佳数据传输码字,在确定最佳波束宽度对应的子码书后,数据传输还需要选择中的码字。记其中f
i
表示第i个码字,n
a
表示子码书的大小。每个码字f
i
对应的波束中心角为φ
i
,而波束训练得到的最佳方向角为φ0,则最佳数据传输码字为:
[0086][0087]
神经网络参数更新,对于行动空间中每个选项a,有训练集:
[0088][0089]
其中分别表示选项a对应的第i个输入通信环境上下文及相应的输出回报值。网络训练时,将线性回归模型附加到神经网络最后,作为神经网络额外的线性层,并与原先的神经网络一起训练。当神经网络和新的线性层训练结束后,更新每个选项a对应的神经网络输出,即:
[0090][0091]
其中f

表示训练后的神经网络映射/函数。
[0092]
2.自适应波束宽度调制算法实现
[0093]
输入:多分辨率码书行动空间网络更新频率参数f。
[0094]
初始化:给定参数m0,s0,p0,q0,并生成每个选项a对应的先验分布初始化神经网络的权重和偏置,清空存储空间,起始数据传输子码书为令时间单元计数u=1。
[0095]
循环体:对每个时间单元u,重复执行以下步骤:
[0096]
(1)根据公式(2)构造通信环境上下文x
u
[0097]
(2)计算x
u
通过神经网络的非线性特征输出
[0098]
(3)根据行动空间中每个选项a对应的bayes后验分布,采样生成参数
[0099]
(4)计算最佳最佳
[0100]
(5)选择最佳对应的数据传输子码书
[0101]
(6)根据公式(7)确定中用于数据传输的最佳码字
[0102]
(7)接收外部环境的回报值r
u
[0103]
(8)根据公式(5)(6)更新后验分布,将更新为
[0104]
(9)更新存储空间,保存最新的经验信息
[0105]
(10)如果u mod f==0,反向传播更新神经网络的权重和偏置
[0106]
(11)更新计数器u

u+1
[0107]
3.仿真环境与结果
[0108]
仿真时采用如下环境:
[0109]
1)均匀线性阵列天线,阵源数n=64。
[0110]
2)考虑如图3所示的多分辨率码书,码书包括6个子码书其大小分别为2、4、8、16、32、64。为了方便,将每个子码本简记为scb
i
,相应的波束宽度为21‑
i
,即波束宽度随着指标i的增加而减小。
[0111]
3)算法性能验证时,对比单个子码书和基于多分辨率的自适应波束宽度调制(bwo)算法。需要指出的是,由于子码书scb1和scb2中波束的阵列增益太小,无法获得良好的性能,故在仿真中只考虑子码书和
[0112]
4)信道模型包括1个视距路径(los)和3个非视距路径(nlos),nlos路径的偏离角(aod)服从0~2π的均匀分布,los与nlos的平均功率比为10db,且nlos的功率增益服从正态分布。
[0113]
5)用μ来量化表示环境变化率,环境变化越快,μ值越大。
[0114]
仿真结果分析:
[0115]
图4展示了具有4个子码本的ear性能,平均有效可达速率(ear)可以表示在单位频谱上的有效传输速率,刻画了系统的吞吐量。
[0116]
当环境变化相对较慢时(μ<0.1),的有效可达速率性能在4个子码本中最高,因为在这种情况下,波束漂移效应不明显,而波束宽度最窄,相应的阵列增益最高。但是随着波束漂移效应越来越大,与相比的有效可达速率性能变差,这表明窄波束易受波束漂移效应的影响。由于的阵列增益较低,在上述各种情形下,有效可达速率性能均最差。
[0117]
随着环境的变化越来越快(μ变大),波束漂移效应的影响越来越严重,使用不同子码本获得的有效可达速率性能也相应降低,但是bwo算法的有效可达速率性能均大于任何固定的子码本的有效可达速率性能。而且,随着环境的变化越来越快,它们之间的性能差距越来越大。这表明,bwo算法可以有效减轻波束漂移效应,并保证在动态信道环境中具有良好的有效可达速率性能。
[0118]
总之,自适应波束宽度调制(bwo)算法可以在实现高阵列增益和抑制波束漂移效应之间取得折中和平衡,并能实时感知和适应不断变化的环境,提高系统吞吐量。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1