本发明属于无人机安全通信,特别涉及一种智能反射面辅助的无人机安全通信方法。
背景技术:
1、与传统的地面固定基站相比,由无人机作为空中基站的通信系统具有部署灵活、移动可控和成本低等优点,可以为地面用户提供更加可靠且高效的无线通信服务,但无人机通信仍然面临一些挑战。首先在一些用户密集地区,受障碍物和用户容量的影响,无人机和地面用户之间的通信信号可能被阻断,这将导致系统的通信性能显著下降。其次由于无线传输的广播性质,无人机通信系统很容易受到干扰和窃听攻击。采用上层加密的方式可以实现无线网络中的机密通信,但是频繁的加密和解密需要较高的计算能力,这给硬件资源受限的无人机带来了严峻的挑战。借助人工噪声和传统波束成形可以实现安全通信,但是在一些特殊场景(如合法用户与窃听者距离较近或在同一方向)中,他们的有效性会大打折扣。
技术实现思路
1、本发明的目的是提供一种智能反射面辅助的无人机安全通信方法,其通过对通信系统中智能反射面的相移和无人机移动轨迹进行优化,能够提高通信系统的安全性并且减小无人机推进能耗。
2、本发明提供的技术方案为:
3、一种智能反射面辅助的无人机安全通信方法,包括:
4、步骤一、获取智能反射面和各合法用户的位置,并且获取各窃听者的位置;
5、步骤二、建立优化目标函数,并且根据所述优化目标函数对智能反射面的相移和无人机的移动轨迹进行优化,得到各时刻智能反射面的最佳相移和无人机的最佳位置;
6、其中,所述优化目标函数为:
7、
8、式中,表示无人机的移动轨迹,表示智能反射面的相移变化,表示时间序列集合,qu[t]表示在时刻t无人机的位置,φ[t]表示在时刻t智能反射面的相移,rsec[t]表示在时刻t所有合法用户的保密速率之和;e[t]表示在t时刻无人机的飞行能耗;
9、步骤三、在各个时刻,智能反射面调整到最佳相移,无人机移动至最佳位置并发送通信数据。
10、优选的是,在所述步骤二中,在时刻t所有合法用户的保密速率之和,通过如下公式进行计算:
11、
12、
13、式中,表示在时刻t第n个合法用户的传输速率,表示在时刻t第k个窃听者的传输速率,hur[t]表示在时刻t无人机与智能反射面之间的信道,表示在时刻t智能反射面与第n个合法用户之间的信道,表示在合法用户处的干扰功率。
14、优选的是,在所述步骤二中,在t时刻无人机的飞行能耗,通过如下公式进行计算:
15、
16、式中,td表示时隙长度,ps和pm分别表示悬停状态下的叶片轮廓和诱导功率,ur表示旋翼叶片的叶尖速度,vh表示在悬停状态下的平均旋翼叶片诱导速度,d0表示机身阻力比,ρa表示空气密度,z表示旋翼叶片坚硬度,g表示旋翼圆盘面积;vh[t]表示无人机的飞行速度,ax[t]和ay[t]分别表示在时刻t无人机在水平方向和垂直方向上移动的距离。
17、优选的是,在所述步骤二中,通过强化学习算法对无人机的移动轨迹进行优化,通过交替优化算法对智能反射面的相移进行优化。
18、优选的是,对所述无人机的移动轨迹和智能反射面的相移进行优化,包括如下步骤:
19、步骤1、将优化问题转换成马尔科夫决策过程:状态st=[qu[t],e[t]],动作at=[ax[t],ay[t]],奖励值
20、其中,表示无人机飞出监控区域的惩罚,ωsec,ωe∈{0,1}表示目标的权重;
21、步骤2、根据马尔科夫决策过程构建强化学习网络,其包括critic网络和policy网络;
22、步骤3、利用多变量高斯根据policy网络参数的均值μ和协方差矩阵∑随机生成n个policy网络的参数向量作为候选解集;
23、步骤4、从所述候选解集中随机选取多个候选解,分别将选取的候选解对应的网络参数应用到policy网络上,输出对应的无人机的位置;并采用交替优化算法得到与每个policy网络输出的无人机的位置相对应的智能反射面的相移;
24、并将上述过程中产生的经验数据集存放进经验缓冲区;
25、其中,所述经验数据集包括当前时刻的状态、动作、奖励值和下一时刻状态;
26、步骤5、从所述经验缓冲区中随机抽取多条经验数据,采用强化学习算法根据所述经验数据对所述候选解集中剩余的候选解进行更新;
27、步骤6、将更新后的候选解对应的网络参数应用到policy网络上,输出对应的无人机的位置;并采用交替优化算法得到与每个policy网络输出的无人机的位置相对应的智能反射面的相移;
28、上述过程中产生的经验数据集存放进经验缓冲区;
29、步骤7、对更新后的候选解集中的候选解中的候选解按照适应度函数进行排序,选择适应度高的规定数量的候选解最为精英候选解,并且根据所述精英候选解更新均值μ和协方差矩阵∑;
30、重复进行步骤3至步骤7,直到达到设定的迭代次数,得到最优强化学习网络;
31、步骤8、通过所述最优强化学习网络确定每个时刻的无人机位置后,通过交替优化算法得到该时刻智能反射面的相移。
32、优选的是,采用交替优化算法对智能反射面的相移进行优化,包括如下步骤:
33、步骤a、根据离散相移集合随机初始化智能反射面上每个反射元件的相移;
34、其中,b为量化位的个数;
35、步骤b、随机选择智能反应面上的一个反应元件,固定其他反射元件的相移;将选择的反射元件遍历离散相移集合中每个相移值,选择使系统的保密速率最大的相移值作为该反射元件的相移;
36、用上述方法逐个优化其他反应元件的相移,直到所有反应元件完成相移优化;
37、多次重复进行步骤b,直到达到规定的迭代次数。
38、本发明的有益效果是:
39、本发明提供的智能反射面辅助的无人机安全通信方法,建立了提高合法用户安全速率和降低无人机推进能耗的多目标联合优化模型,利用交替优化算法设计出智能反射面在每个时刻的相移,利用强化学习算法设计出无人机在每个时刻的所处位置进而对模型求解;通过控制智能反射面上每个反射单元的幅度和相移,为通信受阻的无人机与地面用户创建新的虚拟视距链路从而提高通信质量;并且当场景中存在窃听者且位置已知时,智能反射面可以将无人机的发射信号反射到合法用户密集区域,从而增强合法用户的信号强度,同时削弱窃听者的信号强度,致使窃听者因信号强度不足无法截取通信数据;通过设计无人机在时长t内的移动轨迹能够降低无人机的推进能耗。
1.一种智能反射面辅助的无人机安全通信方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的智能反射面辅助的无人机安全通信方法,其特征在于,在所述步骤二中,在时刻t所有合法用户的保密速率之和,通过如下公式进行计算:
3.根据权利要求2所述的智能反射面辅助的无人机安全通信方法,其特征在于,在所述步骤二中,在t时刻无人机的飞行能耗,通过如下公式进行计算:
4.根据权利要求1-3任意一项所述的智能反射面辅助的无人机安全通信方法,其特征在于,在所述步骤二中,通过强化学习算法对无人机的移动轨迹进行优化,通过交替优化算法对智能反射面的相移进行优化。
5.根据权利要求4所述的智能反射面辅助的无人机安全通信方法,其特征在于,对所述无人机的移动轨迹和智能反射面的相移进行优化,包括如下步骤:
6.根据权利要求5所述的智能反射面辅助的无人机安全通信方法,其特征在于,采用交替优化算法对智能反射面的相移进行优化,包括如下步骤: