光纤耦合器阵列的自适应控制方法与流程

文档序号:24233186发布日期:2021-03-12 13:03阅读:156来源:国知局
光纤耦合器阵列的自适应控制方法与流程

本发明属于空间激光通信领域,具体涉及一种光纤耦合器阵列的自适应控制方法。



背景技术:

现阶段随着激光通信技术的不断进步,通信介质也由光纤拓展到自由空间及水下等场景。相较于传统的无线通信方式(如无线电,声通信等),自由空间激光通信由于具有方向性好、通信容量大、带宽高、天线尺寸小、保密性好等优点,已逐渐成为无线通信领域的重要研究课题,近年来得到了越来越多的关注,有望成为星地间海量数据传输的有效手段。

在自由空间激光的研究中,需要根据不同气象条件下的传输衰减,大气闪烁,空气散射,背景噪声等来减少大气信道的空间损耗。通过准确掌握某地的气候等通信条件,同时找到气象条件影响通信质量的规律,从而为通信的实现提供参考数据。但目前,自由空间激光通信由于受到日光、月光、星光等背景噪声光的影响,通信接收终端探测信号中夹杂着很强的背景光噪声。这将增大通信的误码率,降低通信质量。

同时,如何提高空间光耦合效率、降低信噪比,也是需要解决的关键技术问题之一。在空间激光通信系统中,激光接收终端的性能决定了整体通信性能的优劣。事实上,由于大气湍流效应、机械平台震动以及热畸变的存在,极大地影响了光纤耦合效率。因此,如何消除大气湍流的影响、改善接收端的光耦合效率,是空间激光通信领域孜孜以求的目标。目前,激光接收终端一般采用传统spgd算法对终端内的光纤耦合器阵列进行控制。但是,传统spgd算法虽然控制效果较为不错,但算法处理速度慢,时效长,影响了激光接收终端的性能的进一步提升。



技术实现要素:

本发明的目的在于提供一种能够提高激光接收终端的耦合效率以及稳定性,避免信息丢失,提高通信质量且安全可靠的光纤耦合器阵列的自适应控制方法。

本发明提供的这种光纤耦合器阵列的自适应控制方法,包括如下步骤:

s1.搭建光纤耦合器阵列控制系统;

s2.采用步骤s1搭建的光纤耦合器阵列控制系统进行数据传输,获取真实数据集,并划分为训练数据集和测试数据集;

s3.搭建针对光纤耦合器阵列的自适应初步控制模型,并采用步骤s2得到的训练数据集和测试数据集,对搭建的自适应初步控制模型进行训练,从而得到针对光纤耦合器阵列的自适应控制模型;

s4.采用步骤s3得到的自适应控制模型,对光纤耦合器阵列进行自适应控制。

步骤s1所述的光纤耦合器阵列控制系统,具体包括99:1分束器、自适应光纤耦合器阵列、若干组单模光纤、若干组光电探测器、控制器、相机型光斑分析仪和高压放大器;光经过99:1分束器后,1%的光经由相机型光斑分析仪分析后将数据输入控制器;99%的光进入自适应光纤耦合器阵列后,将有部分入射光被耦合进单模光纤内,再通过单模光纤传输至光电探测器,转化为对应的电信号,并被送至控制器;控制器经迭代运算后输出用于控制自适应光纤耦合器阵列的多路驱动电压信号;驱动电压信号再经高压放大器放大后,用于驱动自适应光纤耦合器阵列的内置光纤端面在各自耦合透镜的后焦平面处搜索耦合效率最大值点,实现耦合效率的优化。

步骤s2所述的采用步骤s1搭建的光纤耦合器阵列控制系统进行数据传输,获取真实数据集,并划分为训练数据集和测试数据集,具体为采用1550nm的激光源进行数据传输,利用spgd算法迭代运算后得到控制光纤耦合阵列的多路驱动电压,使得耦合效率达到最大值点;同时获取如下数据变量:激光束宽、接收端功率、耦合效率和驱动电压;其中激光束宽、接收端功率和耦合效率组成标签st,驱动电压组成标签at。

步骤s2所述的划分为训练数据集和测试数据集,具体为将获取的真实数据集中的60%的数据划分为训练数据集,剩余的40%的数据划分为测试数据集。

步骤s3所述的搭建针对光纤耦合器阵列的自适应初步控制模型,并采用步骤s2得到的训练数据集和测试数据集,对搭建的自适应初步控制模型进行训练,从而得到针对光纤耦合器阵列的自适应控制模型,具体为采用如下步骤得到最终的模型:

a.对输入的数据进行归一化,并在归一化后的数据中加入零均值高斯噪声,从而提高模型的鲁棒性;

b.模型的内部网络结构基于深度神经网络,采用batchnormalization层和隐藏层的结构构建网络模型,并采用如下算式拟合状态变化与当前状态和动作的非线性关系:

式中为下一刻预测状态;为当前预测状态;为当前动作引起的当前预测状态的变化,即所要学习的非线性关系;

c.给定光纤耦合器阵列的状态动作为τ=(s0,a0,s1,a1,...,st,at);同时采用如下算式作为训练数据集的损失函数s(θ):

式中d为训练集;为当前动作引起的当前状态的变化;

将学习到的动力学函数向前传播h次来计算h步验证误差,采用如下算式作为测试数据集的损失函数

式中dval为测试集;h为动力学函数向前传播的步数;h为动力学函数向前传播的步数;st+h为向前传播h步的实际状态;为向前传播h步的预测状态;为向前传播h-1步时,所做动作引起的预测状态的变化;同时利用随机梯度下降法求得最优参数;

d.在有限的长度上,采用如下算式,利用步骤c生成的模型预测未来动作

式中t'为所处时刻与向前传播h-1步的时间合集;为奖励函数,即在当前预测状态实施动作所获得的奖励;为当前动作引起的当前预测状态的变化;为t'时刻的预测状态;

随机生成k个候选动作序列,使用学习到的模型预测相应的状态序列,计算所有序列的奖励,并选择最高预期累积奖励;策略仅执行第一个操作at,接收更新的状态信息st+1,并在下一时间步长重新计算最佳操作序列;保存该动作序列作为数据集d*

e.采用步骤d得到的数据集重新训练深度神经网络同时将参数化为条件高斯策略并采用如下算式训练策略参数:式中为深度神经网络;为神经网络参数化后st状态下输出,t为所处时刻;为欧氏距离的平方;

使用随机梯度下降法进行优化,接着,将作为无模型强化学习初始策略,并使用trpo算法得到最终模型。

本发明提供的这种光纤耦合器阵列的自适应控制方法,引入强化学习手段对光纤耦合器阵列进行自适应控制,使得本发明方法比传统的sgpd方法更具有时效性和泛化性,能够提高激光接收终端的耦合效率以及稳定性,避免信息丢失,提高通信质量,而且安全可靠。

附图说明

图1为本发明方法的方法流程示意图。

图2为本发明方法搭建的光纤耦合器阵列控制系统的系统功能模块示意图。

具体实施方式

如图1所示为本发明方法的方法流程示意图:本发明提供的这种光纤耦合器阵列的自适应控制方法,包括如下步骤:

s1.搭建光纤耦合器阵列控制系统;具体包括99:1分束器、自适应光纤耦合器阵列、若干组单模光纤、若干组光电探测器、控制器、相机型光斑分析仪和高压放大器;光经过99:1分束器后,1%的光经由相机型光斑分析仪分析后将数据输入控制器;99%的光进入自适应光纤耦合器阵列后,将有部分入射光被耦合进单模光纤内,再通过单模光纤传输至光电探测器,转化为对应的电信号,并被送至控制器;控制器经迭代运算后输出用于控制自适应光纤耦合器阵列的多路驱动电压信号;驱动电压信号再经高压放大器放大后,用于驱动自适应光纤耦合器阵列的内置光纤端面在各自耦合透镜的后焦平面处搜索耦合效率最大值点,实现耦合效率的优化。

s2.采用步骤s1搭建的光纤耦合器阵列控制系统进行数据传输,获取真实数据集,并划分为训练数据集和测试数据集;具体为采用1550nm的激光源进行数据传输,利用spgd算法迭代运算后得到控制光纤耦合阵列的多路驱动电压,使得耦合效率达到最大值点;同时获取如下数据变量:激光束宽、接收端功率、耦合效率和驱动电压;其中激光束宽、接收端功率和耦合效率组成标签st,驱动电压组成标签at;

s3.搭建针对光纤耦合器阵列的自适应初步控制模型,并采用步骤s2得到的训练数据集和测试数据集,对搭建的自适应初步控制模型进行训练,从而得到针对光纤耦合器阵列的自适应控制模型;具体为采用如下步骤得到最终的模型:

a.对输入的数据进行归一化,并在归一化后的数据中加入零均值高斯噪声,从而提高模型的鲁棒性;

b.模型的内部网络结构基于深度神经网络,采用batchnormalization层和隐藏层的结构构建网络模型,并采用如下算式拟合状态变化与当前状态和动作的非线性关系:

式中为下一刻预测状态;为当前预测状态;为当前动作引起的当前预测状态的变化,即所要学习的非线性关系;

c.给定光纤耦合器阵列的状态动作为τ=(s0,a0,s1,a1,...,st,at);同时采用如下算式作为训练数据集的损失函数s(θ):

式中d为训练集;为当前动作引起的当前状态的变化;

采用如下算式作为测试数据集的损失函数

式中dval为测试集;h为动力学函数向前传播的步数;h为动力学函数向前传播的步数;st+h为向前传播h步的实际状态;为向前传播h步的预测状态;为向前传播h-1步时,所做动作引起的预测状态的变化;同时利用随机梯度下降法求得最优参数;

d.在有限的长度上,采用如下算式,利用步骤c生成的模型预测未来动作

式中t'为所处时刻与向前传播h-1步的时间合集;为奖励函数,即在当前预测状态实施动作所获得的奖励;为当前动作引起的当前预测状态的变化;为t'时刻的预测状态;

随机生成k个候选动作序列,使用学习到的模型预测相应的状态序列,计算所有序列的奖励,并选择最高预期累积奖励;策略仅执行第一个操作at,接收更新的状态信息st+1,并在下一时间步长重新计算最佳操作序列;保存该动作序列作为数据集d*

e.采用步骤d得到的数据集重新训练深度神经网络同时将参数化为条件高斯策略并采用如下算式训练策略参数:式中为深度神经网络;为神经网络参数化后st状态下输出,t为所处时刻;为欧氏距离的平方;

使用随机梯度下降法进行优化,接着,将作为无模型强化学习初始策略,并使用trpo算法得到最终模型;

s4.采用步骤s3得到的自适应控制模型,对光纤耦合器阵列进行自适应控制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1