1.无人机跟踪控制模型训练方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的无人机跟踪控制模型训练方法,其特征在于,所述步骤一中,通过自身传感器系统周期性感知第一无人机的态势信息,包括:
3.根据权利要求1或2所述的无人机跟踪控制模型训练方法,其特征在于,所述步骤二中,使用深度强化学习算法在离线环境中对无人机进行训练,包括:
4.根据权利要求3所述的无人机跟踪控制模型训练方法,其特征在于,所述步骤二中,述采用q-learning算法,在不同状态下学习无人机采取的动作,以优化长期累积的回报,然后通过函数逼近方法拟合q值函数,使其逼近一个线性二次函数,包括:
5.根据权利要求3所述的无人机跟踪控制模型训练方法,其特征在于,所述步骤三中,根据所述基于系统模型和目标跟踪信息,计算出最优的控制输入,并进行实时更新,无人机持续调整自身动作和状态,达到稳定状态,包括:
6.根据权利要求5所述的无人机跟踪控制模型训练方法,其特征在于,所述根据无人机自身的传感器系统检测敌机状态信息,并进行实时跟踪,包括:
7.根据权利要求5所述的无人机跟踪控制模型训练方法,其特征在于,所述使用lqr控制算法,将q值函数作为成本函数,计算出最优控制增益矩阵,以实现无人机的最优控制输入,包括:
8.一种无人机跟踪控制模型使用方法,其特征在于,所述使用方法应用于第一无人机,包括:
9.根据权利要求1-8任一项所述的无人机跟踪控制模型的终端设备,其特征在于,所述终端设备包括处理器、存储器、存储在所述存储器上被所述处理器执行的计算机程序以及用于所述处理器和所述存储器之间的连接通信的数据总线,所述计算机程序被所述处理器执行时,实现权利要求1至7所述的无人机空战控制模型训练方法的步骤执行和权利要求8所述的无人机空战控制模型使用方法的步骤执行。