基于偏好矩阵的混合多目标PSO算法的飞行器冗余控制方法与流程

文档序号:19736580发布日期:2020-01-18 04:33阅读:292来源:国知局
基于偏好矩阵的混合多目标PSO算法的飞行器冗余控制方法与流程
本发明属于飞行器控制仿真领域,具体涉及基于偏好矩阵的混合多目标pso算法的飞行器冗余控制方法。
背景技术
:近年来飞行器发展迅速,特别是旋翼飞行器、复合式直升机及小型的无人机等成为国内外航空领域的研究热点,但飞行器因飞行环境恶劣而需具有复杂操纵机构的飞行器完成飞行器轨迹和姿态的控制,复杂的操纵机构使得飞行器的操纵舵面维数大于控制器输出的虚拟控制指令维数,存在操纵冗余。目前,国内外学者已提出了多种控制分配方案以解决飞行器的操纵冗余问题,如直接分配法,伪逆法和链式递增法等,但此类方案通常只能解决简单的线性控制分配问题,而对于复杂的具有舵面约束的飞行器冗余系统通常无法直接求解;此外,对于包含操纵舵面偏转量最小、操纵效率最高、能耗最小等多目标的飞行任务,简单的控制分配方案已无法解决。此外,在多目标优化问题求解中,多目标优化算法的研究已取得了一些进展,但其研究成果大都集中在获得多目标优化问题的pareto前沿的最优分布上,缺少对多目标优化问题约束条件处理方法的研究,相比无约束优化问题,约束优化问题的求解更加复杂。因此,简单、高效地求解带约束多目标优化问题的多目标优化算法日益受到重视。针对带约束的多目标优化问题,一些学者利用判断矩阵法确定优化目标权系数,并利用线性加权和法将多目标优化问题转化为单目标优化问题,但此方法设计的权系数在多目标优化问题中为固定值,故而无法保证求解结果为全局最优解。此外,部分学者提出了利用罚函数将带约束的多目标优化问题转化为无约束问题,可在一定程度上简化多目标优化问题的复杂度,但是罚函数惩罚因子的设计并没有固定的方法,不合理的取值将会导致多目标优化问题陷入局部最优解。技术实现要素:本发明的发明目的是针对上述
背景技术
的不足,提供了基于偏好矩阵的混合多目标pso算法的飞行器冗余控制方法,将控制分配问题转化为带约束条件的多目标优化问题,并设计自适应粒子群算法,并通过在线寻优求解飞行器操纵舵面偏航量,解决带约束的多目标飞行任务飞行器冗余控制分配问题。本发明为实现上述发明目的采用如下技术方案:一种基于偏好矩阵的混合多目标pso算法的飞行器冗余控制方法,构建包含混合多目标优化函数、操纵舵面边界约束及虚拟控制指令与操纵舵面数值约束的混合多目标优化问题,对混合多目标优化函数进行线性加权求和将混合多目标优化问题转换为单目标优化问题,根据每个目标函数相对于其它目标函数的重要性建立判断矩阵,再依据判断矩阵建立偏好矩阵以构建目标函数权重系数的约束,将目标函数权重系数的约束纳入单目标优化问题,通过对权重系数和操纵舵面在线寻优获得最优解。该方法具体包括如下六个步骤。步骤一、分析飞行器冗余系统的舵面特性,确定飞行器操纵舵面与虚拟控制指令的数值关系;一般飞行器操纵舵面复杂且维数大于虚拟控制指令,存在操纵冗余,可通过飞行器平衡点进行动力学配平和线性化分析得到虚拟控制指令v与操纵舵面δ的关系式为:v=bδ(1),式(1)中,δ=[δ1,δ2,…,δd]表示飞行器的d维操纵舵面,b为控制分配效率矩阵。步骤二、分析飞行器的飞行环境和飞行任务,确定飞行器的任务目标并设计目标函数f1(δ),f2(δ),...,fn(δ)。步骤三、分析飞行器操纵舵面的动态特性,确定操纵舵面边界约束条件、等式和不等式约束条件,并建立混合多目标优化函数:式(2)中,minγ表示多个目标函数同时达到最优;gl(δ)表示操纵舵面的p个不等式约束条件;hk(δ)表示δ的q个等式约束条件;δmin、δmax表示操纵舵面的边界值。步骤四、利用线性加权和法将混合多目标函数转化为单目标优化函数,解决混合多目标优化问题无法求解全局最优值问题:式(3)中,wi表示第i个目标函数的权重系数,并将操纵的边界约束条件转化为不等式约束条件,即:故优化函数可表示为:步骤五、设计偏好矩阵po约束wi的取值范围,并利用寻优算法对wi和δ同时在线寻优,通过动态改变wi,求解多目标优化问题,使得各目标函数同时取得最优解,满足飞行器飞行任务偏好的设计要求。步骤六、设计自适应粒子群算法并在线寻优,求解操纵舵面δ,完成飞行器冗余系统的舵面分配。进一步地,步骤五中的偏好矩阵po的具体设计方法如下:步骤5.1、根据飞行任务的重要程度,对n个目标函数分别进行两两判断,并根据重要程度设计判断矩阵;假设fi相对于fj的重要程度为aij,依据表1对该参数进行设计。表1判断矩阵的重要性指数进一步,可求得判决矩阵为:步骤5.2、对判断矩阵a进行一致性分析,保证各优化目标函数重要程度的协调性。步骤5.3、根据判断矩阵a设计偏好矩阵po以约束权重系数wi的取值范围:由判断矩阵a可知aii=1,aij=1/aji,fi与fj的重要性关系可以用aij′=aij(j>i)来表示,故wi与wj的数值关系可表示为wi/a′ij-wj≥0,其矩阵表示形式为:进一步地,步骤5.2中对判断矩阵一致性分析具体方法为:令m=[mij]n×n,d=[d1,d2,…,dn],设计判断矩阵的导出矩阵为:如果h矩阵所有元素全为1,则a满足一致性要求,但该方法应用于实际系统进行数值仿真分析时,通常无法保证h的所有元素均为1。因此,本发明应用方差s2对h矩阵各元素偏离1的程度进行判断,当满足设计要求,即s2<tol时,则认为a满足一致性性能指标,否则,重新设计判断矩阵a。其中,tol表示各元素偏离1的最小误差,方差s2可表示为:进一步地,步骤六中的自适应粒子群算法具体设计步骤包括:步骤6.1、确定粒子群算法的适应函数minf(x)、决策变量x=[w,δ]以及约束条件;优化目标函数可以表示为:进一步可得:步骤6.2、初始化粒子群算法,包括:粒子群大小n=n+d、最大惯性权重wmax、最小惯性权重wmin、最大迭代次数tmax、学习因子c1及c2、最小全局误差梯度τ、粒子群最大收敛速度vmax、初始化粒子初始位置x(t)=[x1,x2…xm…xn]和粒子初速度v(t)=[v1v2…vm…vn]。其中,t表示迭代次数。步骤6.3、将初始状态x(t)带入适应函数minf(x),并计算对应每一组粒子的适应值,进一步得到粒子个体最优值pmb(t),全局最优值pb(t)。步骤6.4、设计自适应学习评价函数rv(x),修正粒子的收敛速度,使得约束条件附近的粒子能够靠近可行域,充分利用粒子边界信息;步骤6.5、根据粒子群速度和位置进化公式,更新速度vm(t+1)和位置xm(t+1);自适应粒子群算法的更新公式为:式(12)中,vm(t)、vm(t+1)分别为第m个个体在第t次迭代、第t+1次迭代中的速度,c1为个体学习因子、c2为全局学习因子,c1=c2∈[0,4],r1、r2分别为个体学习评价比例因子和全局学习评价比例因子,pmb(t)为第m个个体在第t次迭代中的局部最优位置,rv(x)为自适应评价函数,pb(t)为所有个体在第t次迭代中的全局最优位置,xm(t)、xm(t+1)分别为第m个个体在第t次迭代、第t+1次迭代中的位置。步骤6.6、将第t次迭代更新后的粒子群x(t+1)带入适应度函数并计算适应值,更新个体最优值pmb(t+1)、全局最优值pb(t+1)。步骤6.7、重复步骤6.4至步骤6.6,直到全局最优值pb(t)满足最小全局误差梯度τ或迭代次数达到tmax。进一步地,步骤6.4中自适应学习评价函数rv(x)的设计及收敛速度的修正方法为:根据混合多目标优化问题的约束条件,设计粒子群违反性能指标函数r(x);如果r(x(t))=0,表示该粒子满足约束条件,定义为可行粒子,如果r(x(t))≠0,则该粒子不满足约束条件,定义为不可行粒子。根据粒子群违反程度,标准化粒子群违反性能指标函数r(x),得到自适应学习评价函数rv(x);本发明采用上述技术方案,具有以下有益效果:(1)本发明提出的基于偏好矩阵的混合多目标pso算法的飞行器冗余多目控制方法,分析了具有多目标飞行任务的飞行器控制冗余问题,并将控制冗余问题转化为混合多目标优化问题,通过在线寻优求解操纵舵面偏转量,可解决带舵面约束的飞行器多目标飞行控制冗余问题,完成舵面偏转的在线控制分配,降低了飞行器控制器设计的难度,且此类方案可推过应用于控制重构等存在操纵冗余的控制系统中。(2)本发明提出了一种基于偏好矩阵的混合多目标自适应粒子群优化策略,可将复杂的多目标优化问题转化为单目标优化问题,解决多目标优化问题复杂、难以直接求解全局最优解的问题,基于判断矩阵设计约束目标函数权系数的偏好矩阵,利用一致性判断矩阵确定各个优化目标的重要程度,利用偏好矩阵约束权系数的取值范围,并利用寻优算法求取最优权系数,避免了因个人经验设计权系数带来的误差,保证了寻优结果在满足偏好要求的基础上多个优化性能指标同时达到最优,可同时满足任务偏好要求,可适用于求解精度要求较高,优化性能指标重要程度复杂的混合多目标优化问题。(3)本发明提出了一种基于自适应学习的评价函数的粒子群算法,可用于求解带约束的目标优化问题。该算法的自适应学习评价函数不需要根据个人经验设计惩罚因子,解决了罚函数惩罚因子难以设计的问题,且该函数可根据粒子群算法的迭代结果动态调整取值大小,利用该评价函数优化粒子群位置和速度进化公式,可充分利用粒子群约束边界附近的粒子信息,提高算法的精度和寻优速度,保证飞行器控制系统具有良好的实时性。附图说明图1为本发明的基于偏好矩阵的混合多目标自适应粒子群优化策略的流程图。图2为本发明的粒子群算法流程图。图3(a)、图3(b)、图3(c)分别为本发明的实施例中仿真过渡飞行模式下的复合式旋翼飞行器进行速度指令跟踪时纵向速度、横向速度、垂直速度与时间的关系图。图4(a)、图4(b)、图4(c)分别为本发明的实施例中仿真过渡飞行模式下的复合式旋翼飞行器进行速度指令跟踪时俯仰角、偏航角、滚转角与时间的关系图。图中标识:rad-弧度(角度单位);time-时间;s-秒(时间单位);m-米(长度单位);u-纵向速度;v-横向速度;w-垂直速度;-俯仰角;θ-偏航角;ψ-滚转角。具体实施方式下面结合附图对发明的技术方案进行详细说明。本发明公开的基于偏好矩阵的飞行器冗余系统多目标控制分配策略如图1所示,包括如下六个步骤。步骤一、分析飞行器冗余系统的舵面特性,确定飞行器操纵舵面与虚拟控制指令的数值关系;一般飞行器操纵舵面复杂且维数大于虚拟控制指令,存在操纵冗余,可通过飞行器平衡点进行动力学配平和线性化分析,得到虚拟控制指令v与操纵舵面δ的关系式为:v=bδ(1),式(1)中,δ=[δ1,δ2,…,δd]表示飞行器d维操纵舵面,b为控制分配效率矩阵。步骤二、分析飞行器飞行环境和飞行任务,确定飞行器任务目标并设计目标函数f1(δ),f2(δ),...,fn(δ)。步骤三、分析飞行器操纵舵面动态特性,确定操纵舵面边界约束条件、等式和不等式约束条件,并建立混合多目标优化函数;式(2)中,minγ表示多个目标函数同时达到最优;gl(δ)表示操纵舵面的p个不等式约束条件;hk(δ)表示δ的q个等式约束约束条件δmin,δmax表示操纵舵面的边界值。步骤四、利用线性加权和法,将混合多目标函数转化为单目标优化函数,解决混合多目标优化问题无法求解全局最优值问题;其中,wi表示第i个目标函数的权重系数。并将操纵的边界约束条件转化为不等式约束条件,即:故优化函数可表示为:步骤五、设计偏好矩阵po约束wi的取值范围,并利用寻优算法对wi和δ同时在线寻优,通过动态改变wi,求解多目标优化问题,使得各目标函数同时取得最优解,满足飞行器飞行任务偏好的设计要求。步骤5.1、根据飞行任务目标的重要程度,对n个目标函数分别进行两两判断,并根据重要程度设计判断矩阵;假设fi相对于fj的重要程度为aij,依据表1对该参数进行设计。表1判断矩阵的重要性指数fi/fjaijfi/fjaij一般重要1有些重要7轻微重要3十分重要9有点重要5极其重要11可求得判断矩阵为:步骤5.2、对判断矩阵a进行一致性分析,保证各优化目标函数重要程度的协调性;令m=[mij]n×n,d=[d1,d2,…,dn],设计判断矩阵的导出矩阵为:如果h矩阵所有元素全为1,则a满足一致性要求,但该方法应用于实际系统进行数值仿真分析时,通常无法保证h的所有元素均为1。因此,本发明应用方差s2对h矩阵各元素偏离1的程度进行判断,当满足设计要求,即s2<tol时,则认为a满足一致性性能指标,否则,重新设计判断矩阵a。其中,tol表示各元素偏离1的最小误差,方差s2可表示为:步骤5.3、根据判断矩阵a,设计偏好矩阵po以约束权重系数wi的取值范围;由判断矩阵a可知aii=1,aij=1/aji,fi与fj的重要性关系可以用aij′=aij(j>i)来表示,故wi与wj的数值关系可表示为wi/a′ij-wj≥0,其矩阵表示形式为:步骤六、如图2所示,设计自适应粒子群算法并在线寻优,求解操纵舵面δ,完成飞行器冗余系统的舵面分配。步骤6.1、确定粒子群算法的适应函数minf(x),决策变量x=[w,δ]以及约束条件;优化目标函数可以表示为:进一步可得:步骤6.2、初始化粒子群算法,包括粒子群大小n=n+d,最大惯性权重wmax,最小惯性权重wmin,最大迭代次数tmax,学习因子c1,c2,最小全局误差梯度τ,粒子群最大收敛速度vmax,初始化粒子初始位置x(t)=[x1,x2…xm…xn]和粒子初速度v(t)=[v1v2…vm…vn]。其中,t表示迭代次数。步骤6.3、将初始状态x(t)带入适应函数minf(x),并计算对应每一组粒子的适应值,进一步得到粒子个体最优值pmb(t),全局最优值pb(t)步骤6.4、设计自适应学习评价函数rv(x),修正粒子的收敛速度,使得约束条件附近的粒子能够靠近可行域,充分利用粒子边界信息。根据混合多目标优化问题的约束条件,设计粒子群违反性能指标函数r(x);如果r(x)=0,表示该粒子满足约束条件,定义为可行粒子,如果r(x)≠0,则该粒子不满足约束条件,定义为不可行粒子。根据粒子群违反程度,标准化粒子群违反性能指标函数r(x),得到自适应学习评价函数rv(x);步骤6.5、根据粒子群速度和位置进化公式更新速度vm(t+1)和位置xid(t+1),自适应粒子群算法的更新公式为:式(14)中,vm(t)、vm(t+1)分别为第m个个体在第t次迭代、第t+1次迭代中的速度,c1为个体学习因子、c2为全局学习因子,c1=c2∈[0,4],r1、r2分别为个体学习评价比例因子和全局学习评价比例因子,pmb(t)为第m个个体在第t次迭代中的局部最优位置,rv(x)为自适应评价函数,pb(t)为所有个体在第t次迭代中的全局最优位置,xm(t)、xm(t+1)分别为第m个个体在第t次迭代、第t+1次迭代中的位置。步骤6.6、将x(t+1)带入适应度函数并计算适应值,更新个体最优值pmb(t+1),全局最优值pb(t+1);步骤6.7、重复步骤6.4至步骤6.6,直到全局最优值pb(t)满足最小全局误差梯度τ或迭代次数达到tmax,即可得到各操纵舵面的偏转量,完成飞行器舵面控制分配。本发明以操纵量偏转最小、指令跟踪误差最小和控制分配效率最高作为优化性能指标,分别在基于经典粒子群算法的混合多目标优化控制分配策略和基于改进粒子群算法的混合多目标优化控制分配策略下对复合式旋翼飞行器过渡模式进行了速度指令跟踪仿真,选取初始速度为40m/s、跟踪速度为70m/s前飞指令,仿真结果如图3和图4所示。其中,图3为复合式旋翼飞行器飞行速度随时间的变化曲线,由图3(a)可知,基于改进的粒子群算法控制分配策略需6s左右可完成速度指令跟踪,而基于经典粒子群算法的控制分配策略约需要14s左右完成,为前者的2倍左右;由图3(a)、图3(b)、图3(c)可知,在基于改进的粒子群算法下,复合式旋翼飞行器速度变化曲线的波动较小,表明改进的粒子群算法在具有较高的搜索速度和求解精度。图4为复合式旋翼飞行器姿态角随时间的变化曲线,由图4(a)、图4(b)、图4(c)可知,在基于改进的粒子群算法控制分配策略下,姿态角的抖动较小,表明复合式旋翼飞行器的稳定性较高。表明本发明提出的基于偏好矩阵的混合多目标自适应粒子群优化策略可应用于对时间和精度要求较高的具有多目标优化问题的复杂系统中。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1