一种数控立车伺服系统及其多模态多目标自趋优控制方法

文档序号:32128468发布日期:2022-11-09 08:59阅读:52来源:国知局
一种数控立车伺服系统及其多模态多目标自趋优控制方法

1.本发明属于数控立车伺服系统控制相关技术领域,更具体地,涉及一种数控立车伺服系统及其多模态多目标自趋优控制方法。


背景技术:

2.作为智能装备的核心基础部件,交流伺服系统已广泛应用于数控机床、工业机器人、电子制造设备、医疗机器人以及新能源汽车等领域,并得到国内外研究学者的广泛关注。数控立车为交流伺服系统的典型应用案例。然而,数控立车高速高精运动需求的日益增长,导致其交流伺服系统的设计需要同时面临快速响应、鲁棒性、低灵敏度、高精度和高效能源使用等方面的多种性能约束。同时,实际的运行过程中,数控立车伺服系统在不同的运行阶段具有不同运动特性和性能偏好。例如,面向高精制造时,数控立车期望伺服系统在启动阶段能实现系统阻尼和响应速度的最优平衡,在轨迹跟踪阶段偏好响应速度以实现快速跟踪,同时在负载波动过程中也需具备抗干扰能力来保证运动平稳性。
3.对于此类多模态控制问题,已有神经网络控制、模糊控制、变增益控制、滑模控制等各类智能算法被改进和应用,以使数控立车伺服系统能够随着控制模态的改变自适应调整控制增益或者控制律,从而满足当前控制需求。然而,现有的方法虽然提供了有益的探索,但关注点局限于特定的性能指标下的自趋优,难以实时平衡多目标性能需求。利用多目标优化算法在线调整伺服系统的控制增益则需要昂贵的计算资源,难以满足实时性需求。对于数控立车伺服系统,如何实现多模态多目标自趋优仍是一件悬而未决的问题。


技术实现要素:

4.针对现有技术的以上缺陷或改进需求,本发明提供了一种数控立车伺服系统及其多模态多目标自趋优控制方法,该控制方法利用h2/h

性能评估准则和权重聚合法,构建了数控立车伺服系统多模态多目标评价机制,明晰了“控制模态-性能偏好-控制增益”之间的映射关系,将复杂耗时的多模态多目标自趋优控制问题解耦为两步,其一是设计多目标模糊启发式优化算法求解不同性能偏好下的伺服系统控制增益,其二是设计模糊决策器,通过在线调整性能偏好权重来间接调度控制增益。
5.为实现上述目的,按照本发明的一个方面,提供了一种数控立车伺服系统的多模态多目标自趋优控制方法,该方法包括以下步骤:
6.(1)借助h2/h

性能评估准则确定数控立车伺服系统的多目标优化函数;
7.(2)根据数控立车伺服系统的响应特征及各运行状态的控制需求来划分数控立车伺服系统的工作状态,并设定相应的性能偏好;
8.(3)结合数控立车伺服系统的状态反馈控制律,构建基于非线性权重聚合的伺服系统多目标性能评估机制,该评估机制为:
[0009][0010][0011]
式中,λ为性能偏好权重且λ∈[0,1],k为可调的状态反馈控制增益,u
p
∈u代表第p个控制输入,x(t)为伺服系统的状态向量、u(t)为控制输入向量,ε(t)为扰动,q1、q2和r是权重矩阵,tf代表终止时间,u
p
∈u和分别代表第p个控制输入和相应的饱和水平,sign()为符号函数。
[0012]
(4)设计多目标模糊启发式优化算法,求解当前性能偏好下的伺服系统的最优控制增益,以构建pareto最优控制增益集;
[0013]
(5)改变权重因子后再次执行多目标模糊启发式优化算法,以遍历不同权重因子,从而得到不同性能偏好下的pareto控制增益集,并以权重因子为索引,重组上述pareto最优控制增益集,以构建控制增益调度表;
[0014]
(6)设定模糊监测决策器以实时监控数控立车伺服系统状态,并生成与数控立车伺服系统状态匹配的偏好权重,进而基于性能偏好权重及控制增益调度表获取与当前数控立车伺服系统性能偏好匹配的控制增益,完成多模态多目标自趋优。
[0015]
进一步地,利用多目标模糊启发式优化算法求解不同性能偏好下的伺服系统控制增益,包括以下具体步骤:
[0016]
(1)构建伺服系统的仿真模型,确定可调控制增益并将其作为待求解优化问题的决策变量;
[0017]
(2)以基于非线性权重聚合的伺服系统多目标性能评估机制,作为优化算法所用的适应度评价准则,并给定权重因子;
[0018]
(3)设置多目标模糊启发式优化算法的关键参数,随机初始化种群;
[0019]
(4)通过仿真模型对种群内所有的候选解进行性能评估,并确定当前的最优解和能参与到下代进化的精英解;
[0020]
(5)执行多目标模糊启发式优化算法的搜索引擎,生成下代种群;
[0021]
(6)重复步骤(4)和(5)直到满足终止条件;
[0022]
(7)改变权重因子,重复步骤(3)~(5),得到不同性能偏好下的控制增益集。
[0023]
进一步地,多目标模糊启发式优化算法的搜索引擎包括三部分:全局开发算子、局部探索算子以及利用模糊自适应算子选择器。
[0024]
进一步地,利用模糊自适应算子选择器选择搜索算子,模糊自适应算子选择器以标准拥挤度和标准时间作为输入,以高斯函数作为模糊隶属度函数,使用乘积推理机和重心去模糊化技术根据模糊规则进行模糊推理,获取各算子的概率因子,从而利用轮盘赌的策略确定最终选择的算子。
[0025]
进一步地,标准拥挤度的计算公式为:
[0026][0027]
式中,p
max
和p
min
分别是当前种群的最大值和最小值,pi为当前个体,p
rand
为种群内
的随机个体;
[0028]
标准时间的计算公式为:
[0029][0030]
式中,t
current
为当前的迭代次数,t
max
为预定的所有的迭代次数。
[0031]
进一步地,全局开发算子表示为:
[0032][0033]
式中fi、δfi、υi、pi分别为种群内第i个个体的频率、频率变化幅度、速度和位置(候选解),rand()∈[0,1]为随机数,υi′
和pi′
分别为更新后的速度和位置,p
*
为从外部档案中随机选择的非支配解。
[0034]
进一步地,局部探索算子表示为:
[0035]
pi′
=pi+f1(p
*-pi)+f2(pm+pn)
[0036]
式中,f1和f2分别为个体学习因子和社会学习因子,pi′
为更新后的位置,p
*
为外部档案中随机选择的非支配解,pm和pn是从种群内的两个随机个体。
[0037]
进一步地,间接调度控制增益以实现多模态多目标自趋优的步骤为:
[0038]
(1)将清晰的输入变量ce和δce转化为模糊变量e和δe,映射关系为:
[0039][0040]
sign(
·
)为符号函数,μe和μ
δe
表示输入的量化因子;
[0041]
(2)利用隶属度函数进行模糊化,隶属度函数选择为三角隶属度函数、高斯隶属度函数、s型隶属度函数或梯形隶属度函数;
[0042]
(3)通过乘积推理机和重心去模糊化技术求解自然域中的权重因子,计算公式为:
[0043][0044]
式中,f(e(t),δe(t))表示模糊输入至模糊输出的映射函数,y表示模糊输出论域变量值,φ()为模糊输出组成的输出函数,θ是将模糊输出映射到实际控制域的输出比例因子;
[0045]
(4)基于调整后的加权因子,查找控制增益调度表,确定对应的状态反馈控制增益,并应用至数控立车伺服系统,以实现全生命周期的多目标性能的pareto最优组合。
[0046]
本发明还提供了一种数控立车伺服系统,所述数控立车伺服系统是采用如上所述的数控立车伺服系统的多模态多目标自趋优控制方法进行控制的。
[0047]
总体而言,通过本发明所构思的以上技术方案与现有技术相比,本发明提供的数控立车伺服系统及其多模态多目标自趋优控制方法主要具有以下有益效果:
[0048]
1.本方法构建了“控制模态-性能偏好权重-控制增益”之间的映射关系;运行过程中,系统可随控制模态的变化,在线自动平衡切换控制增益,以保持pareto最优控制状态,从而能在不同的应用场景发挥最优的控制效果,扩展了应用范围。
[0049]
2.本方法将多模态多目标自趋优控制问题降阶为了性能偏好权重在线调整问题,将多参数控制增益矩阵的实时优化简化单一权重因子的调整,极大降低了计算复杂度,提高了系统的运行效率。
[0050]
3.模糊监督决策器的设计具有相当大的设计灵活性,即可以根据实际需要重新配置模糊规则和隶属函数,以更好地适应当前的应用对象。
[0051]
4、结合模糊学习率,提出了多目标模糊启发式优化算法,以综合寻优知识和寻优状态自适应调整全局开发和局部探索,实现了收敛速度和收敛精度的自适应平衡,提高了数控立车伺服系统的多目标优化效率。
附图说明
[0052]
图1是本发明实施例涉及的基于状态反馈控制律的数控立车伺服系统;
[0053]
图2是本发明的数控立车伺服系统多模态多目标自趋优控制方法的流程示意图;
[0054]
图3是本发明实施例涉及的多目标模糊启发式优化算法的流程图;
[0055]
图4中的(a)、(b)、(c)分别是本发明实施例的模糊监督决策器的隶属度函数示意图。
具体实施方式
[0056]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0057]
凭借结构紧凑、可靠性强、功率密度高、可控性强等优势,交流伺服系统已在数控机床、机器人、电子制造设备等高端装备中广泛应用,其中以数控立车为典型应用场景。但随着作业需求的日益提高,数控立车交流伺服系统的设计不仅需要考虑在复杂扰动下的稳定性和鲁棒性,还需兼顾跟踪精度、响应速度等需求。同时,在大多数作业过程中,数控伺服系统具有多模态特性,在不同运动阶段具有不同的性能偏好,例如,启动阶段需要在兼顾响应速度和系统阻尼,运行阶段需要同时考虑跟踪精度和抗扰动性等。为此需要设计合适的策略实现多模态多目标自趋优。
[0058]
本发明提供了一种数控立车伺服系统的多模态多目标自趋优控制方法,所述控制方法首先借助h2/h

性能评估准则,设计数控立车伺服系统的多目标优化函数,并根据系统的响应特征和各运行状态的控制需求,划分数控立车伺服系统的工作模态,设定相应的性能偏好;然后,构建基于非线性权重聚合的数控立车伺服系统性能评估机制,将多模态多目标自趋优控制问题转化为性能偏好权重在线调整问题;接着,设定多目标模糊启发式优化算法,求解不同性能偏好下的数控立车伺服系统控制增益,构建以权重因子为索引的pareto最优控制增益调度集;最后,设计模糊监督决策器,实时监控数控立车伺服系统状态,并生成与之匹配的性能偏好权重,以此调度控制增益,使之与当前模态的性能偏好相匹配,完成多模态多目标自趋优。相比传统的变增益多模态控制策略,本发明在保证增益在线优化效率的前提下,兼顾了各模态中的多目标性能偏好,实现了全运行周期内的pareto最优控制状态,从而使数控立车伺服系统能在不同的应用场景发挥最优的控制效果,扩展了
应用范围。
[0059]
请参阅图1,以永磁同步电机为驱动源,基于状态反馈控制律的数控立车伺服系统在d-q轴坐标系下的数学模型如下所示:
[0060][0061]
式中式中id和iq是d-q轴电流,ω为电机的电角速度,为速度积分,ωr(t)为指令转速,t
l
为负载转矩,l为定子电感,ξ、rs、jm、bf和λm分别为电机极对数、定子电阻、转动惯量、粘性摩擦系数和磁通量,ud和uq是待求解的控制变量,由下式可得d-q轴电压vd和vq:
[0062][0063]
本实施例中,u(t)采用如下状态反馈控制率计算:
[0064]
u(t)=-kx(t),
[0065]
式中k为状态反馈控制增益矩阵。
[0066]
由此,多模态多目标自趋优控制问题转化为如何随控制模态的变化实时在线调整状态反馈控制增益,以实现在全生命周期内的pareto最优控制状态。
[0067]
请参阅图2,所述控制方法包括以下具体步骤:
[0068]
步骤一,借助h2/h

性能评估准则确定数控立车伺服系统的多目标优化函数。
[0069]
具体地,本实施例选择j2(u)表征伺服系统的能量损耗和跟踪精度:
[0070][0071]
选择j

(u)表征伺服系统的抗干扰能力和响应速度:
[0072][0073]
同时考虑伺服系统的物理约束:
[0074][0075]
以此,本实施例构建的伺服系统多目标优化函数如下:
[0076][0077][0078]
上述公式中,x(t)为伺服系统的状态向量、u(t)为控制输入向量,ε(t)为扰动,q1、q2和r是权重矩阵,tf代表终止时间,u
p
∈u和分别代表第p个控制输入和相应的饱和水平,j2(u)表征伺服系统的能量损耗和跟踪精度,j

(u)表征伺服系统的抗干扰能力和响应速度,饱和函数为伺服系统的物理约束。
[0079]
步骤二,根据数控立车伺服系统的响应特征及各运行状态的控制需求来划分数控立车伺服系统的工作状态,并设定相应的性能偏好。
[0080]
步骤三,结合数控立车伺服系统的状态反馈控制律,构建基于非线性权重聚合的伺服系统多目标性能评估机制,该评估机制为:
[0081][0082][0083]
式中,λ为性能偏好权重且λ∈[0,1],k为可调的状态反馈控制增益,u
p
∈u代表第p个控制输入,x(t)为伺服系统的状态向量、u(t)为控制输入向量,ε(t)为扰动,q1、q2和r是权重矩阵,tf代表终止时间,u
p
∈u和分别代表第p个控制输入和相应的饱和水平,sign()为符号函数。
[0084]
上述基于权重聚合的伺服系统性能评估机制将多模态多目标自趋优控制问题转化为性能偏好权重在线调整问题。
[0085]
步骤四,利用多目标模糊启发式优化算法求解当前性能偏好下的伺服系统的最优控制增益,以构建pareto最优控制增益集。
[0086]
本实施例的多目标模糊启发式优化算法的搜索过程主要分为三部分:利用全局开发算子进行全域内搜索、利用局部探索算子进行局部勘探、以及利用模糊自适应算子选择器进行模式调整。
[0087]
第一部分:利用模糊自适应算子选择器选择搜索算子。本实施例的模糊自适应算子选择器以标准拥挤度和标准时间作为输入,以高斯函数作为模糊隶属度函数,使用乘积推理机和重心去模糊化技术根据模糊规则进行模糊推理,获取各算子的概率因子,从而利用轮盘赌的策略确定最终选择的算子。其中,标准拥挤度的计算公式如下:
[0088][0089]
式中,p
max
和p
min
分别是当前种群的最大值和最小值,pi为当前个体,p
rand
为种群内的随机个体。
[0090]
标准时间的计算公式如下:
[0091][0092]
式中,t
current
为当前的迭代次数,t
max
为预定的所有的迭代次数。
[0093]
模糊规则如下:
[0094]
规则1,若nl为低和nt为小,则全局探索概率为低,局部开发概率为高;
[0095]
规则2,若nl为低和nt为中,则全局探索概率为低,局部开发概率为高;
[0096]
规则3,若nl为低和nt为大,则全局探索概率为低,局部开发概率为高;
[0097]
规则4,若nl为中和nt为小,则全局探索概率为中,局部开发概率为中;
[0098]
规则5,若nl为中和nt为中,则全局探索概率为中,局部开发概率为中;
[0099]
规则6,若nl为中和nt为大,则全局探索概率为中,局部开发概率为中;
[0100]
规则7,若nl为高和nt为小,则全局探索概率为高,局部开发概率为低;
[0101]
规则8,若nl为高和nt为中,则全局探索概率为高,局部开发概率为低;
[0102]
规则9,若nl为高和nt为大,则全局探索概率为高,局部开发概率为低。
[0103]
第二部分:若选择了全局探索,则执行全局开发算子,其更新规则如下:
[0104][0105]
式中fi、δfi、υi、pi分别为种群内第i个个体的频率、频率变化幅度、速度和位置(候选解),rand()∈[0,1]为随机数,υi′
和pi′
分别为更新后的速度和位置,p
*
为从外部档案中随机选择的非支配解。
[0106]
第三部分:若选择了局部探索,则执行局部探索算子,更新规则如下:
[0107]
pi′
=pi+f1(p
*-pi)+f2(pm+pn)
[0108]
式中,f1和f2分别为个体学习因子和社会学习因子,pi′
为更新后的位置,p
*
为外部档案中随机选择的非支配解,pm和pn是从种群内的两个随机个体。其中,同一代的同一个体只采用上述两种算子中的一种进行更新,算子的选择通过模糊自适应算子选择器进行。所述模糊自适应算子选择器以标准拥挤度和标准时间作为输入,借助模糊规则生成各算子的概率因子,最后利用轮盘赌的策略确定最终选择的算子。所述模糊自适应算子选择器采用高斯函数作为模糊隶属度函数,使用乘积推理机和重心去模糊化技术执行模糊推理。
[0109]
步骤五,改变权重因子后再次执行多目标模糊启发式优化算法,以遍历不同权重因子,从而得到不同性能偏好下的pareto控制增益集,并以权重因子为索引,重组上述pareto最优控制增益集,以构建控制增益调度表。
[0110]
如图3所示,利用多目标模糊启发式优化算法求解不同性能偏好下的伺服系统控制增益,包括以下具体步骤:
[0111]
(1)构建伺服系统的仿真模型,确定可调控制增益并定义为待求解优化问题的决策变量;
[0112]
(2)以基于权重聚合的伺服系统性能评估机制作为优化算法所用的适应度评价准则,并给定权重因子;
[0113]
(3)设置多目标模糊启发式优化算法的关键参数,随机初始化种群;
[0114]
(4)通过仿真模型对种群内所有的候选解进行性能评估,并确定当前的最优解和能参与到下代进化的精英解;
[0115]
(5)执行多目标模糊启发式优化算法的搜索引擎,生成下代种群;
[0116]
(6)重复步骤(4)和(5)直到满足终止条件;
[0117]
(7)改变权重因子,重复步骤(3)~(5),得到不同性能偏好下的控制增益集。
[0118]
步骤六,设定模糊监测决策器以实时监控数控立车伺服系统状态,并生成与数控立车伺服系统状态匹配的偏好权重,并基于性能偏好权重及控制增益调度表获取与当前数控立车伺服系统性能偏好匹配的控制增益,完成多模态多目标自趋优。
[0119]
所述模糊监督决策器以跟踪误差和误差变化率作为输入,并根据不同运动状态下输入的差异性划分伺服系统的模态,结合专家调控经验制定性能偏好因子调整规则。以此,所述模糊监督决策器可以在线调整性能偏好权重,间接调度控制增益,实现多模态多目标自趋优。
[0120]
步骤六包括以下具体步骤:
[0121]
首先,根据当前被关注的输出状态,将伺服系统的运行过程预先划分为不同的工作模式。每种模态对其控制状态都有明确的性能偏好。这种映射关系通过mamdani型模糊推理概括为模糊规则,以指导控制增益的调度。在本实施例中,模糊规则可以设置为表1。其中,e和δe分别表示速度误差ωe和误差率δωe,模糊输入语言变量ne、mn、sn、zo、sp、mp和pe分别表示负、中负、小负、零、小正、中正和正,并且,模糊输出语言变量s、ms、m、ml和l分别表示小、中小、中、中大和大。这些规则的基本形式可以表示为“若e是ge并且δe是g
δe
,则偏好权重λ是g
λ”,其中g
δe
∈{ne,zo,pe},ge∈{ne,mn,sn,zo,sp,mp,pe},g
λ
∈{s,ms,m,ml,l}。
[0122]
表1模糊规则
[0123][0124]
然后,为了便于使用语言变量进行模糊推理,本实施例制定清晰的输入变量(ce和δce)和模糊变量(e和δe)之间转化关系如下:
[0125][0126]
式中,e∈[-e
max
,e
max
],δe∈[-δe
max
,δe
max
],sign(
·
)为符号函数,μe和μ
δe
表示输入的量化因子。
[0127]
接着,为模糊输入和输出变量设置如图4所示的隶属函数,以进行模糊化和去模糊化。
[0128]
最后,通过乘积推理机和重心去模糊化技术计算自然域中的权重因子如下
[0129]
[0130]
式中,f(e(t),δe(t))表示模糊输入至模糊输出的映射函数,y表示模糊输出论域变量值,φ()为模糊输出组成的输出函数,θ是将模糊输出映射到实际控制域的输出比例因子。
[0131]
基于调整后的加权因子,确定对应的状态反馈控制增益,并应用至伺服系统,即在多模态场景中都可实现多目标性能的pareto最优组合。
[0132]
本发明综合h2/h

性能评估准则、非线性权重聚合和状态反馈控制律等技术,将多模态多目标自趋优控制问题转化为性能偏好权重在线调整问题,利用多目标优化算法离线求解pareto最优控制增益集,设计模糊监督决策器在线调整性能偏好,调度控制增益,从而使得数控立车伺服系统能够在不同工作模态中都具备pareto最优控制状态。
[0133]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1