一种用于同步控制的带有遗忘因子的迭代学习控制方法与流程

文档序号:21967191发布日期:2020-08-25 18:53阅读:218来源:国知局
一种用于同步控制的带有遗忘因子的迭代学习控制方法与流程

本申请涉及运动控制技术领域,尤其涉及一种用于同步控制的带有遗忘因子的迭代学习控制方法。



背景技术:

多轴运动系统的同步控制问题,是目前工业界常见的运动控制问题。例如,机床加工领域,多个运动轴需要通过同步控制的方式完成复杂的工件加工轨迹;晶圆曝光设备,硅片台和掩模台在曝光扫描方向必须保持特定的匀速运动关系。同步控制的目标一般是使多个同步轴之间的位置或速度保持特定的关系,相对误差最小。

目前工业界常用的方法是根据同步轴的位置或速度关系计算同步偏差,或者直接利用位置量或速度量,通过前馈的方式加入到其他同步轴的控制器中。有文献描述的同步控制方法,将伺服误差经过转换环节加入到同步轴的力信号,从而达到同步控制的效果,是通过前馈方式实现的同步控制。这种方法虽然能提高同步性能,但运动控制系统不具有持续改进的能力,尤其对于具有重复运动轨迹的情况,控制系统不能针对轨迹特点而逐步提高同步性能。



技术实现要素:

本申请的主要目的在于提供一种用于同步控制的带有遗忘因子的迭代学习控制方法,可提高多轴运动系统之间的同步性能,加快迭代学习的收敛速度,提高控制算法的鲁棒性。

为实现上述目的,本申请实施例第一方面提供一种用于同步控制的带有遗忘因子的迭代学习控制方法,包括:

将多轴运动系统中任意一个运动系统设置为主动系统,剩余运动系统设置为从动系统;

采集所述主动系统和所述从动系统的位置输出量,以及所述从动系统的前两次的输入控制量;

利用所述主动系统和从动系统的位置输出量,以及所述从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

根据所述迭代学习律,迭代计算所述从动系统的最终输入控制量,所述最终输入控制量使得所述主动系统和所述从动系统的同步偏差的收敛速度和收敛域均满足预设要求;

按照所述从动系统的最终输入控制量,调整所述从动系统,以使所述从动系统与所述主动系统同步。

可选的,所述利用所述主动系统和从动系统的位置输出量,以及所述从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律包括:

利用所述主动系统和从动系统的位置输出量,得到所述主动系统和从动系统之间的同步偏差esync(t);

利用所述同步偏差esync(t)以及所述从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

其中,令ys(t)是从动系统位置输出量,ym(t)是主动系统位置输出量,β是同步系数,则esync(t)=βym(t)-ys(t)。

可选的,所述迭代学习律:

其中,为第k+1次迭代时所述从动系统的输入控制量,为第k次迭代时所述从动系统的输入控制量,为第k-1次迭代时所述从动系统的输入控制量,为第k次迭代时所述主动系统和所述从动系统之间的同步偏差的二阶导数,为第k次迭代时所述主动系统和所述从动系统之间的同步偏差的三阶导数,α为遗忘因子,0≤α<1,γ和为正常数。

可选的,所述从动系统的被控对象模型采用状态空间方法进行描述;

所述状态空间方法:

其中,a、b和c分别为所述从动系统的状态矩阵、输入矩阵和输出矩阵,xs(t)、us(t)和ys(t)分别为所述从动系统的状态变量、输入控制量和位置输出量,ds(t)为所述从动系统的输入扰动量。

可选的,所述从动系统的输入扰动量满足预设条件;

所述预设条件:

其中,分别为所述从动系统的期望初始状态和第k次迭代的初始状态,为所述从动系统的第k次迭代的输入扰动量,bx0和bd为正常数。

可选的,当采集不到所述从动系统的前两次的输入控制量时,将所述从动系统的前两次的输入控制量时设置为0。

可选的,利用所述从动系统和所述主动系统之间的同步偏差的平均值、平均差和最大值评估所述从动系统和所述主动系统之间的同步性能。

本申请实施例第二方面提供一种多轴运动系统的同步控制装置,包括:

设置模块,用于将多轴运动系统中任意一个运动系统设置为主动系统,剩余运动系统设置为从动系统;

采集模块,用于采集所述主动系统和所述从动系统的位置输出量,以及所述从动系统的前两次的输入控制量;

构造模块,用于利用所述主动系统和从动系统的位置输出量,以及所述从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

计算模块,用于根据所述迭代学习律,迭代计算所述从动系统的最终输入控制量,所述最终输入控制量使得所述主动系统和所述从动系统的同步偏差的收敛速度和收敛域均满足预设要求;

调整模块,用于按照所述从动系统的最终输入控制量,调整所述从动系统,以使所述从动系统与所述主动系统同步。

本申请实施例第三方面提供了一种电子设备,包括:

存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本申请实施例第一方面提供的用于同步控制的带有遗忘因子的迭代学习控制方法。

从上述本申请实施例可知,本申请提供的用于同步控制的带有遗忘因子的迭代学习控制方法具有以下有益效果:

1、对于多运动系统之间的同步控制问题,采用主动和从动的方式,用相应速度更快的系统作为从动系统,提高同步控制的控制效果。

2、用主动系统和从动系统的位置输出构造同步偏差,采用同步偏差的二阶导数和高阶导数,尤其适用于包括多重积分环节的高相对度被控对象。

3、对于从动系统,利用第k-1次控制量和第k次控制量和遗忘因子,计算第k+1次控制量,构造迭代学习律。相对于采用初始控制量和第k次控制量构造迭代学习律的方法,能够减小初始控制量选择不到对收敛域的影响。同时,由于引入了遗忘因子,能够加快收敛速度,提高控制算法的鲁棒性。

4、这种方法可以应用于半导体装备,尤其应用于对位移台性能要求极高的曝光设备等,能够进一步提高硅片台和掩模台之间的运动同步性能,改善晶圆的曝光效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法的流程示意图;

图2为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中迭代控制的原理框图;

图3为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中从动系统输入控制量随迭代次数的变化曲线的示意图;

图4为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中同步偏差的平均值随迭代次数的变化曲线的示意图;

图5为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中同步偏差的标准差随迭代次数的变化曲线的示意图;

图6为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中同步偏差的最大值随迭代次数的变化曲线的示意图;

图7为本申请一实施例提供的多轴运动系统的同步控制装置的结构示意图;

图8示出了一种电子设备的硬件结构示意图。

具体实施方式

为使得本申请的申请目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参阅图1和图2,图1为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法的流程示意图,图2为本申请一实施例提供的用于同步控制的带有遗忘因子的迭代学习控制方法中迭代控制的原理框图,该方法可以应用于半导体装备,尤其应用于对位移台性能要求极高的曝光设备等,能够进一步提高硅片台和掩模台之间的运动同步性能,改善晶圆的曝光效果,其方法主要包括以下步骤:

s101、将多轴运动系统中任意一个运动系统设置为主动系统,剩余运动系统设置为从动系统;

s102、采集该主动系统和该从动系统的位置输出量,以及该从动系统的前两次的输入控制量;

s103、利用该主动系统和从动系统的位置输出量,以及该从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

s104、根据该迭代学习律,迭代计算该从动系统的最终输入控制量,该最终输入控制量使得该主动系统和该从动系统的同步偏差的收敛速度和收敛域均满足预设要求;

s105、按照该从动系统的最终输入控制量,调整该从动系统,以使该从动系统与该主动系统同步。

在步骤s101中,优选的,还可以获取多轴运动系统中各运动系统的运行速度,将运行速度最低的运动系统设置为主动系统,剩余运动系统设置为从动系统,提高同步控制的控制效果。其中,主动系统的数量一般为一个,从动系统的数量一般可以为一个或者多个。本申请中,以从动系统的数量为1个进行示例性的说明。

其中,主动系统采用常规的反馈控制方法,例如pid控制、频率校正等。从动系统采用本申请提供的同步控制方法。

可理解的,在每次迭代时,都将得到的从动的系统的输入控制量进行保存,以供下次迭代进行使用。

在本实施例中,针对需要同步的多轴运动系统,设计主动系统和从动系统,利用从动系统跟踪主动系统的方式实现多轴同步控制。利用该主动系统和从动系统的位置输出量,以及该从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律,解决了被控对象高相对度的设计问题,提高了迭代收敛速度。对于运动具有重复性的应用场合,可以在多次迭代后不断提高多运动系统之间的同步性能,具有收敛速度快、鲁棒性强的优点。

在本申请其中一个实施例中,步骤s103包括:利用该主动系统和从动系统的位置输出量,得到该主动系统和从动系统之间的同步偏差esync(t);利用该同步偏差esync(t)以及该从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

其中,令ys(t)是从动系统位置输出量,ym(t)是主动系统位置输出量,β是同步系数,则esync(t)=βym(t)-ys(t)。

其中,同步系数β由主动系统和从动系统的位置或速度倍率关系决定。

可理解的,每次计算得到的同步偏差都可以进行保存,以供下次迭代进行使用。

在本申请其中一个实施例中,请参阅图2,该迭代学习律:

其中,为第k+1次迭代时该从动系统的输入控制量,为第k次迭代时该从动系统的输入控制量,为第k-1次迭代时该从动系统的输入控制量,为第k次迭代时该主动系统和该从动系统之间的同步偏差的二阶导数,为第k次迭代时该主动系统和该从动系统之间的同步偏差的三阶导数,α为遗忘因子,0≤α<1,γ和为正常数。

可理解的,在迭代过程中,通过不断调整α、γ和的数值,直到主动系统和从动系统之间的同步偏差的收敛速度和收敛域都满足预设要求,即根据该迭代学习律,得到的为从动系统的最终输入控制量,该最终输入量可使得从动系统与主动系统同步。

在本实施例中,对于从动系统,利用第k-1次控制量和第k次控制量和遗忘因子,计算第k+1次控制量,构造迭代学习律。相对于采用初始控制量和第k次控制量构造迭代学习律的方法,能够减小初始控制量选择不到对收敛域的影响。同时,采用同步偏差的二阶导数和高阶导数,尤其适用于包括多重积分环节的高相对度被控对象。同时,由于引入了遗忘因子,能够加快同步偏差的收敛速度,提高控制算法的鲁棒性。

在本申请其中一个实施例中,该从动系统的被控对象模型采用状态空间方法进行描述;

该状态空间方法:

其中,a、b和c分别为该从动系统的状态矩阵、输入矩阵和输出矩阵,xs(t)、us(t)和ys(t)分别为该从动系统的状态变量、输入控制量和位置输出量,ds(t)为该从动系统的输入扰动量。

在本申请其中一个实施例中,该从动系统的输入扰动量满足预设条件;

该预设条件:

其中,分别为该从动系统的期望初始状态和第k次迭代的初始状态,为该从动系统的第k次迭代的输入扰动量,bx0和bd为正常数。

在本申请其中一个实施例中,当采集不到该从动系统的前两次的输入控制量时,将该从动系统的前两次的输入控制量时设置为0。

可理解的,也即在多轴运动系统的初始状态时,设置从动系统的初始输入控制量为0,即

在本申请其中一个实施例中,利用该从动系统和该主动系统之间的同步偏差的平均值、平均差和最大值评估该从动系统和该主动系统之间的同步性能。

请参阅图4、图5、图6,具体的,mean为该同步偏差的平均值,std为该同步偏差的平均差,则:

请参阅图7,图7是本申请一实施例提供的多轴运动系统的同步控制装置的结构示意图,该装置可内置于电子设备中,该装置主要包括:

设置模块201,用于将多轴运动系统中任意一个运动系统设置为主动系统,剩余运动系统设置为从动系统;

采集模块202,用于采集该主动系统和该从动系统的位置输出量,以及该从动系统的前两次的输入控制量;

构造模块203,用于利用该主动系统和从动系统的位置输出量,以及该从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

计算模块204,用于根据该迭代学习律,迭代计算该从动系统的最终输入控制量,该最终输入控制量使得该主动系统和该从动系统的同步偏差的收敛速度和收敛域均满足预设要求;

调整模块205,用于按照该从动系统的最终输入控制量,调整该从动系统,以使该从动系统与该主动系统同步。

在本申请其中一个实施例中,该构造模块203包括:

第一构造模块,用于利用该主动系统和从动系统的位置输出量,得到该主动系统和从动系统之间的同步偏差esync(t);

第二构造模块,用于利用该同步偏差esync(t)以及该从动系统的前两次的输入控制量,以及预设的遗忘因子,构造迭代学习律;

其中,令ys(t)是从动系统位置输出量,ym(t)是主动系统位置输出量,β是同步系数,则esync(t)=βym(t)-ys(t)。

在本申请其中一个实施例中,该迭代学习律:

其中,为第k+1次迭代时该从动系统的输入控制量,为第k次迭代时该从动系统的输入控制量,为第k-1次迭代时该从动系统的输入控制量,为第k次迭代时该主动系统和该从动系统之间的同步偏差的二阶导数,为第k次迭代时该主动系统和该从动系统之间的同步偏差的三阶导数,α为遗忘因子,0≤α<1,γ和为正常数。

在本申请其中一个实施例中,该从动系统的被控对象模型采用状态空间方法进行描述;

该状态空间方法:

其中,a、b和c分别为该从动系统的状态矩阵、输入矩阵和输出矩阵,xs(t)、us(t)和ys(t)分别为该从动系统的状态变量、输入控制量和位置输出量,ds(t)为该从动系统的输入扰动量。

在本申请其中一个实施例中,其特征在于,该从动系统的输入扰动量满足预设条件;

该预设条件:

其中,分别为该从动系统的期望初始状态和第k次迭代的初始状态,为该从动系统的第k次迭代的输入扰动量,bx0和bd为正常数。

在本申请其中一个实施例中,当采集不到该从动系统的前两次的输入控制量时,将该从动系统的前两次的输入控制量时设置为0。

在本申请其中一个实施例中,利用该从动系统和该主动系统之间的同步偏差的平均值、平均差和最大值评估该从动系统和该主动系统之间的同步性能。

请参见图8,图8示出了一种电子设备的硬件结构图。

本实施例中所描述的电子设备,包括:

存储器41、处理器42及存储在存储器41上并可在处理器上运行的计算机程序,处理器执行该程序时实现前述图1所示实施例中描述的用于同步控制的带有遗忘因子的迭代学习控制方法。

进一步地,该电子设备还包括:

至少一个输入设备43;至少一个输出设备44。

上述存储器41、处理器42输入设备43和输出设备44通过总线45连接。

存储器41可以是高速随机存取记忆体,用于存储一组可执行程序代码,以及迭代学习算法各次迭代的控制量。处理器42与存储器41耦合,对运动控制算法进行实时计算,输入设备43用于采集被控主动系统和从动系统的各个物理量,输出设备44用于输出处理器42计算得到的控制量。

需要说明的是,在本公开各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的一种电子设备的用于同步控制的带有遗忘因子的迭代学习控制方法的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1