本发明属于半导体生产调度与控制
技术领域:
,涉及一种用于半导体生产线过程中并行批处理机动态调度的快速评估方法。
背景技术:
:近年来由于复杂半导体制造系统市场产品定制化需求,呈现多品种、小批量生产的特点。批处理机普遍存在于晶圆制造环节中的扩散区和氧化区,同时由于批量加工消耗时间长,常常成为制约整个系统性能的瓶颈工序。因此,实际生产中有效而快速地给出调度决策方案,将会提升系统性能并扩大产能。根据分解思想将复杂大规模问题划分为若干容易解决的子问题,但这些处在不同层次的子问题之间存在着强耦合关系,通常上层决策作为下层决策的基础,反过来下层最优决策指导上层决策不断调整。利用进化算法搜索最优调度解的过程中,由于消耗时间长且容易收敛“早熟”而不能简单地嵌套使用。为了加快搜索进程,采用代理模型技术估计评价大部分解的性能指标,代替费时的真实评价过程,这样采用粗评价与精准评价相结合的方式,促进了进化算法快速决策调度方案在实际生产中的应用。基于模型简化思想,Tsung-CheChiang在2013年发表的一篇综述性文章“Enhancingrule-basedschedulinginwaferfabricationfacilitiesbyevolutionaryalgorithms:Reviewandopportunity”中提出了几种调度模型简化求解方式。一种为通过识别机器或阶段的瓶颈指标,减少其在仿真模型的数量,从而达到缩短仿真时间的目的;另一种为通过构建计算代价小的代理模型,取代真实耗时的仿真模型,简化调度性能评价过程。本发明便是沿着后者的思路,从改进调度方案求解方法的角度,在保证较高的解质量前提下,大大降低了进化算法评价环节的计算代价。运用进化算法获取复杂半导体制造系统最优调度方案中存在如下问题:(1)进化算法搜索过程中需要大量的适应值评价,计算代价大的问题往往成为制约进化算法充分搜索的瓶颈,考虑降低评价复杂度或减少评价次数。(2)由于分层递阶调度子问题存在相互影响的耦合关系,直接嵌套使用进化算法会造成时间上的不可行性。本发明重点在于处有效地处理评价模型复杂度与时间合理性之间的平衡关系。技术实现要素:本发明公开一种半导体制造系统中并行批处理机动态调度的快速评估方法。首先基于复杂问题分解思想将批处理机调度问题分成为批形成和批调度两阶段子问题分别进行求解;其次动态到达工件根据设计的优先级规则确定其加工紧急程度并完成组批之后,采用基于一种新编码机制的共生演化算法迭代搜索上层批工件分配到并行机的方案,同时确定下层每台加工机器上的最优排序。再次,根据提取的关键调度特征值,离线训练具有预估能力的代理模型,利用预测估计值快速评价下层子问题的调度性能,指导上层子问题不断优化调整。最后,采用估计评价与真实重评价相结合的策略,在线更新代理模型,保持预测精度,实现合理时间范围内机器分配与批工件排序同步优化的目的。利用本发明能够快速有效地获取解质量良好的批处理机调度方案,不仅降低了拖期时间指标,而且提高了半导体生产线的整体性能。为了达到上述目的,本发明采用了以下技术方案。一种用于半导体生产线中动态批调度方案的快速评估方法,其特征在于,该方法包含以下步骤:步骤1确定组批方案;步骤2设计批调度编解码方案;步骤3共生演化计算操作;步骤4适应值快速评价;上述方法中各个步骤的详细操作过程如下:步骤1,确定组批方案。对于属于不同类型fj,到达加工设备缓冲区时间rj的加工工件,采用基于ATC规则的滚动窗策略(t,t+T)动态地计算时间窗口内未被安排组批工件的加工优先级。T为滚动时间窗口固定时间间隔。在设备空闲的决策t时刻,确定工件是否立即进行组批的紧急程度,即优先级Ij(t)。式中,wj为订单客户权重系数,pj为工件j的加工时间,dj为工件j的拖期时间,rj为工件的释放时间,μ为前瞻系数,为平均加工时间。Ij(t)为每个工件j在决策t时刻,通过上述公式计算得到的优先级,优先级高的工件率先进入组批流程,依据以下原则形成满批或部分批工件。步骤2,设计批调度编解码方案。解的编码构造表示为批工件分配到各台设备上的情况。为维持负载平衡,需控制每台设备上所分配的批工件数量基本保持相同。对于生产线上具有n个工件,m台加工设备,使用式(3)确定分隔区间,划分哪些工件属于其对应设备,属于编码区间内的批工件将派送到对应机器设备Mj上,结果仅为分配情况,并不代表最终加工顺序。式(3)中P0为划分起始点,后一个划分点Pi+1在前一个Pi基础上计算得到。共生演化算法的初始种群根据式子pop=rand(1,batchnum)(ub-lb)+lb随机产生,其中,batchnum为批工件数量;ub和lb为实数范围上限和下限。实数编码不能直接应用于离散优化问题,需进行映射变换为离散值。对于一个调度解X=[x1,x2,…,xn],其中xi为随机值。首先按照降序排列标定位置顺序其中为xi按降序排列后序列标号。而最终的批工件加工顺序将由式(4)得出:式(4)中为工件对应的机器编号,θ取值为[1,batchnum]不重复的整数值。步骤3,共生演化计算操作。共生演化算法模仿自然界生物之间的交互关系,包含了三个阶段:互惠、共栖和寄生。该算法具有控制参数少,收敛速度快的优点。下面分别阐述不同阶段的具体操作过程:步骤3.1,互惠阶段。此阶段为个体双方互为所用,互得其利。随机从种群中选择两个体xi和xj,根据式(5)、(6)操作得到新个体。xinew=xi+rand(0,1)×(xbest-Mv×Bf1)(5)xjnew=xj+rand(0,1)×(xbest-Mv×Bf1)(6)式中,Mv=(xi+xj)/2为两个体之间的交互向量,xbest为当前最优个体。Bf1和Bf2为收益系数,一般设置为1或者2。步骤3.2,共栖阶段。此阶段为个体一方获利,个体的另一方从交互关系中既不获利也不受害。xinew=xi+rand(0,1)×(xbest-xj)(7)步骤3.3,寄生阶段。此阶段为个体一方以牺牲另一方代价获得生存空间。采用贪婪策略,随机选择个体xi,如果适应度值优于个体xj,则将其替代。保持生物种群的优越性。步骤4,适应值快速评价。利用代理模型计算代价小的优点,降低每次评价的复杂度,加快其搜索进程,将预测估计值取代昂贵的真实评价值。运用代理模型到实际应用应该包含模型的建立,训练数据的准备,模型的选取,适应值预估及重评价,以及模型在线更新等若干步骤。步骤4.1,代理模型构建。代理模型基于提取的关键调度特征而建立,为了确保模型估计的准确性,所选特征应能够反映此时生产线调度的状态信息,其中包括工件等待时间、加权加工时间、等待工件数量、拖期工件数目、候选工件拖期等。代理模型训练过程基于历史数据D={Xi,yi}进行有监督式学习,其中Xi为特征集合,yi为对应调度性能目标值。随机采样遵循拉丁方实验设计方案,每个解xi由n个值组成,随机从分布在区间(0,1/n),(1/n,2/n),…,(1-1/n,1)之中采样本点。依据问题规模大小生成不同数量的训练数据集。步骤4.2,代理模型选择。代理模型按方法可分类成基于距离,机器学习和统计学习方法,可以采取神经网络、支持向量机,多元线性回归等预测技术。评价模型的好坏可依据下面两个准则:(1)相对误差(2)决定系数相对误差e(x)反映了预测值与真实值之间的差异,值越小越好;决定系数R2表明模型是否具有良好的拟合能力,其值越接近1越好。如果e(x)≤5%并且R2≥0.8说明构建的代理模型可以与进化算法进行结合。最终选择效果最好的预测模型作为代理模型。步骤4.3,适应值预估与重评价。在每次选择阶段中,所选代理模型根据解的特征进行适应值评估工作,并与旧解比较。为了防止代理模型预测误差导致搜索方向的错误,每次迭代循环后对若干个最优估计解进行重新地真实评价,确定当前最优解并更新。重评价过程如下:步骤4.3.1,从当前种群中,选择估计评价值前三位调度解个体{x1,x2,x3}.步骤4.3.2,比较所选估计解与历史最优解大小。若所选估计解之中存在优于历史最优解fglobal的情况,则重新真实评价后再比较;否则直接跳到下一代循环中。步骤4.3.3,如果局部最优解的性能优于全局最优解,将作为新的全局最优解,应用于之后迭代中。记录最优解及其最优值。步骤4.4,代理模型在线更新。随着迭代不断进行,代理模型需要在线更新保持优秀的预估能力。每代选择前10%优秀个体组成候选解集合,然后每隔10代更新一次种群,并且基于新种群在线更新模型。附图说明图1为并行批处理机调度工作流程图;图2为并行批处理机调度分解求解框架;图3为组批策略流程图;图4为解的编码结构示意图;图5为批处理机调度整体方案求解算法流程图;图6为真实值-预测值对比图;图7为几种不同对比算法收敛图;具体实施方式下面内容结合附图对本发明进行详细阐述。1.问题模型参数设定;1.1.生产线基本信息属性:工件类型f;工件数量n;设备数量m,批最大容量B。1.2.工件动态特征属性:工件到达紧密程度控制参数η;工件加工处理时间p,工件拖期时间d;工件权重w。具体仿真实验中,参数设置见下表所示:2.代理模型建立与选择;2.1我们根据问题规模采用拉丁方采样方式随机采样了400组训练数据,用于建立模型。当训练数据获得之后,采用交叉验证的方法将数据均匀随机分成5份,将其中1份作为测试数据,其余作为训练数据来训练模型。这样依次将5份分别作为测试数据重复上述过程,最后将平均性能结果返回作为模型的最终评判标准。2.2本发明中选择支持向量回归机,径向基神经网络和多元线性回归作为代理模型的候选集合。经过独立运行20次训练后得到几种模型的平均性能如下表所示;训练数据和测试数据的预测值与真实值的对比结果如图6所示:2.3从表中模型判别准则可以看出几种模型均符合作为代理模型的条件,而其中支持向量机性能更加优越,因此被选择为本发明问题的代理模型,适用于评估适应值大小。模型判别准则支持向量回归机径向基神经网络多元线性回归训练相对误差2.2%2.87%2.83%测试相对误差2.64%2.92%2.91%模型决定系数0.96000.95030.95083.算法对比结果;对比实验方法选取以下几种主流求解算法:启发式算法ATC-BATC规则,遗传算法GA和差分进化算法DE。实验独立运行10次取平均值,结果如下表所示:与现有技术相比,本发明具有下面的优良效果。将融合代理模型的共生演化算法与几种常见批调度算法进行调度性能上的对比,可以明显发现所提出的算法SOS-SM可以获得性能更好的调度解,结合代理模型进行快速评价的策略加强了进化算法搜索能力,而且一次评价所需消耗的时间远远低于真实评价过程,估计评价仅仅不到真实评价所消耗时间的1%。这样对于需要大量适应值评价过程的进化过程,无疑提高了搜索的效率,同时配合真实重新评价策略,保证了获取高质量解的可行性和通用性。当前第1页1 2 3