用于贵金属检测多工序并行机车间的调度方法及装置

文档序号:41231967发布日期:2025-03-14 12:00阅读:19来源:国知局
用于贵金属检测多工序并行机车间的调度方法及装置

本发明属于贵金属合金检测多工序并行机车间调度,具体涉及一种用于贵金属检测多工序并行机车间的调度方法、以及用于金属检测多工序并行机车间的调度装置。


背景技术:

1、我国制造业正在加快向智能化、自动化方向转型,尤其在新材料和智能制造领域,提升技术创新能力和生产效率成为国家战略的重要组成部分。贵金属合金作为关键高科技材料,广泛应用于航空航天、电子、医疗等领域,其质量要求极高。然而,贵金属合金的检测过程由于涉及多个复杂步骤和高精度的要求,面临诸多挑战。

2、贵金属合金的检测通常包括成分分析、物理性能测试、结构检测等多个环节,这些检测步骤不仅多且复杂,还需在严格控制的环境下完成,才能确保检测结果的准确性和一致性。此外,贵金属检测涉及到高精密仪器设备的使用,操作过程繁琐,数据处理复杂,任何微小的误差都会对最终的检测结果产生重大影响。因此,在检测流程中,各步骤的衔接和协调至关重要。如何确保每个步骤在最优条件下进行,并减少因检测步骤复杂性所带来的效率低下问题,已成为贵金属合金检测中的核心难题。

3、传统的贵金属检测方式多为手动或半自动化,容易导致检测周期长、效率低、出错率高等问题。面对这些挑战,亟需一种高效、精确的调度方法,能够在保持高检测精度的前提下简化流程,提升检测效率,确保检测设备和资源的合理分配。


技术实现思路

1、本发明所要解决的主要技术问题在于,克服现有技术存在的上述缺陷,而提供一种用于贵金属检测多工序并行机车间的调度方法及装置,从而提升调度效率和精确度。

2、本发明解决其技术问题所采用的技术方案是:

3、根据本公开的一个方面,提供了一种用于贵金属检测多工序并行机车间的调度方法,包括以下步骤:

4、s1:基于贵金属合金检测的分析方法、分析步骤及相应的检测仪器与设备,以最小化最大完工时间为优化目标,构建贵金属检测多工序并行机车间调度问题的数学模型,并确定数学模型的约束条件;

5、s2:求解数学模型,得到数学模型的优质调度方案;

6、其中,s2中所述求解数学模型,包括:

7、s2.1:初始化种群:包括确定检测分析步骤顺序;确定各分析步骤选择的检测仪器与设备;确定检测完工时间;设置参数,包括种群规模、最大迭代次数、q表、变邻域局部搜索次数;

8、s2.2:种群划分:将种群划分为两个规模相同的第一子种群pop1和第二子种群pop2,其中,pop1注重于探索,pop2注重于挖掘;

9、s2.3:对pop1执行探索操作:根据个体目标函数值计算pop1中每个个体的适应度值并将最优个体存入外部记忆池,采用轮盘赌的方式选择出pop1中的两个个体作为父代个体执行进化操作;

10、s2.4:对pop2执行挖掘操作:根据个体目标函数值计算pop2中每个个体的适应度值并采用轮盘赌的方式选择pop2的两个个体作为父代个体执行基于均匀交叉的挖掘操作;

11、s2.5:种群更新:分别对种群pop1和pop2采用贪婪策略更新种群,更新完成后将pop1和pop2合并成为新种群newpop;

12、s2.6:对优质个体执行基于q-learning的变邻域搜索:通过基于q-learning的变邻域搜索算法,对优质个体执行扰动操作并生成扰动解,随后利用多种邻域结构进行局部搜索,在找到更优解时动态更新解;

13、s2.7:更新q表:根据s2.6执行的动作更新环境中的状态,同时根据输出新解与初始解的优劣关系,计算环境的奖励值并根据奖励值更新q表;

14、s2.7:判断是否满足迭代终止条件,若是,则输出贵金属合金检测多工序并行机车间调度问题模型的优质调度方案,否则跳转至s2.2。

15、在本公开的一个实施例中,所述s1中构建贵金属检测多工序并行机车间调度问题的数学模型,包括:

16、贵金属检测多工序并行机调度问题描述如下:n个待检测的贵金属样品a1,a2,...,an需要由m台仪器与设备m1,m2,...,mm进行检测,每个样品包含qi(i=1,2,...,n)道检测方法,每个检测方法由oj,(j=1,2,…,|qi|)步检测与分析步骤组成,其中,|qi|表示检测方法qi的检测分析步骤总数;

17、令o为所有待检测贵金属样品的检测步骤总数,π=[π1,π2,...,πo]为待检测方法基于检测分析步骤的排列,该排列决定了样品检测方法分配到具体可检测设备上的顺序;

18、令ok为设备mk上的检测步骤总数,k=1,2,...,m,设备mk上所检测方法基于检测分析步骤的排列;为检测分析步骤的处理时间,为检测分析步骤的开始加工时间,为前一道检测分析步骤所使用的设备,为前一道检测工序在所使用设备上的位置,其中,o=1,2,...,ok;

19、若则表示为首次检测;若则表示为机器mk上的首道检测分析步骤;

20、贵金属检测多工序并行机调度问题的目标函数为:

21、

22、其中,公式(1)和公式(2)为计算序列π对应的最大完工时间,公式(3)和公式(4)表示在所有序列集合π中找到最优排序π*,使得cmax(π)最小。

23、在本公开的一个实施例中,在s1中,约束条件包括:

24、1)任一仪器设备在0时刻均可用;

25、2)任一贵金属样品均可在0时刻安排检测;

26、3)每个检测分析步骤可以由至少一台仪器设备完成;

27、4)检测分析步骤一旦开始不允许中断;

28、5)每台仪器设备同一时刻只能进行一道检测分析步骤;

29、6)贵金属样品同一时刻只能进行一道检测步骤;

30、在本公开的一个实施例中,s2.3、s2.4依据公式(5)-(6)进行父代个体的选择,包括:

31、

32、其中,cmax(πi)为子种群中第i个个体πi所对应的最大完工时间,为子种群所有个体中最大的完工时间,popsize为种群规模,fitnessi为种群中索引为i的个体的适应度值,pi为子种群中第i个个体被选择成为父代个体的概率;公式(4)表示计算每个个体的适应度值,公式(5)表示计算每个个体被选择的概率。

33、在本公开的一个实施例中,在s2.5中,采用贪婪策略更新子种群已经合并子种群完成种群更新,包括:

34、

35、newpop=pop1∪pop2(9)

36、其中,πi为种群中第i个个体,πi'为πi经过交叉变异生成的子代个体,cmax(πi)和cmax(πi')分别代表πi和πi'所对应的最大完工时间;式(7)-(8)表示若新解πi'的完工时间不劣于旧解,则将旧解替换为新解,否则保留旧解;式(9)表示通过将pop1和pop2合并得到新种群newpop进入下次迭代。

37、在本公开的一个实施例中,在s2.6中的基于q-learning的变邻域搜索,包括:

38、根据适应度选择一定比例的个体作为优质个体执行局部搜索操作,根据当前环境中q表所确定的状态选择对应扰动策略动作,对优质个体进行相应的扰动操作以生成扰动解,扰动策略包括三种:交换、翻和插入;

39、其中,对于生成的扰动解,执行变邻域局部搜索,从第一种邻域结构开始对扰动解进行局部搜索操作,直到找到改进的解或者达到预定次数,在每次搜索时,根据不同的邻域结构选择对应的局部搜索策略,在找到更优解时,更新当前解并停止局部搜索,若当前改进的解优于初始的优质解,则将该解替换初始解,否则继续执行扰动和变邻域操作;

40、在q-learning算法中,状态和动作都表示局部搜索策略,状态与动作的数量均等于局部搜索策略数量,通过当前所使用的局部搜索策略判断当前所处的状态,在当前状态下通过ε-贪婪策略在q表中选择相应的执行动作;

41、

42、其中,a表示采用的动作,q(st,at)表示在当前状态st下采取动作at的q值,arg{q(st,at)}→max表示求使得q值最大的动作;rand表示0-1之间满足正态分布的随机数,ε表示一个很小的正数。

43、在本公开的一个实施例中,所述s2.6中的扰动算子以及变邻域搜索操作算子,包括:

44、对于个体执行的扰动策略的搜索操作包括shake 1-shake 3:

45、shake 1:在检测序列中,随机选择两个不同的检测分析步骤位置,并对此两个位置的检测分析步骤进行交换操作;

46、shake2:在检测序列中,随机选择两个不同的检测分析步骤位置;若第一个选择的位置为序列的首位,则将第二个位置的步骤调整至序列首位,且保留其余步骤的相对顺序不变;若第一个位置不在首位,则首先保留该位置之前的步骤顺序,将第二个位置的步骤插入该位置之前,同时重新排列两个选择位置之间的步骤,之后保持剩余部分顺序不变;

47、shake 3:在检测序列中,随机选择两个不同的检测分析步骤位置,并将这两个位置之间的所有步骤进行翻转操作,使得这一区间内的步骤顺序逆转执行;

48、对于扰动后生成的解执行的变邻域局部搜索操作为ns1-6:

49、ns1:以扰动后的解为扰动解,通过插入操作生成一个新解;比较新解与扰动解的完工时间,若新解优于扰动解,则保留新解并舍弃扰动解;若插入操作未能找到更优解,则继续执行交换操作,生成另一新解并再次与当前解进行比较,最终输出在此过程中找到的最优解;

50、ns2:从扰动解开始,首先进行交换操作以生成新解,并将其与原扰动解的完工时间进行比较,若交换操作生成的解优于原解,则保留新解;否则,执行插入操作,生成新的解并与旧解进行比较,最终输出经过交换和插入操作后的最优解;

51、ns3:首先通过交换操作生成一个新解,并与原扰动解的完工时间进行比较,若新解表现优于原扰动解,则保留新解;若交换操作未能改善解的质量,则进一步执行翻转操作,生成新解并与当前解进行比较,最后选择最优解作为输出;

52、ns4:以扰动后的解为起点,首先进行插入操作并生成新解,比较其与扰动解的完工时间,若新解优于扰动解,则更新解;若未能产生改进,则执行翻转操作,生成新的解并比较两者性能,最终输出最优解;

53、ns5:从扰动解开始,先进行翻转操作并生成一个新解,随后比较其与扰动解的完工时间。如果新解表现更优,则进行更新。若未找到更优解,则执行交换操作,同样生成新解并与当前解比较,最后输出最优解。

54、ns6:首先通过翻转操作生成新解,并与扰动后的解比较完工时间。如果翻转操作生成的解更优,则保留;若无改进,则继续执行插入操作,生成并比较新的解,最终选择最优解进行输出。

55、在本公开的一个实施例中,在s2.7中的计算执行动作后的奖励值并更新q表,具体操作为:

56、在对初始解执行基于q-learning的变邻域局部搜索后,根据式(11)将初始解与新解对比从而计算该动作所获得的奖励值,随后根据式(12)更新相应的q(st,at)值;

57、

58、

59、其中,rewardt表示智能体在状态st下执行动作at所获得的奖励值,cmax(πi)和cmax(πi')分别表示πi和πi'及其执行变邻域搜索后得到的解的最大完工时间;q(st,at)表示状态下st执行动作at的q值,a表示学习率,g表示折扣因子,表示状态st+1下执行所有动作中所获得的最大q值,a表示动作集。

60、根据本公开的另一个方面,本公开还提供了一种用于贵金属检测多工序并行机车间的调度装置,包括:

61、模型构建模块,用于基于贵金属合金检测的分析方法、分析步骤及相应的检测仪器与设备,以最小化最大完工时间为优化目标,构建贵金属检测多工序并行机车间调度问题的数学模型,并确定数学模型的约束条件;

62、模型求解模块,用于求解数学模型,得到数学模型的优质调度方案;

63、模型求解模块包括:参数初始化模块、种群划分模块、种群探索模块、种群挖掘模块、种群更新模块、变邻域搜索模块、q表更新模块、迭代更新模块,其中,

64、参数初始化模块,用于初始化种群:包括确定检测分析步骤顺序;确定各分析步骤选择的检测仪器与设备;确定检测完工时间;设置参数,包括种群规模、最大迭代次数、q表、变邻域局部搜索次数;

65、种群划分模块,用于将种群划分为两个规模相同的第一子种群pop1和第二子种群pop2,其中,pop1注重于探索,pop2注重于挖掘;

66、种群探索模块,用于对pop1执行探索操作:根据个体目标函数值计算pop1中每个个体的适应度值并将最优个体存入外部记忆池,采用轮盘赌的方式选择出pop1中的两个个体作为父代个体执行进化操作;

67、种群挖掘模块,用于对pop2执行挖掘操作:根据个体目标函数值计算pop2中每个个体的适应度值并采用轮盘赌的方式选择pop2的两个个体作为父代个体执行基于均匀交叉的挖掘操作;

68、种群更新模块,用于种群更新:分别对种群pop1和pop2采用贪婪策略更新种群,更新完成后将pop1和pop2合并成为新种群newpop;

69、变邻域搜索模块,用于对优质个体执行基于q-learning的变邻域搜索:通过基于q-learning的变邻域搜索算法,对优质个体执行扰动操作并生成扰动解,随后利用多种邻域结构进行局部搜索,在找到更优解时动态更新解;

70、q表更新模块,用于更新q表:根据s2.6执行的动作更新环境中的状态,同时根据输出新解与初始解的优劣关系,计算环境的奖励值并根据奖励值更新q表;

71、迭代更新模块,用于判断是否满足迭代终止条件,若是,则输出贵金属合金检测多工序并行机车间调度问题模型的优质调度方案,否则跳转至种群划分模块再次迭代。

72、本发明的有益效果是,通过优化检测流程中的步骤衔接和资源分配,结合智能化的调度算法,实现对多个并行检测设备的有效调度,旨在提高贵金属检测的整体效率和准确性。采用适当的建模方法对贵金属检测过程中的多工序进行动态调度,通过基于q-learning的双种群变邻域搜索算法求解调度问题,能够避免现有方法中存在的效率低、容易出错等问题。该方法可以有效缩短检测时间、提升检测设备的利用率,并确保在复杂工序中实现精准的结果输出。通过本发明的调度方法,贵金属检测车间的资源调度更加灵活,生产效率和检测质量得到显著提升,满足了高科技制造业对贵金属合金检测的严格要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1